style=»max-height: 50vh;»>
Оценочная деятельность в арбитражном и гражданском процессе: Учебное пособие
С тех пор как наше государство сменило экономическую модель на рыночную, у российского общества появилась новая — частная форма собственности. Сегодня мы можем говорить о сложившемся конкурентном и динамичном рынке оценочных услуг.
style=»max-height: 50vh;»>
5.3. Порядок оценки акций и долей в корпоративных спорах
Оценочная деятельность в отношении рассматриваемых объектов — акций и долей — осуществляется на основании законодательства Российской Федерации об оценочной деятельности и в соответствии с положениями ФСО N 8 «Оценка бизнеса» . Поскольку ФСО N 8 содержит специальные нормы, касающиеся порядка проведения оценки конкретного объекта, то они обладают приоритетом перед общими нормами ФСО N 1, ФСО N 2, ФСО N 3 . Вместе с тем закон обладает большей юридической силой, нежели стандарт оценки, в связи с этим ФСО должен соответствовать Закону об оценочной деятельности и не допускать возникновения коллизий. При рассмотрении корпоративных споров в арбитражных судах России оценщики применяют положения названного выше Стандарта оценки, а в случае привлечения в качестве эксперта также положения Закона о судебно-экспертной деятельности.
Доходный метод оценки FCFF и терминальная стоимость
———————————
ФСО N 8, утв. Приказом Минэкономразвития России от 1 июня 2015 г. N 326 «Об утверждении Федерального стандарта оценки «Оценка бизнеса (ФСО N 8)».
Пункт 14 ФСО N 8, утв. Приказом Минэкономразвития России от 1 июня 2015 г. N 326 «Об утверждении Федерального стандарта оценки «Оценка бизнеса (ФСО N 8)».
Объектами оценки в соответствии с ФСО N 8, помимо акций и долей, являются также паи в паевых фондах производственных кооперативов. Имущественный комплекс организации или его часть как обособленное имущество действующего бизнеса также оцениваются по правилам, установленным данным Стандартом.
Оценочная деятельность начинается с составления задания на оценку, которое выступает неотъемлемой частью договора на проведение оценки. По общему правилу, установленному в п. 21 ФСО N 1, задание на оценку содержит информацию о целях оценки, дате оценки, об объекте оценки, правах на данный объект, имеющих значение для определения стоимости, предполагаемом использовании результатов оценки, о виде стоимости, о допущениях. Вместе с тем п. 22 указанного Стандарта закрепляет возможность установления дополнительных требований к заданию на оценку в специализированных ФСО.
Так, ФСО N 8 закрепляет дополнительные требования к заданию на оценку акций и долей. Во-первых, требует уточнения графа «данные об объекте оценки». При оценке акций необходимо указать их количество, категорию (тип), номер и дату государственной регистрации выпуска акций. Оценка долей требует дополнительного указания размера оцениваемой доли.
Во-вторых, особые требования выдвигаются к указанию наименования организации, чьи акции или доли подлежат оценке. Так, прописывается полное и сокращенное фирменное наименование организации (включая организационно-правовую форму), ее место нахождения, основной государственный регистрационный номер (ОГРН).
Мероприятия по претворению в жизнь задания на оценку начинаются с этапа сбора и анализа информации об объекте оценки. Независимый оценщик вправе брать информацию из любых доступных источников, главное, в достаточном для идентификации объекта объеме. Специфика оцениваемых объектов предопределила включение в ФСО особых требований, касающихся объема информации об оцениваемом объекте.
Независимый оценщик должен указать в отчете, а значит, и обратить особенное внимание на этапе сбора информации на следующие характеристики:
1) информацию о структуре уставного (складочного) капитала организации, ведущей бизнес. При этом если объектом оценки выступают акции, то оценщику следует проанализировать и впоследствии отразить в отчете информацию:
— о номинальной стоимости и количестве размещенных и голосующих обыкновенных акций;
— о номинальной стоимости и количестве голосующих и неголосующих привилегированных акций.
При оценке долей в уставном (складочном) капитале указывается размер уставного капитала и количество и номинальная стоимость долей;
2) информацию о структуре распределения уставного (складочного) капитала организации. Указанная структура должна соответствовать временному и субъектному критериям. Временной критерий предполагает необходимость указания структуры распределения уставного (складочного) капитала именно на дату оценки. Субъектный критерий подразумевает отражение структуры распределения между акционерами, владеющими более 5% акций или участниками общества с ограниченной ответственностью;
3) информацию о правах, предусмотренных учредительными документами организации, ведущей бизнес, в отношении владельцев обыкновенных и привилегированных акций, долей в уставном (складочном) капитале;
4) информацию о распределении прибыли организации, ведущей бизнес. При оценке стоимости акций — это информация о дивидендной истории (дивидендных выплатах) организации за репрезентативный период, при оценке долей в уставном (складочном) капитале — о размере части прибыли организации, распределяемой между участниками организации;
5) сведения о наличии и условиях корпоративного договора в случае если такой договор определяет объем правомочий участника акционерного общества, общества с ограниченной ответственностью, отличный от объема правомочий, присущих его доле согласно законодательству.
Поскольку приведенные выше сведения могут оказать значительное влияние на конечный результат оценки, их учет на стадии сбора и анализа информации крайне важен. Отсутствие указанных данных в отчете об оценке является нарушением стандарта оценки и позволяет говорить о недостоверности подготовленного отчета.
Помимо приведенной информации об объекте оценки оценщиком также должны быть учтены сведения о развитии отрасли, в которой функционирует организация, в целом. В зависимости от целей проведения оценки оценщик также анализирует и отражает в отчете:
1) информацию о создании и развитии бизнеса, условиях функционирования организации, ведущей бизнес;
2) информацию о выпускаемой продукции (товарах) и (или) выполняемых работах, оказываемых услугах, информацию о результатах производственно-хозяйственной деятельности за репрезентативный период (под репрезентативным периодом понимается период, на основе анализа которого возможно сделать вывод о наиболее вероятном характере будущих показателей деятельности организации);
3) финансовую информацию, включая годовую и промежуточную (в случае необходимости) финансовую (бухгалтерскую) отчетность организации, ведущей бизнес, информацию о результатах финансово-хозяйственной деятельности за репрезентативный период;
4) прогнозные данные, включая бюджеты, бизнес-планы и иные внутренние документы организации, ведущей бизнес, устанавливающие прогнозные величины основных показателей, влияющих на стоимость объекта оценки.
В конечном счете специалист по оценке должен отразить наиболее значимые для определения стоимости объекта оценки сведения, а также информацию о состоянии и перспективах развития отрасли, в которой функционирует организация, ведущая бизнес, в том числе информацию о положении организации, ведущей бизнес, в отрасли и другие рыночные данные, используемые в последующих расчетах для установления стоимости объекта оценки.
Можно заключить, что требования к объемам и характеру информации, необходимой для проведения оценки акций и долей, предъявляемые ФСО N 8 являются наиболее серьезными и обширными по сравнению с правилами оценки иных объектов, что, несомненно, обусловлено спецификой объекта оценки и обстоятельств с ним связанных.
После идентификации объекта оценщик приступает к определению подходов, которые будут применяться при определении стоимости.
По общему правилу основных подходов проведения оценки три:
1) сравнительный — совокупность методов оценки, основанных на получении стоимости объекта оценки путем сравнения оцениваемого объекта с объектами-аналогами;
2) доходный — совокупность методов оценки, основанных на определении ожидаемых доходов от использования объекта оценки;
3) затратный — совокупность методов оценки стоимости объекта оценки, основанных на определении затрат, необходимых для приобретения, воспроизводства либо замещения объекта оценки с учетом износа и устаревания .
———————————
Пункты 12, 15, 18 ФСО N 1, утв. Приказом Минэкономразвития России от 20 мая 2015 г. N 297 «Об утверждении Федерального стандарта оценки «Общие понятия оценки, подходы и требования к проведению оценки (ФСО N 1)».
Применение того или иного подхода находится в зависимости от складывающихся обстоятельств, целей оценки, назначения результата оценки и т.п. Как уже неоднократно отмечалось в других главах, специалист-оценщик вправе отказаться от использования в своей деятельности того или иного подхода, мотивировав при этом свой отказ.
Рассмотрим особенности применения каждого из трех подходов в отношении оценки акций и долей.
1. Сравнительный подход.
Данный подход основан на применении информации о ценах сделок с акциями и долями организаций-аналогов. При оценке акций помимо информации о ценах сделок может быть использована информация о котировках акций организации, ведущей бизнес, и организаций-аналогов.
Требования к организациям-аналогам закреплены в п. 10.1 ФСО N 8 и включают в себя два пункта:
1) осуществление деятельности в той же отрасли, что и организация, акции или доли которой оцениваются;
2) сходство количественных и качественных характеристик, влияющих на стоимость объекта оценки.
Несмотря на соответствие организации вышеуказанным требованиям, иногда она все равно не может быть взята в качестве аналога при применении сравнительного подхода. Поскольку развитие предпринимательской деятельности у различных организаций неодинаково, то необходимо при применении информации о сделках учитывать также финансовые и производственные показатели деятельности организации-аналога и соответствующей организации, чьи акции или доли оцениваются. Кроме того, в учет берутся также сведения о предыдущих сделках с акциями и долями. Поскольку такие нюансы могут оказать влияние на цены по текущим сделкам, они должны быть учтены при выборе объектов-аналогов для сравнения.
Следует сказать, что ФСО N 8 содержит алгоритм действий оценщика по проведению анализа и расчетов с применением методов сравнительного подхода. Он состоит из 6 последовательных действий:
1) рассмотрения положения организации в отрасли и составления списка организаций-аналогов;
2) обоснованного выбора мультипликаторов (коэффициентов, отражающих соотношение между ценой и показателями деятельности организации), которые будут использованы для расчета стоимости объекта оценки ;
———————————
При наличии информации о ценах сделок с акциями, паями, долями в уставном (складочном) капитале организации, ведущей бизнес, оценщик может произвести расчет на основе указанной информации без учета мультипликаторов.
3) проведения расчетов базы (100% собственного капитала или 100% инвестированного капитала) для определения мультипликаторов по организациям-аналогам с учетом необходимых корректировок;
4) расчете значения мультипликаторов на основе информации по организациям-аналогам. Если расчет производится на основе информации по двум и более организациям-аналогам, оценщик должен провести обоснованное согласование полученных результатов расчета;
5) проведения расчета стоимости собственного или инвестированного капитала организации, ведущей бизнес, путем умножения мультипликатора на соответствующий финансовый или производственный показатель организации, ведущей бизнес. Если расчет производится с использованием более чем одного мультипликатора, оценщик должен провести обоснованное согласование полученных результатов расчета.
2. Доходный подход.
Стоимость акций и долей при применении доходного подхода определяется на основе ожидаемых будущих денежных потоков или иных прогнозных финансовых показателей деятельности организации, акции или доли которой оцениваются (в частности, прибыли). Таким образом, расчет стоимости объекта оценки может осуществляться двумя способами: через прогнозируемые денежные потоки или иные показатели деятельности. Иными показателями деятельности могут стать как собственный капитал , так и инвестированный капитал .
———————————
Вложения собственников. Стоимость собственного капитала определяется путем вычитания из полученной стоимости величины обязательств организации (не учтенных ранее при формировании денежных потоков или иных прогнозных финансовых показателей деятельности организации, ведущей бизнес).
Вложения всех инвесторов, связанных на дату проведения оценки с организацией, чьи акции (доли) оцениваются.
Как и в случае со сравнительным подходом, для доходного подхода ФСО N 8 содержит алгоритм действий независимого оценщика, который в наиболее общем виде выглядит следующим образом:
1) выбор методов проведения оценки;
2) определение продолжительности прогнозного периода с мотивировкой;
———————————
Период, на который будет построен прогноз денежных потоков или иных финансовых показателей деятельности организации, ведущей бизнес.
3) на основе анализа информации о деятельности организации, ведущей бизнес, которая велась ранее в течение репрезентативного периода, произвести анализ макроэкономических и отраслевых тенденций, провести прогнозирование денежных потоков или иных прогнозных финансовых показателей деятельности организации, используемых в расчете согласно выбранному методу проведения оценки объекта оценки;
4) определение ставки дисконтирования и (или) ставки капитализации. Расчет ставки капитализации, ставки дисконтирования должен соответствовать выбранному методу проведения оценки объекта оценки и виду денежного потока (или иного потока доходов, использованного в расчетах), а также учитывать особенности построения денежного потока в части его инфляционной (номинальный или реальный денежный поток) и налоговой (доналоговый или посленалоговый денежный поток) составляющих;
5) если был выбран один из методов проведения оценки объекта оценки, при которых используется дисконтирование, производится определение постпрогнозной (терминальной) стоимости ;
———————————
Постпрогнозная (терминальная) стоимость — это ожидаемая величина стоимости на дату окончания прогнозного периода.
6) проведение расчета стоимости собственного или инвестированного капитала организации, ведущей бизнес, с учетом рыночной стоимости неоперационных активов и обязательств, не использованных ранее при формировании денежных потоков, или иных финансовых показателей деятельности организации, ведущей бизнес, выбранных в рамках применения доходного подхода;
7) проведение расчета стоимости объекта оценки.
3. Затратный подход.
Применение затратного подхода предполагает определение стоимости объекта оценки на основе стоимости принадлежащих организации, чьи акции или доли оцениваются, активов и принятых обязательств. Специфика оцениваемого объекта, несомненно, затрудняет применение затратного подхода в привычном виде.
Он применяется в случае невозможности применения доходного подхода и при наличии достоверных сведений об активах и пассивах компании. При применении затратного подхода ключевую роль играет информация об организации, необходимость сбора и анализа которой была описана выше. В зависимости от дальнейших целей деятельности организации определяется применяемый метод оценки в рамках затратного подхода. Например, если оценщиком получены сведения, из которых явствует скорая ликвидация организации, стоимость объекта оценки определяется как чистая выручка, получаемая после реализации активов такой организации с учетом погашения имеющейся задолженности и затрат, связанных с реализацией активов и прекращением деятельности.
В рамках затратного подхода также выведен алгоритм действий специалиста-оценщика. Сперва необходимо выявить состояние и характеристики активов и обязательств компании. Во-первых, оценщик должен изучить и отразить в отчете состав активов и пассивов организации, во-вторых, выявить специализированные (не могут быть проданы отдельно от бизнеса, т.к. обладают уникальными свойствами) и неспециализированные активы. После чего оценщику необходимо рассчитать стоимость активов и пассивов. Завершается деятельность проведением расчетов стоимости объекта оценки.
Одним из завершающих этапов оценочной деятельности является согласование результатов оценки. Данный этап предшествует составлению отчета. В отношении акций и долей ФСО N 8 не содержит специальных правил согласования, следовательно, данное действие производится в соответствии с общими правилами, установленными ФСО N 1. Касательно правил составления отчета об оценке ФСО N 8 не устанавливает особых требований, а значит, применению подлежат общие правила ФСО N 3 и Закона об оценочной деятельности.
Однако в судебной практике нередки случаи, когда отчет об оценке не принимается судом ввиду наличия возражений другой стороны. В таком случае суд, как правило, выносит определение о проведении судебной оценочной экспертизы. Если заключение эксперта подтверждает возражения относительно представленного отчета, суд не принимает его во внимание при вынесении решения, а ориентируется на доводы эксперта, изложенные в заключении .
———————————
Постановление Федерального арбитражного суда Западно-Сибирского округа от 16 сентября 2013 г. по делу N А27-8268/2012 (Определением ВАС РФ от 26 декабря 2013 г. N ВАС-19016/13 отказано в передаче дела N А27-8268/2012 в Президиум ВАС РФ для пересмотра в порядке надзора данного Постановления).
В связи с этим при подготовке отчета об оценке акций или долей следует максимально точно следовать требованиям законодательства об оценочной деятельности и требованиям федеральных стандартов оценки, дабы исключить дальнейшую возможность возникновения возражений у ваших оппонентов относительно его соответствия закону. При необходимости проведения судебной оценочной экспертизы необходимо ходатайствовать о ее проведении у известных вам оценщиков, результатам экспертизы которых вы доверяете. Убедить в этом суд — задача не из простых, однако вполне посильная.
Источник: kommentarii.org
Федеральный стандарт оценки «оценка бизнеса (фсо n 8)»
1. Настоящий Федеральный стандарт оценки разработан с учетом международных стандартов оценки и федеральных стандартов оценки, утвержденных Минэкономразвития России, и содержит требования к проведению оценки: акций, паев в паевых фондах производственных кооперативов, долей в уставном (складочном) капитале. Оценка имущественного комплекса организации или его части как обособленного имущества действующего бизнеса проводится в соответствии с требованиями настоящего Федерального стандарта оценки. 2. Для целей настоящего Федерального стандарта оценки под бизнесом понимается предпринимательская деятельность организации, направленная на извлечение экономических выгод. 3. При определении стоимости бизнеса определяется наиболее вероятная расчетная величина, являющаяся денежным выражением экономических выгод от предпринимательской деятельности организации.
II. Объекты оценки
4. Для целей настоящего Федерального стандарта оценки объектами оценки могут выступать акции, паи в паевых фондах производственных кооперативов, доли в уставном (складочном) капитале. Имущественный комплекс организации или его часть как обособленное имущество действующего бизнеса может являться объектом оценки в соответствии с требованиями настоящего Федерального стандарта.
III. Общие требования к проведению оценки
5. Оценщик осуществляет оценку в соответствии с заданием на оценку, являющимся неотъемлемой частью договора на проведение оценки. Задание на оценку должно содержать следующую дополнительную к указанной в Федеральном стандарте оценки «Общие понятия, подходы и требования к проведению оценки (ФСО N 1)» (далее — ФСО N 1) информацию: а) данные об объекте оценки, в частности: при оценке акций — количество, категория (тип), номер и дата государственной регистрации выпуска акций; при оценке доли в уставном (складочном) капитале организации — размер оцениваемой доли; при оценке пая в паевом фонде производственного кооператива — размер оцениваемого пая, количество паев; при оценке имущественного комплекса организации — описание его состава. б) полное и сокращенное фирменное наименование организации (включая организационно-правовую форму), акции, паи в паевом фонде, доли в уставном (складочном) капитале, имущественный комплекс которой оцениваются (далее также — организация, ведущая бизнес), а также ее место нахождения, основной государственный регистрационный номер (ОГРН).
Оценка имущественного комплекса или его части осуществляется исходя из предпосылки сохранения деятельности организации, при этом состав имущественного комплекса должен быть точно идентифицирован. 6. Оценщик анализирует и представляет в отчете об оценке информацию о состоянии и перспективах развития отрасли, в которой функционирует организация, ведущая бизнес, в том числе информацию о положении организации, ведущей бизнес, в отрасли и другие рыночные данные, используемые в последующих расчетах для установления стоимости объекта оценки. 7. Оценщик анализирует и представляет в отчете об оценке информацию, характеризующую деятельность организации, ведущей бизнес, в соответствии с предполагаемым использованием результатов оценки, в том числе: а) информацию о создании и развитии бизнеса, условиях функционирования организации, ведущей бизнес; б) информацию о выпускаемой продукции (товарах) и (или) выполняемых работах, оказываемых услугах, информацию о результатах производственно-хозяйственной деятельности за репрезентативный период (под репрезентативным периодом понимается период, на основе анализа которого возможно сделать вывод о наиболее вероятном характере будущих показателей деятельности организации); в) финансовую информацию, включая годовую и промежуточную (в случае необходимости) финансовую (бухгалтерскую) отчетность организации, ведущей бизнес, информацию о результатах финансово-хозяйственной деятельности за репрезентативный период; г) прогнозные данные, включая бюджеты, бизнес-планы и иные внутренние документы организации, ведущей бизнес, устанавливающие прогнозные величины основных показателей, влияющих на стоимость объекта оценки. 8. Оценщик анализирует и представляет в отчете об оценке информацию об объекте оценки, в том числе: а) информацию о структуре уставного (складочного) капитала, паевого фонда организации, ведущей бизнес, в частности, при оценке стоимости акций — номинальную стоимость и количество размещенных и голосующих обыкновенных акций, номинальную стоимость и количество голосующих и неголосующих привилегированных акций, при оценке долей в уставном (складочном) капитале — размер уставного капитала, количество и номинальную стоимость долей, при оценке паев в паевых фондах производственных кооперативов — размер паевого фонда, количество паев; б) информацию о структуре распределения уставного (складочного) капитала, паевого фонда организации, ведущей бизнес, на дату оценки между акционерами, владеющими более 5 процентов акций, членами кооператива или участниками общества с ограниченной ответственностью, товарищами хозяйственного товарищества, участниками хозяйственного партнерства; в) информацию о правах, предусмотренных учредительными документами организации, ведущей бизнес, в отношении владельцев обыкновенных и привилегированных акций, паев в паевом фонде производственного кооператива, долей в уставном (складочном) капитале; г) информацию о распределении прибыли организации, ведущей бизнес, в частности, при оценке стоимости акций — о дивидендной истории (дивидендных выплатах) организации за репрезентативный период, при оценке долей в уставном (складочном) капитале — о размере части прибыли организации, распределяемой между участниками организации; д) сведения о наличии и условиях корпоративного договора, в случае если такой договор определяет объем правомочий участника акционерного общества, общества с ограниченной ответственностью, отличный от объема правомочий, присущих его доле согласно законодательству.
Источник: studfile.net
Репрезентативность выборочных данных
Репрезентативность — важнейшее свойство данных, используемых для построения аналитических моделей. Независимо от того, в какой предметной области и какими методами производятся выборочные исследования, отсутствие репрезентативности выборки приводит к некорректным результатам. В статье рассказываем подробнее об этом важном свойстве.
- Обеспечение репрезентативности
- Качественная репрезентативность
- Количественная репрезентативность
- Методы оценки репрезентативности
- Статистические методы
- Нестатистические методы
- Ремонт выборки
Репрезентативность — важнейшее свойство данных, используемых для построения аналитических моделей. Оно отражает способность данных представлять зависимости и закономерности исследуемой предметной области, которые должна обнаружить и научиться воспроизводить построенная модель. Иными словами, репрезентативность показывает, содержат ли анализируемые данные достаточно информации для построения качественной модели, а так же, может ли эта информация быть использована алгоритмом построения модели.
Репрезентативность генеральной совокупности отражает способность совокупности описывать существенные свойства, зависимости и закономерности объектов, процессов и явлений предметной области. Она достигается за счёт правильной организации сбора и консолидации первичных данных.
Репрезентативность выборки описывает способность выборочных данных отражать структурные свойства совокупности, из которой они были извлечены. Т.е. даёт ответ на вопрос: можно ли в исследовании заменить совокупность на выборку без значимого ухудшения результатов анализа. Репрезентативность выборки достигается с помощью правильного выбора метода сэмплинга.
Таким образом, репрезентативность выборки касается только воспроизведения характеристик совокупности. Если сама исходная совокупность плохо представляет предметную область, то, даже если полученная из неё выборка будет репрезентативной, построить на её основе корректную с точки зрения предметной области модель будут невозможно.
Например, пусть компания собирается вывести на рынок новый продукт. При этом она хочет провести маркетинговые исследования в виде опроса клиентов о желаемых характеристиках и параметрах продукта. Число клиентов компании насчитывает сотни тысяч человек (генеральная совокупность), поэтому опросить их всех не представляется возможным физически, не является целесообразным экономически.
Поэтому компания формирует выборку клиентов для проведения опроса. Если мнение клиентов из выборки отражает мнение большинства клиентов и может быть использовано для принятия решений о параметрах и характеристиках нового продукта, то такая выборка будет репрезентативной.
Независимо от того, в какой предметной области и какими методами производятся выборочные исследования, отсутствие репрезентативности выборки приводит к некорректным результатам. Поэтому в процессе анализа необходимо убедиться, что сформированная выборка репрезентативна.
Таким образом, репрезентативная выборка — это такая выборка, в которой представлены все подгруппы, важные для исследования. Помимо этого, характер распределения рассматриваемых параметров в выборке должен быть таким же, как в генеральной совокупности.
Особенно важным является обеспечение репрезентативности в машинном обучении, для построения моделей классификации и регрессии используется несколько выборок: обучающая, тестовая и валидационная, которые тем или иным способом отбираются из исходного набора данных. И все эти выборки должны быть репрезентативными.
Обеспечение репрезентативности
В основе построения репрезентативной выборки лежит правильный выбор используемого алгоритма сэмплинга. При этом размер выборки, хотя и является важным, сам по себе не гарантирует ее репрезентативности. Например, интернет-опрос может показать, что 100% людей пользуется интернетом, хотя это не соответствует действительности (т.е. репрезентативность нарушена).
Выделяют качественную (структурную) и количественную репрезентативность.
Качественная репрезентативность
Качественная репрезентативность показывает, что все группы, присутствующие в совокупности, будут представлены и в выборке. Для этого каждый элемент совокупности должен иметь равную вероятность, быть выбранным, а сама выборка должна производиться из однородных групп.
Наиболее оптимальным способом формирования репрезентативной выборки является простой случайный сэмплинг, поскольку в этом случае у любого представителя генеральной совокупности будет одинаковая вероятность попасть в выборку.
Например, при формировании выборки клиентов для опроса, в нее попадут люди из различных социальных групп пропорционально их долям в генеральной совокупности. В результате, выборка будет представлять собой уменьшенную копию генеральной совокупности.
Случайность отбора респондентов в выборку может обеспечивается различными методами. Например, для опроса клиентов берутся номера клиентских карт, которые случайным образом отбираются компьютерной программой с использованием генератора случайных чисел.
Однако, на практике применить простой случайный сэмплинг не всегда представляется возможным. Это связано с тем, что генеральная совокупность может быть неоднородной и будет содержать группы объектов.
Например, если опрос будет проводиться по телефону, то большинство откликов будет получено от пенсионеров, как людей менее занятых и более склонных идти на контакт. Очевидно, что если опрос проводится о продукте, ориентированном на молодёжь, то ценность мнения пенсионеров вряд ли будет высокой.
Чтобы решить эту проблему, можно использовать случайный стратифицированный сэмплинг, когда исходная совокупность сначала разделяется на слои (страты) по некоторому признаку. Например, клиенты могут быть стратифицированы по возрасту. Тогда страты могут быть сформированы пропорционально доле объектов в группах, что позволит уменьшить или увеличить долю той или иной группы, сохранив репрезентативность.
Другой вариант — использовать кластерный (групповой) сэмплинг, когда клиенты предварительно разбиваются на качественно однородные группы — кластеры, и отбор производится из каждого кластера независимо. При этом вероятность отбора может быть одинаковой для всех кластеров, или различной. Можно некоторые кластеры вообще исключить из отбора. В нашем примере клиенты могут быть разбиты на кластеры по социальному статусу — студенты, работающие, пенсионеры, военнослужащие и т.д. Таким образом, долю, пенсионеров в выборке, можно уменьшить или совсем исключить.
Количественная репрезентативность
Количественная репрезентативность показывает, является ли достаточным число элементов выборки для представления характеристик генеральной совокупности с заданной погрешностью. Например, при неизвестной величине генеральной совокупности, когда результат отражается в виде показателя относительной доли, число элементов выборки, обеспечивающее количественную репрезентативность, может быть вычислено по формуле:
где t — доверительный коэффициент, показывающий, какова вероятность того, что размеры показателя не будут выходить за границы предельной ошибки, p — доля единиц наблюдения, обладающих изучаемым признаком, q=1−p — доля единиц наблюдения, не обладающих изучаемым признаков, Δ — допустимая ошибка выборки.
Например, одним из показателей качества кредитного портфеля банка является доля заёмщиков, допустивших просрочку. Предельная ошибка, которую можно допустить, чтобы разброс значений показателя не превышал разумные границы, Δ=5% . При этом показатель может принимать значения 25% ±5% , т.е. от 20% до 30%. Допуская t=2 , что обеспечивает 95% вероятность, получаем
n=fraccdot 0,25cdot 0,75>>=300 заёмщиков.
Если же показатель — не относительная средняя величина просроченной задолженности по всем клиентам, то число наблюдений будет:
Если используется выборка без возврата и размер генеральной совокупности известен, то для определения необходимого размера случайной выборки при использования относительных величин (долей) применяется формула:
n=fraccdot pcdot qcdot N>cdot N+t^cdot pcdot q>
где N — число наблюдений генеральной совокупности. Для средних значений исследуемой величины формула примет вид:
Тогда, в предыдущем примере, положив число клиентов N=500 , получим:
n=fraccdot 0,25cdot 0,75cdot 500>cdot 500+2^cdot 0,25cdot 0,75>approx 188 клиентов.
Таким образом, необходимый объем выборки при безвозвратном отборе меньше, чем при возвратном (соответственнo, 188 и 300).
В целом, число наблюдений, требуемое для получения репрезентативной выборки, изменяется обратно пропорционально квадрату допустимой ошибки.
Методы оценки репрезентативности
Формально, выборку называют репрезентативной, когда результат оценки определенного параметра по данной выборке совпадает с результатом, оцененным по генеральной совокупности с учетом допустимой погрешности (ошибки репрезентативности). Если выборочная оценка отличается от оценки по генеральной совокупности более, чем на заданный уровень погрешности, то такая выборка считается нерепрезентативной.
Репрезентативность оценивается по отдельным параметрам выборки и совокупности. При этом выборка может оказаться репрезентативной по одним параметрам и нерепрезентативной по другим. Поэтому говорить о репрезентативности как о дихотомическом свойстве выборки (репрезентативна или нерепрезентативна) было бы не верно: выборка может одни параметры генеральной совокупности воспроизводить более точно, а другие — менее. Поэтому правильнее говорить о мере репрезентативности определённой выборки по конкретным параметрам.
Основным моментом в определении репрезентативности выборки является обоснование погрешности, в пределах которой выборка признается репрезентативной. Одна и та же выборка может быть достаточно репрезентативной для одной задачи и недостаточно для другой. Кроме этого, нужно проверять репрезентативность выборки по параметрам, имеющим существенное значение для предметной области исследования. Например, в маркетинговых исследованиях для анализа клиентов важны пол, возрасту, образование и пр.
Следует отметить, что далеко не все задачи бизнес-аналитики требуют строгого статистического подтверждения репрезентативности выборок. Как правило, это задачи точного прогнозирования. Что касается обычных задач, связанных, например, с определением предпочтений действующих и потенциальных клиентов, то они решаются охватом типичной клиентуры, которую можно найти непосредственно в торговых центрах.
Статистические методы
Данные, полученные в результате выборочных обследований, являются реализациями случайных величин (возраст, стаж работы, доход и т.д.). Обычно, на практике считают, что выборка является репрезентативной, если её статистические параметры (среднее значение, дисперсия, среднеквадратичное отклонение и т.д.) отличаются от параметров совокупности не более, чем на 5%.
Однако, данный подход применим только при условии, что вся генеральная совокупность известна и для неё можно вычислить статистические характеристики. Но на практике такое встречается редко, поскольку часть потенциально интересных для исследования объектов оказывается недоступной для наблюдения.
В этом случае прибегают к формированию двух независимых выборок, вычисляют и сравнивают их характеристики, и если они совпадают (не различаются значимо), то выборки считаются репрезентативными. В теоретическом плане такой подход является достаточно привлекательным, однако, на практике сложно реализуем. Во-первых, формирование нескольких выборок ведёт к дополнительным затратам, а во-вторых, если параметры выборок значимо различаются, то невозможно сказать, какая из них репрезентативна.
Для сравнения двух выборок используются два вида критериев: непараметрические и параметрические. Первые не используют в расчётах значений параметров статистических распределений, а оперируют частотами и рангами. К числу наиболее популярных непараметрических критериев можно отнести критерий Уилкоксона и U -критерий Манна-Уитни. Второй рекомендуется использовать, если число наблюдений превышает 30. К числу популярных параметрических критериев относится t -критерий Стьюдента, критерий однородности Смирнова, Q -критерий Розенбаума и др.
Нестатистические методы
Статистические методы оценки репрезентативности выборочных данных, хотя и являются строго обоснованными, но довольно сложны в использовании (особенно для пользователей, не имеющих достаточной математической подготовки). Кроме этого они могут иметь ограничения (например, независимость выборок), удовлетворить которым достаточно сложно.
Статистические подходы к оценке репрезентативности выборок имеет смысл использовать, если для анализа данных используются статистические методы. Методы машинного обучения, которые является эвристическими и в большинстве случаев не обеспечивают точного и единственного решения, вообще говоря, не нуждаются в точной оценке репрезентативности обучающих выборок. Поэтому в них используются свои техники для определения того, насколько обучающая или тестовая выборка хорошо представляют исходную совокупность.
Ещё одной особенностью выборок, используемых в машинном обучении, является то, что объём исходной совокупности, из которой формируются обучающее, тестовое, а при необходимости, и валидационное множество, известен, поскольку данные содержатся в консолидированных таблицах источника данных.
Обычно нестатистические меры репрезентативности используют расстояния между векторами наблюдений в пространстве признаков. Рассмотрим, например, такой показатель как индекс ближайшего соседа (Nearest Neighbours Index — NNI). Предположим, что выборка включает n ближайших соседей внутри некоторой области пространства признаков. Вычислим величину, представляющую собой среднее расстояние между i -м объектом и всеми остальными объектами в выборке (области соседства):
где D_i — расстояние от i -го объекта до остальных объектов выборки, n — число объектов выборки.
Затем вычислим величину:
где D_> — общее расстояние по всей совокупности, N — число наблюдений совокупности.
Тогда индекс ближайшего соседа будет:
Если значение данного показателя близко к 1, то точки выборки имеют равномерное пространственное распределение. Если меньше 1, то пространственное распределение точек неоднородно. Если NNI больше 1, то имеет место значительная дисперсия значений внутри выборки.
Очевидно, что наилучшим вариантом с точки зрения репрезентативности будет первый случай, когда пространственное распределение точек данных в совокупности и выборке примерно одинаковое. Второй случай показывает, что внутри выборки могут присутствовать некоторое локальные особенности, нехарактерные для всей совокупности.
В литературе можно найти больше количество разнообразных алгоритмов и методов оценки репрезентативности выборок для машинного обучения, разработанных для различных предметных областей исследования и типов задач анализа. Большинство их них являются эвристическими и не гарантируют получения наилучшего результата. Поэтому самым надёжным критерием репрезентативности выборки, на основе которой строилась определённая обучаемая модель, является точность и обобщающая способность самой модели.
Ремонт выборки
Возникает вопрос: а что делать в ситуации, когда аналитику доступна только выборка «как есть», а её репрезентативность неудовлетворительная? При этом доступ к генеральной совокупности для формирования более репрезентативной выборки у него отсутствует (например, из-за проблем с сетью, невозможности повторных исследований из-за высоких затрат и т.д.). В этом случае улучшить ситуацию может специальная процедура, которая называется «ремонт выборки».
Все действия аналитика, связанные с репрезентативностью, можно разделить на два этапа: контроль и ремонт.
- Контроль выборки — процедура сравнения генеральной совокупности и выборки, выявление степени их расхождения, обнаружение причин отклонений и разработка возможных способов их устранения.
- Ремонт выборки — процесс устранения расхождения генеральной совокупности и выборки.
Контроль и ремонт выборки рассматриваются как обязательные этапы любого выборочного исследования. Хотя, некоторые авторы не разделяют эти два этапа, а включают ремонт в общую процедуру контроля выборки. Ряд вопросов, связанных с контролем выборки был рассмотрен выше.
Основной целью ремонта является повышение качества выборки в смысле отражения ею зависимостей и закономерностей исследуемых процессов и явлений, которые требуется обнаружить в процессе анализа. При этом не следует путать ремонт выборки с повышением качества данных вообще.
Ремонт выборки, обычно, включает следующие задачи:
- Коррекция выборки. Заключается в замене ранее выбранных объектов совокупности. Коррекция может потребоваться, например, если в выборке произошло искажение распределения объектов относительно исходной совокупности, например, получился избыток пенсионеров, мужчин, женщин или людей с определённым уровнем образования. Замена может быть произвольной (например, следующий клиент по списку) или эквивалентной (подыскивается клиент с теми же параметрами — пенсионера меняем на пенсионера и т.д.).
- Расширение основы выборки. Позволяет включить в выборку большее разнообразие наблюдений. Основа выборки — это подмножество элементов генеральной совокупности, из которого будет формироваться выборка. Использование основы выборки позволяет сделать отбор более целевым, исключив обработку данных, не относящихся к задаче анализа, лучше сфокусироваться на целевой группе. В анализе клиентской базы основой выборки могут быть только мужчины, только женщины, люди в возрасте от 30 до 60 и т.д. Если выборка получилась недостаточно репрезентативной, то решить проблему можно расширяя границы основы выборки. Например, если изначально основой выборки являлась только люди пенсионного возраста, то при необходимости она может быть расширена и на людей предпенсионного возраста.
- Взвешивание. При взвешивании объектам выборки могут присваиваться весовые коэффициенты, которые могут учитываться в алгоритме анализа. Например, повышенные весовые коэффициенты могут присваиваться клиентам, которые наиболее активно пользовались услугами компании (купили товаров и услуг на сумму выше некоторого порога). Логично предположить, что мнение таких клиентов будет более значимым.
Следует отметить, что единого, строго обоснованного подхода к ремонту выборок, вообще говоря, не существует, хотя в литературе можно встретить некоторые общие рекомендации. В большинстве практических случаев аналитику приходится самостоятельно выбирать, какие преобразования следует применить к выборке для повышения её репрезентативности.
Другие материалы по теме:
Источник: loginom.ru