Виды группировок в статистике примеры. Задачи и виды группировок

Научно организованная обработка материалов статистического наблюдения по заранее разработанной программе включает в себя, кроме контроля данных, систематизацию, группировку данных, составление таблиц, получение итогов и производных показателей (средних и относительных величин) и т. д. Собранный в процессе статистического наблюдения материал представляет собой разрозненные первичные сведения об отдельных единицах изучаемого явления. В таком виде материал еще не характеризует явление в целом: не дает представления ни о величине (численности) явления, ни о его составе, ни о размере характерных признаков, ни о существе связей этого явления с другими явлениями и т. д. Возникает необходимость в специальной обработке статистических данных - сводке материалов наблюдения.

Сводка материалов наблюдения представляет собой комплекс последовательных действий по обобщению конкретных единичных данных, образующих совокупность, с целью обнаружения типичных черт и закономерностей, присущих изучаемому явлению в целом.

Статистическая сводка (простая сводка) в узком смысле слова представляет собой операцию по подсчету общих итоговых (суммарных) данных по совокупности единиц наблюдения. Статистическая сводка (сложная сводка) в широком смысле слова включает в себя также группировку данных наблюдения, подсчет общих и групповых итогов, получение системы взаимосвязанных показателей,

представление результатов группировки и сводки в виде статистических таблиц.

Правильная, научно организованная сводка, опираясь на предварительный глубокий теоретический анализ , позволяет получить все статистические итоги, отражающие важнейшие, характерные черты объекта исследования, измерить влияние различных факторов на результат и учесть все это в практической работе при составлении текущих и перспективных планов. Задача сводки - дать характеристику объекту исследования с помощью систем статистических показателей, выявить и измерить таким путем его существенные черты и особенности. Эта задача решается на трех этапах:

  • определение групп и подгрупп;
  • определение системы показателей;
  • определение видов таблиц.

На первом этапе осуществляется систематизация, группировка материалов, собранных при наблюдении. На втором этапе уточняется предусмотренная планом система показателей, с помощью которых количественно характеризуются свойства и особенности изучаемого предмета. На третьем этапе исчисляются сами показатели, и обобщенные данные для наглядности и удобства представляются в таблицах, статистических рядах, графиках, диаграммах.

Перечисленные этапы сводки еще до начала ее проведения отражаются в специально составляемой программе. Программа статистической сводки содержит перечень групп, на которые целесообразно разделить совокупность, их границы в соответствии с группировочными признаками; систему показателей, характеризующих совокупность, и методику их расчета; систему макетов разработочных таблиц, в которых будут представлены итоги расчетов.

Наряду с программой существует план проведения сводки, который предусматривает ее организацию. План проведения сводки должен содержать указания о последовательности и сроках выполнения ее отдельных частей, об ответственных за ее выполнение, порядке изложения результатов, а также предусматривать координацию работы всех организаций, задействованных в ее проведении.

Основные задачи и виды группировок

Предмет статистических исследований - массовые явления и процессы общественной жизни - обладают многочисленными признаками и свойствами. Обобщить статистические данные, раскрыть наиболее существенные особенности, формы развития массового явления в целом и отдельных его составляющих невозможно без определенных научных принципов обработки данных. Без преодоления индивидуального многообразия объектов статистического наблюдения общие закономерности развития явления или процесса в целом теряются в деталях и мелочах, отличающих каждый объект один от другого, а предельное обобщение влечет за собой извращенное представление о действительности. Для разделения совокупности единиц на однотипные группы статистика использует метод группировок.

Статистические группировки - первый этап статистической сводки, позволяющий выделить из массы исходного статистического материала однородные группы единиц, обладающих общим сходством в качественном и количественном отношениях. Важно понимать, что группировка - это не субъективный технический прием разделения совокупности на части, а научно обоснованный процесс разделения множества единиц совокупности по определенному признаку.

Основополагающим принципом применения метода группировок является всесторонний, глубокий анализ сущности и природы изучаемого явления, позволяющий определить его типические свойства и внутренние различия. Любая общая совокупность является комплексом частных совокупностей, каждая из которых объединяет явления особого типа, однокачественные в определенном отношении. Каждый тип (группа) имеет специфическую систему признаков с соответствующим уровнем их количественных значений. Установить, к какому типу, в какую частную совокупность нужно отнести группируемые единицы общей совокупности, возможно на основе правильного, четкого определения существенных признаков, по которым должна проводиться группировка. Это второе важное требование научно обоснованной группировки. Третье требование группировки основано на объективном, обоснованном установлении границ групп при условии, что образованные группы должны объединять однородные элементы совокупности, а сами группы (одна по отношению к другой) должны существенно различаться. В противном случае группировка теряет смысл.

Таким образом, на основе применения метода группировок определяются группы по принципу подобия и различия единиц совокупности. Подобие - это однородность единиц в определенных пределах (группах); различие - это их существенное расхождение по группам.

Итак, группировка - разделение общей совокупности единиц по одному или нескольким существенным признакам на однородные группы, различающиеся между собой в качественном и количественном отношении и позволяющие выделить социально-экономические типы, изучить структуру совокупности или проанализировать связи между отдельными признаками. Разнообразие общественных явлений и целей их изучения делает возможным применение большого количества статистических группировок явлений и решение на этой основе самых различных конкретных задач. Основными задачами, решаемыми с помощью группировок, в статистике являются следующие:

  • выделение в совокупности изучаемых явлений их социально-экономических типов;
  • изучение структуры общественных явлений;
  • выявление связей и зависимостей между общественными явлениями.

Все группировки, связанные с выделением в совокупности изучаемых явлений их социально-экономических типов, занимают в статистике центральное место. Эта задача имеет отношение к наиболее существенным, решающим сторонам общественной жизни, например группировка населения по социальному статусу, полу, возрасту, уровню образования, группировка предприятий и организаций по формам собственности , отраслевой принадлежности. Построение подобных группировок за продолжительные периоды позволяет проследить процесс развития социально-экономических отношений. Задача расчленения совокупности общественных явлений по их социально-экономическим типам решается с помощью построения типологических группировок.

Таким образом, типологическая группировка - это разделение качественно разнородной исследуемой совокупности на однородные группы единиц в соответствии с социально-экономическими типами. Примером типологической группировки является группировка по виду участвующих субъектов инновационной деятельности в одном из регионов, которые можно разделить на следующие основные группы взаимоотношений (табл. 3.1).

Таблица 3.1

Исключительно важное значение придается изучению структуры общественных явлений, т. е. изучению различий в составе какого-либо определенного типа явлений (соотношения между составными частями явления, изменения в этих соотношениях за определенный период времени). Таким образом, структурной группировкой называется группировка, в которой происходит разделение однородной совокупности на группы, характеризующие ее структуру по какому-либо варьирующему признаку. К структурным группировкам относятся группировка населения по полу, возрасту, уровню образования, группировка предприятий по численности работников, уровню заработной платы , объему работ и т. д. В изменении структуры общественных явлений отражаются важнейшие закономерности их развития. Например, группировка в табл. 3.2 показывает, что в период с 1959 по 1994 г. численность городского населения постоянно увеличивалась, а численность сельского падала, однако в период с 1994 по 2002 г. соотношение этих групп населения не изменилось.

Таблица 3.2

Группировка населения России по месту проживания за 1959-2002 гг.

Применение структурных группировок позволяет не только раскрыть структуру совокупности, но и проанализировать изучаемые процессы, их интенсивность, изменение в пространстве, а взятые за ряд периодов времени структурные группировки раскрывают закономерности изменений состава совокупности во времени.

В основу структурных группировок могут быть положены атрибутивный или количественный признаки. Их выбор определяется задачами конкретного исследования и сущностью изучаемой совокупности. Группировка, приведенная в табл. 3.2, построена по атрибутивному признаку. При структурной группировке по количественному признаку возникает необходимость определения числа групп и их границ. Этот вопрос решается в соответствии с задачами исследования. Один и тот же статистический материал может быть разбит на группы различным образом в зависимости от целей и задач исследования. Главное, чтобы в процессе группировки были ярко отражены особенности изучаемого явления и созданы предпосылки для конкретных выводов и рекомендаций. В табл. 3.3 приведена структурная группировка по количественному признаку.

Таблица 3.3

Группировка семей жителей С.-Петербурга по величине среднедушевого дохода (по данным за сентябрь - октябрь 1996 г.)

В данной таблице интервалы групп равны по своей величине. Если применяются равные интервалы, то расчет их величины производится по формуле

где h - величина интервала, xmax и xmin - максимальные и минимальные значения признаков совокупности, k - число групп.

Следует отметить, что технически удобнее иметь дело с равными интервалами, но это далеко не всегда представляется возможным из-за свойств изучаемых явлений и признаков. В экономике чаще приходится применять неравные, прогрессивно увеличивающиеся интервалы, что обусловлено самой природой экономических явлений.

Применение неравных интервалов объясняется главным образом тем, что абсолютное изменение группировочного признака на одну и ту же величину имеет далеко не одинаковое значение для групп с большим и малым значением признака. Например, между двумя предприятиями с численностью рабочих до 300 человек разница в 100 человек более существенна, чем для предприятий с численностью свыше 10 000 человек.

Интервалы групп могут быть замкнутыыми, когда указаны нижняя и верхняя границы, и открыгтыгми, когда указана лишь одна из границ групп. Открытые интервалы применяются только для крайних групп. При группировке с неравными интервалами желательно образование групп с замкнутыми интервалами. Это способствует точности статистических вычислений.

Одна из целей статистического наблюдения - выыявле-ние связей и зависимостей между общественными явлениями. Важной задачей статистического анализа, проводимого на основе типологической группировки, т. е. в пределах однокачественных совокупностей, является задача изучения и измерения связи между отдельными признаками. Установить факт наличия такой связи позволяет аналитическая группировка.

Аналитическая группировка - распространенный прием статистического изучения связей, которые обнаруживаются при параллельном сопоставлении обобщенных значений признаков по группам. Различают признаки зависимые, значения которых изменяются под влиянием других признаков, их обычно в статистике называют результативными, и факторные, оказывающие влияние на другие. Обычно в основе аналитической группировки лежит признак-фактор, а по результативным признакам производится расчет групповых средних, по изменению величины которых определяют наличие связи между признаками. Таким образом, аналитическими можно назвать такие группировки, которые позволяют установить и изучить связь между результативными и факторными признаками единиц однотипной совокупности.

Важная проблема аналитических группировок - правильный выбор числа групп и определение их границ, что в последующем обеспечивает объективность характеристик связи. Поскольку анализ ведется в однокачественных совокупностях, теоретических оснований для дробления определенного типа нет, поэтому допустима разбивка совокупности на любое число групп, удовлетворяющее определенным требованиям и условиям конкретного анализа. В процессе аналитических группировок следует соблюдать общие правила группировки, т. е. единицы в образованных группах должны быть существенно различны, количество единиц в группах должно быть достаточным для расчета надежных статистических характеристик. Кроме того, групповые средние должны подчиняться определенной закономерности: последовательно увеличиваться или уменьшаться.

Непосредственная группировка данных статистического наблюдения - это первичная группировка. Вторичная группировка - перегруппировка ранее сгруппированных данных. Необходимость вторичной группировки возникает в двух случаях:

  • ранее произведенная группировка не удовлетворяет целям исследования в отношении числа групп;
  • для сравнения данных, относящихся к различным периодам времени или к различным территориям , если первичная группировка была произведена по разным группи-ровочным признакам или по разным интервалам.

Существует два способа вторичной группировки:

  • объединение мелких групп в более крупные;
  • выделение определенной доли единиц совокупности.

В научно обоснованной группировке общественных явлений необходимо учитывать взаимозависимость явлений и возможность перехода постепенных количественных изменений в явлениях к коренным качественным изменениям. Группировка может быть научной лишь в том случае, если не только определены познавательные цели группировки, но и правильно выбрано основание группировки - группи-ровочный признак. Если группировка - это распределение на однородные группы по какому-либо признаку или объединение отдельных единиц совокупности в группы, однородные по какому-либо признаку, то группировочный признак - это признак, по которому происходит объединение отдельных единиц совокупности в отдельные группы.

При выборе группировочного признака важным является не способ выражения признака, а его значение для изучаемого явления. С этой точки зрения для группировки следует брать существенные признаки, выражающие наиболее характерные черты изучаемого явления.

Самая простая группировка - ряд распределения. Рядами распределения называются ряды чисел (цифр), характеризующие состав или структуру какого-либо явления после группировки статистических данных об этом явлении, другими словами, это группировка, в которой для характеристики групп применяется один показатель - численность группы. Пример использование ряда распределения приведен в табл. 3.4.

Таблица 3.4

Приведенный ряд распределения содержит три элемента: разновидность атрибутивного признака (мужчины, женщины); численность единиц в каждой группе, называемая частотами ряда распределения; численность групп, выраженная в долях (процентах) от общей численности единиц, называемая частостями. Сумма частостей равна 1, если они выражены в долях единицы, и равна 100 %, если они выражены в процентах.

Ряды, построенные по атрибутивному признаку, называют атрибутивными.

Ряды распределения, построенные по количественному признаку, называются вариационныыми рядами. Числовые значения количественного признака в вариационном ряду распределения называются вариантами и располагаются в определенной последовательности. Варианты могут выражаться числами положительными и отрицательными, абсолютными и относительными. Вариационные ряды делятся на дискретные и интервальные.

Дискретныге вариационныге рядыг характеризуют распределение единиц совокупности по дискретному (прерывному) признаку, т. е. принимающему целые значения. При построении ряда распределения с дискретной вариацией признака все варианты выписываются в порядке возрастания их величины, подсчитывается, сколько раз повторяется одна и та же величина варианта, т. е. частота, и записывается в одной строке с соответствующим значением варианта, например распределение семей по числу детей (табл. 3.5).

Частоты в дискретном вариационном ряду, как и в атрибутивном, могут быть заменены частостями.

Таблица 3.5

В случае непрерывной вариации величина признака может принимать любые значения в определенном интервале, например распределение работников фирмы по уровню дохода (табл. 3.6).

Таблица 3.6

При построении интервального вариационного ряда необходимо выбрать оптимальное число групп (интервалов признака) и установить длину интервала. Оптимальное число групп выбирается так, чтобы отразить многообразие значений признака в совокупности. Чаще всего число групп устанавливается по формуле

k = 1 + 3,32lg N = 1,44ln N + 1,

где k - число групп; N - численность совокупности.

Например, необходимо построить вариационный ряд сельскохозяйственных предприятий по урожайности зерновых культур. Число сельскохозяйственных предприятий - 143. Как определить число групп?

k = 1 + 3,32lg N = 1 + 3,32lg143 = 8,16.

Число групп может быть только целым числом, в данном случае - 8 или 9.

Пример. Минимальная урожайность составляет 30 ц/га, максимальная - 70 ц/га, а число намеченных групп - 10. Величину интервала можно рассчитать по формуле (3.1):

Если полученная группировка не удовлетворяет требованиям анализа, то можно произвести перегруппировку. Не следует стремиться к очень большому количеству групп, так как в такой группировке часто исчезают различия между группами. Также надо избегать образования и слишком малочисленных групп, включающих несколько единиц совокупности, потому что в таких группах перестает действовать закон больших чисел и возможно проявление случайности. Когда не удается сразу наметить возможные группы, собранный материал сначала разбивают на значительное количество групп, а затем укрупняют их, уменьшая количество групп и создавая качественно однородныле группыл.

Таким образом, группировки во всех случаях должны быть построены так, чтобы образованные в них группы как можно полнее отвечали действительности, были видны различия между группами и в одну группу не объединялись существенно различающиеся между собой явления.

Статистические таблицы

После того как данные статистического наблюдения собраны и даже сгруппированы, их трудно воспринимать и анализировать без определенной, наглядной систематизации. Результаты статистических сводок и группировок получают оформление в виде статистических таблиц.

Статистическая таблица дает количественную характеристику статистической совокупности и представляет собой форму наглядного отображения полученных в результате статистической сводки и группировки числовых (цифровых) данных. По внешнему виду таблица представляет собой комбинацию вертикальных и горизонтальных строк. В ней обязательно должны быть общие боковые и верхние заголовки. Еще одной особенностью статистической таблицы является наличие подлежащего (характеристика статистической совокупности) и сказуемого (показатели, характеризующие совокупности). Статистические таблицы являются наиболее рациональной формой изложения результатов сводки или группировки.

Подлежащее таблицы представляет ту статистическую совокупность, о которой идет речь в таблице, т. е. перечень отдельных или всех единиц совокупности либо их групп. Чаще всего подлежащее помещается в левой части таблицы и содержит перечень строк. Сказуемое таблицы - это те показатели, с помощью которых дается характеристика явления, отображаемого в таблице. Подлежащее и сказуемое таблицы могут располагаться по-разному, главное, чтобы таблица была легко читаемой, компактной и легко воспринималась.

В статистической практике и исследовательских работах используются таблицы различной сложности. Это зависит от характера изучаемой совокупности, объема имеющейся информации, задач анализа . Если в подлежащем таблицы содержится простой перечень каких-либо объектов или территориальных единиц, таблица называется простой. В подлежащем простой таблицы нет каких-либо группировок статистических данных. Эти таблицы имеют самое широкое применение в статистической практике, например характеристика городов РФ по численности населения, средней зарплате и т. п. Если подлежащее простой таблицы содержит перечень территорий , например областей, краев, автономных округов, республик и т. д., то такая таблица называется территориальной. Простая таблица содержит только описательные сведения, ее аналитические возможности ограничены. Глубокий анализ исследуемой совокупности, взаимосвязей признаков предполагает построение более сложных таблиц - групповых и комбинационных.

Групповые таблицы в отличие от простых содержат в подлежащем не простой перечень единиц объекта наблюдения, а их группировку по одному существенному признаку. Простейшим видом групповой таблицы являются таблицы, в которых представлены ряды распределения (см. табл. 3.6). Групповая таблица может быть более сложной, если в сказуемом приводится не только число единиц в каждой группе, но и ряд других важных показателей, количественно и качественно характеризующих группы подлежащего. Такие таблицы часто используются в целях сопоставления обобщающих показателей по группам, что позволяет сделать определенные практические выводы. Более широкими аналитическими возможностями располагают комбинационные таблицы.

Комбинационными называются статистические таблицы, в подлежащем которых группы единиц, образованные по одному признаку, подразделяются на подгруппы по одному или нескольким признакам. В отличие от простых и групповых таблиц комбинационные позволяют проследить зависимость показателей сказуемого от нескольких признаков, которые легли в основу комбинационной группировки в подлежащем.

Наряду с перечисленными выше таблицами в статистической практике применяют таблицы сопряженности, или таблицы частот. В основе построения таких таблиц лежит группировка единиц совокупности по двум или более признакам, которые называются уровнями. Например, население делится по полу (мужской, женский) и т. п. Таким образом, признак А имеет n градаций (или уровней): A1, A2, An (в нашем примере n = 2). Далее изучается взаимодействие признака А с другим признаком - В, который подразделяется на m градаций (факторов): B1, B2, ..., Bm. В нашем примере признак В - принадлежность к какой-либо профессии, а B1, B2, Bm принимают конкретные значения (доктор, водитель, учитель, строитель и т. д.). Группировка по двум и более признакам используется для оценки взаимосвязей между признаками А и В.

Результаты наблюдений можно представить таблицей сопряженности, состоящей из n строк и m столбцов, в ячейках которых проставлены частоты событий nij, т. е. количество объектов выборки, обладающих комбинацией уровней A j и Bj. Если между переменными A и B имеется взаимно-однозначная прямая или обратная функциональная связь, то все частоты nij концентрируются по одной из диагоналей таблицы. При не столь сильной связи некоторое число наблюдений попадает и на недиагональные элементы. В этих условиях перед исследователем стоит задача: выяснить, насколько точно можно предсказать значение одного признака по величине другого. Таблица частот называется одномерной, если в ней табулирована только одна переменная. Таблица, в основе которой лежит группировка по двум признакам (уровням), которые табулируются по двум признакам (факторам), называется таблицей с двумя входами. Таблицы частот, в которых табулируются значения двух или более признаков, называются таблицами сопряженности.

Из всех видов статистических таблиц наиболее широкое применение имеют простые таблицы, реже применяются групповые и особенно комбинационные статистические таблицы, а таблицы сопряженности строят для проведения специальных видов анализа. Статистические таблицы служат одним из важных способов выражения и изучения массовых общественных явлений, но лишь при условии правильного их построения.

Форма любой статистической таблицы должна наилучшим образом отвечать сущности выражаемого ею явления и целям его изучения. Это достигается путем соответствующей разработки подлежащего и сказуемого таблицы. Внешне таблица должна быть небольшой и компактной, иметь название, указание единиц измерения, а также времени и места, к которым относятся сведения. Заголовки строк и граф в таблице даются кратко, но четко. Чрезмерное загромождение таблицы цифровыми данными, неряшливое оформление затрудняют ее чтение и анализ. Перечислим основные правила построения статистических таблиц:

  • таблица должна быть компактной и отражать только те исходные данные, которые прямо отражают исследуемое социально-экономическое явление в статике и динамике;
  • заголовок таблицы, названия граф и строк должны быть четкими, краткими, лаконичными. В заголовке должны быть отражены объект, признак, время и место совершения события;
  • графы и строки следует нумеровать;
  • графы и строки должны содержать единицы измерения, для которых существуют общепринятые сокращения;
  • информацию, сопоставляемую в ходе анализа, лучше всего располагать в соседних графах (либо одну под другой). Это облегчает процесс сравнения;
  • для удобства чтения и работы числа в статистической таблице следует проставлять в середине граф, строго одно под другим: единицы - под единицами, запятая - под запятой;
  • числа целесообразно округлять с одинаковой степенью точности (до целого знака, до десятой доли);
  • отсутствие данных обозначается знаком умножения (х), если данная позиция не подлежит заполнению, отсутствие сведений обозначается многоточием (...), либо «н. д.», либо «н. св.», при отсутствии явления ставится знак тире (-);
  • для отображения очень малых чисел используют обозначение 0.0 или 0.00;
  • если число получено на основании условных расчетов, то его берут в скобки, сомнительные числа сопровождают вопросительным знаком, а предварительные - знаком (*).

В случае необходимости дополнительной информации статистические таблицы сопровождаются сносками и примечаниями, в которых разъясняются, например, сущность специфического показателя, примененной методологии и т. д. Сносками пользуются для того, чтобы указать на ограниченные обстоятельства, которые надо принять во внимание при чтении таблицы.

При соблюдении этих правил статистическая таблица становится основным средством представления, обработки и обобщения статистической информации о состоянии и развитии изучаемых социально-экономических явлений.

Графические представления статистической информации

Полученные в результате сводки или статистического анализа в целом числовые показатели могут быть представлены не только в табличной, но и в графической форме. Использование графиков для представления статистической информации позволяет придать статистическим данным наглядность и выразительность, облегчить их восприятие, а во многих случаях и анализ. Многообразие графических представлений статистических показателей дает огромные возможности для наиболее выразительной демонстрации явления или процесса.

Графиками в статистике называются условные изображения числовых величин и их соотношений в виде различных геометрических образов: точек, линий, плоских фигур и т. п. Статистический график позволяет сразу оценить характер изучаемого явления, присущие ему закономерности и особенности, тенденции развития, взаимосвязь характеризующих его показателей.

Каждый график состоит из графического образа и вспомогательных элементов. Графический образ - это совокупность точек, линий и фигур, с помощью которых изображаются статистические данные. Вспомогательные элементы графика включают общее название графика, оси координат, шкалы, числовые сетки и числовые данные, дополняющие и уточняющие изображаемые показатели. Вспомогательные элементы облегчают чтение графика и его истолкование.

Название графика должно кратко и точно раскрывать его содержание. Пояснительные тексты могут располагаться в пределах графического образа или рядом с ним либо выноситься за его пределы.

Оси координат с нанесенными на них шкалами и числовые сетки необходимы для построения графика и пользования им. Шкалы могут быть прямолинейными или криволинейными (круговыми), равномерными (линейными) и неравномерными. Иногда целесообразно применять так называемые сопряженные шкалы, построенные на одной или двух параллельных линиях. Чаще всего одна из сопряженных шкал используется для отсчета абсолютных величин, а вторая - соответствующих им относительных. Числа на шкалах проставляются равномерно, при этом последнее число должно превышать максимальный уровень показателя, значение которого отсчитывается по этой шкале. Числовая сетка, как правило, должна иметь базовую линию, роль которой обычно играет ось абсцисс.

Статистические графики можно классифицировать по разным признакам: назначению (содержанию), способу построения и характеру графического образа.

  • графики сравнения в пространстве;
  • графики различных относительных величин (структуры, динамики и др.);
  • графики вариационных рядов;
  • графики размещения по территории ;
  • графики взаимосвязанных показателей и т. д.

По способу построения графики можно разделить на диаграммы и статистические карты. Диаграммы - наиболее распространенный способ графических изображений. Это графики количественных отношений. Виды и способы их построения разнообразны. Диаграммы применяются для наглядного сопоставления в различных аспектах (пространственном, временном и др.) независимых друг от друга величин: территорий, населения и т. д. При этом сравнение исследуемых совокупностей производится по какому-либо существенному варьирующему признаку. Статистические карты - графики количественного распределения по поверхности. По своей основной цели они близко примыкают к диаграммам и специфичны лишь потому, что представляют собой условные изображения статистических данных на контурной географической карте, т. е. показывают пространственное размещение или пространственную распространенность статистических данных.

По характеру графического образа различают графики точечные, линейные, плоскостные (столбиковые, полосовые, квадратные, круговые, секторные, фигурные) и объемные. При построении точечных диаграмм в качестве графических образов применяются совокупности точек, при построении линейных - линии. Основной принцип построения всех плоскостных диаграмм сводится к тому, что статистические величины изображаются в виде геометрических фигур. Статистические карты по графическому образу делятся на картограммы и картодиаграммы .

В зависимости от круга решаемых задач выделяются диаграммы сравнения, структурные диаграммы и диаграммы динамики. Наиболее распространенными диаграммами сравнения являются столбиковые диаграммы, принцип построения которых состоит в изображении статистических показателей в виде поставленных по вертикали прямоугольников - столбиков. Каждый столбик изображает величину отдельного уровня исследуемого статистического ряда. Таким образом, сравнение статистических показателей возможно потому, что все сравниваемые показатели выражены в одной единице измерения. При построении столбиковых диаграмм необходимо начертить систему пря-

моугольных координат, в которой располагаются столбики. На горизонтальной оси располагаются основания столбиков, величина основания определяется произвольно, но устанавливается одинаковой для всех. Шкала, определяющая масштаб столбиков по высоте, расположена по вертикальной оси. Величина каждого столбика по вертикали соответствует размеру изображаемого на графике статистического показателя. Таким образом, у всех столбиков, составляющих диаграмму, переменной величиной является только одно измерение. Размещение столбиков в поле графика может быть различным:

  • на одинаковом расстоянии друг от друга;
  • вплотную друг к другу;
  • в частичном наложении друг на друга.

Правила построения столбиковых диаграмм допускают одновременное расположение на одной горизонтальной оси изображений нескольких показателей. В этом случае столбики располагаются группами, для каждой из которых может быть принята разная размерность варьирующих признаков.

Разновидности столбиковых диаграмм составляют так называемые ленточные и полосовые диаграммы. Их отличие состоит в том, что масштабная шкала расположена по горизонтали сверху и определяет величину полос по длине. Область применения столбиковых и полосовых диаграмм одинакова, так как идентичны правила их построения. Одномерность изображаемых статистических показателей и их одномасштабность для различных столбиков и полос требуют выполнения единственного положения: соблюдения соразмерности (столбиков - по высоте, полос - по длине) и пропорциональности изображаемым величинам. Для выполнения этого требования необходимо, во-первых, чтобы шкала, по которой устанавливается размер столбика (полосы), начиналась с нуля; во-вторых, эта шкала должна быть непрерывной, т. е. охватывать все числа данного статистического ряда; разрыв шкалы и соответственно столбиков (полос) не допускается. Невыполнение указанных правил приводит к искаженному графическому представлению анализируемого статистического материала. Столбиковые и полосовые диаграммы как прием графического изображения статистических данных взаимозаменяемы, т. е. рассматриваемые статистические показатели равно могут быть представлены как столбиками, так и полосами. И в том и в другом случае для изображения величины явления используется одно измерение каждого прямоугольника - высота столбика или длина полосы, поэтому и сфера применения этих двух диаграмм в основном одинакова.

Разновидностью столбиковых и ленточных диаграмм являются направленные диаграммы. Они отличаются от обычных двусторонним расположением столбиков или полос и имеют начало отсчета по масштабу в середине. Обычно такие диаграммы применяются для изображения величин противоположного качественного значения. Сравнение между собой столбиков или полос, направленных в разные стороны, менее эффективно, чем расположенных рядом в одном направлении. Несмотря на это, анализ направленных диаграмм позволяет делать достаточно содержательные выводы, так как особое расположение придает графику яркое изображение. К группе двусторонних относятся диаграммыг чис-тыгх отклонений. В них полосы направлены в обе стороны от вертикальной нулевой линии: вправо - для прироста, влево - для уменьшения. С помощью таких диаграмм удобно изображать отклонения от плана или некоторого уровня, принятого за базу сравнения. Важным достоинством рассматриваемых диаграмм является возможность видеть размах колебаний изучаемого статистического признака, что само по себе имеет большое значение для анализа.

Для простого сравнения не зависимых друг от друга показателей могут также использоваться диаграммы, принцип построения которых состоит в том, что сравниваемые величины изображаются в виде правильных геометрических фигур, которые строятся так, чтобы их площади соответствовали тому количеству, которые эти фигуры отображают. Другими словами, эти диаграммы выражают величину изображаемого явления размером своей площади. Для получения диаграмм рассматриваемого типа используют разнообразные геометрические фигуры: квадрат, круг, реже прямоугольник. Известно, что площадь квадрата равна квадрату его стороны, а площадь круга определяется пропорционально квадрату его радиуса, поэтому для построения диаграмм необходимо сначала из сравниваемых величин извлечь квадратный корень. Затем на базе полученных результатов нужно определить сторону квадрата или радиус круга соответственно принятому масштабу.

Наиболее выразительным и легко воспринимаемым является способ построения диаграмм сравнения в виде фигур-знаков. В этом случае статистические совокупности изображаются не геометрическими фигурами, а символами, или знаками, воспроизводящими в какой-то степени внешний образ статистических данных. Достоинство такого способа графического изображения заключается в высокой степени наглядности, в получении подобного отображения, отражающего содержание сравниваемых совокупностей.

Важнейший признак любой диаграммы - масштаб, поэтому, чтобы правильно построить фигурную диаграмму, необходимо определить единицу счета. В качестве последней принимается отдельная фигура (символ), которой условно присваивается конкретное численное значение. А исследуемая статистическая величина изображается отдельным количеством одинаковых по размеру фигур, последовательно располагающихся на рисунке. Однако в большинстве случаев не удается изобразить статистический показатель целым количеством фигур. Последнюю из них приходится делить на части, так как по масштабу один знак является слишком крупной единицей измерения. Обычно эта часть определяется на глаз. Сложность точного ее определения является недостатком фигурных диаграмм. Однако большая точность представления статистических данных не преследуется, и результаты получаются вполне удовлетворительными. Как правило, фигурные диаграммы широко используются для популяризации статистических данных и рекламы.

Основное строение структурных диаграмм заключается в графическом представлении состава статистических совокупностей, характеризующихся как соотношение различных частей каждой из совокупностей. Состав статистической совокупности графически может быть представлен с помощью как абсолютных, так и относительных показателей.

В первом случае не только размеры частей, но и размер графика в целом определяются статистическими величинами и изменяются в соответствии с изменениями последних. Во втором - размер всего графика не меняется (так как сумма всех частей любой совокупности составляет 100 %), а меняются только размеры отдельных его частей. Графическое изображение состава совокупности по абсолютным и относительным показателям способствует проведению более глубокого анализа и позволяет проводить международные сопоставления и сравнения социально-экономических явлений.

Наиболее распространенным способом графического изображения структуры статистических совокупностей является секторная диаграмма, которая считается основной формой диаграммы такого назначения. Это объясняется тем, что идея целого хорошо и наглядно выражается кругом, который отображает всю совокупность. Удельный вес каждой части совокупности в секторной диаграмме характеризуется величиной центрального угла (угол между радиусами круга). Сумма всех углов круга, равная 360°, приравнивается к 100 %, а следовательно, 1 % принимается равным 3,6°. Применение секторных диаграмм позволяет не только графически изобразить структуру совокупности и ее изменение, но и показать динамику численности этой совокупности. Для этого строятся круги, пропорциональные объему изучаемого признака, а затем секторами выделяются его отдельные части. Рассмотренный способ графического изображения структуры совокупности имеет как достоинства, так и недостатки. Так, секторная диаграмма сохраняет наглядность и выразительность лишь при небольшом числе частей совокупности, в противном случае ее применение малоэффективно. Кроме того, наглядность секторной диаграммы снижается при незначительных изменениях структуры изображаемых совокупностей: она выше, если существеннее различия сравниваемых структур.

Преимуществом столбиковых и ленточных структурных диаграмм по сравнению с секторными являются их большая емкость, возможность отразить более широкий объем полезной информации. Однако эти диаграммы более эффективны при малых различиях в структуре изучаемой совокупности.

Для изображения и вынесения суждений о развитии явления во времени строятся диаграммы динамики. Для наглядного изображения явлений в рядах динамики используются диаграммы столбиковые, ленточные, квадратные, круговые, линейные, радиальные и др. Выбор вида диаграмм зависит в основном от особенностей исходных данных, цели исследования. Например, если имеется ряд динамики с несколькими неравноотстоящими уровнями во времени (1914, 1949, 1980, 1985, 1996, 2003 гг.), то часто для наглядности используют столбиковые, квадратные или круговые диаграммы. Они зрительно впечатляют, хорошо запоминаются, но не пригодны для отображения большого числа уровней, так как громоздки.

Когда число уровней в ряду динамики велико, целесообразно применять линейныге диаграммы, которые воспроизводят непрерывность процесса развития в виде непрерывной ломаной линии. Кроме того, линейные диаграммы удобно использовать, если:

  • целью исследования является изображение общей тенденции и характера развития явления;
  • на одном графике необходимо изобразить несколько динамических рядов с целью их сравнения;
  • наиболее существенным является сопоставление темпов роста, а не уровней.

Для построения линейных графиков применяют систему прямоугольных координат. Обычно по оси абсцисс откладывается время (годы, месяцы и т. д.), а по оси ординат - размеры изображаемых явлений или процессов. На оси ординат наносят масштабы. Особое внимание следует обратить на их выбор, так как от этого зависит общий вид графика. В данном графике необходимо соблюдать равновесие, пропорциональность между осями координат, так как нарушение равновесия между осями координат дает неправильное изображение развития явления. Если масштаб для шкалы на оси абсцисс очень растянут по сравнению с масштабом на оси ординат, то колебания в динамике явлений мало выделяются, и наоборот, увеличение масштаба по оси ординат по сравнению с масштабами на оси абсцисс дает резкие колебания. Равным периодам времени и размерам уровня должны соответствовать равные отрезки масштабной шкалы.

В статистической практике чаще всего применяются графические изображения с равномерными шкалами. По оси абсцисс они берутся пропорционально числу периодов времени, а по оси ординат - пропорционально самим уровням. Масштабом равномерной шкалы будет длина отрезка, принятого за единицу. Нередко на одном линейном графике приводится несколько кривых, которые дают сравнительную характеристику динамики различных показателей или одного и того же показателя. Однако на одном графике не следует помещать более трех-четырех кривых, так как большое их количество неизбежно осложняет чертеж и линейная диаграмма теряет наглядность. В некоторых случаях нанесение на один график двух кривых дает возможность одновременно изобразить динамику третьего показателя, если он является разностью первых двух. Например, при изображении динамики рождаемости и смертности площадь между двумя кривыми показывает величину естественного прироста или естественной убыли населения.

Иногда необходимо сравнить на графике динамику двух показателей, имеющих различные единицы измерения. В таких случаях понадобится не одна, а две масштабные шкалы. Одну из них размещают справа, другую - слева. Однако такое сравнение кривых не дает достаточно полной картины динамики этих показателей, так как масштабы произвольны, поэтому сравнение динамики уровня двух разнородных показателей следует осуществлять на основе использования одного масштаба после преобразования абсолютных величин в относительные.

Линейные диаграммы с линейной шкалой имеют один недостаток, снижающий их познавательную ценность: равномерная шкала позволяет измерять и сравнивать только отраженные на диаграмме абсолютные приросты или уменьшения показателей на протяжении исследуемого периода. Однако при изучении динамики важно знать относительные изменения исследуемых показателей по сравнению с достигнутым уровнем или темпы их изменения. Именно относительные изменения экономических показателей динамики искажаются при их изображении на координатной диаграмме с равномерной вертикальной шкалой. Кроме того, в обычных координатах теряет всякую наглядность и даже становится невозможным изображение рядов динамики с резко изменяющимися уровнями, которые обычно имеют место в динамических рядах за длительный период времени. В этих случаях следует отказаться от равномерной шкалы и положить в основу графика полулогарифмическую систему.

Основная идея полулогарифмической системы состоит в том, что в ней равным линейным отрезкам соответствуют равные значения логарифмов чисел. Такой подход имеет преимущество: возможность уменьшения размеров больших чисел через их логарифмический эквивалент. Однако с масштабной шкалой в виде логарифмов график малодоступен для понимания. Необходимо рядом с логарифмами, обозначенными на масштабной шкале, проставить сами числа, характеризующие уровни изображаемого ряда динамики, которые соответствуют указанным числам логарифмов. Такого рода графики носят название графиков на полулогарифмической сетке. Полулогарифмической сеткой называется сетка, в которой на одной оси нанесен линейный масштаб, а на другой - логарифмический.

Динамику изображают и радиальныге диаграммыг, строящиеся в полярных координатах. Радиальные диаграммы преследуют цель наглядного изображения определенного ритмического движения во времени. Чаще всего эти диаграммы применяются для иллюстрации сезонных колебаний. Радиальные диаграммы разделяются на замкнутые и спиральные. По технике построения радиальные диаграммы отличаются друг от друга в зависимости от того, что взято в качестве пункта отсчета - центр круга или окружность. Замкнутыге диаграммыг отражают внутригодичный цикл динамики какого-либо одного года. Спиральныге диаграммы показывают внутригодичный цикл динамики за ряд лет. Построение замкнутых диаграмм сводится к следующему: вычерчивается круг, среднемесячный показатель приравнивается к радиусу этого круга. Затем весь круг делится на 12 частей, равных радиусу, которые на графике приводятся в виде тонких линий. Каждый радиус обозначает месяц, причем расположение месяцев аналогично циферблату часов: январь - в том месте, где на часах 1, февраль - где 2 и т. д. На каждом радиусе делается отметка в определенном месте согласно масштабу исходя из данных за соответствующий месяц. Если данные превышают среднегодовой уровень, отметка делается за пределами окружности на продолжении радиуса. Затем отметки различных месяцев соединяются отрезками.

Если же в качестве базы для отчета взят не центр круга, а окружность, то такие диаграммы называются спиральными. Построение спиральных диаграмм отличается от замкнутых тем, что в них декабрь одного года соединяется не с январем данного же года, а с январем следующего года. Это дает возможность изобразить весь ряд динамики в виде спирали. Особенно наглядна такая диаграмма, когда наряду с сезонными изменениями происходит неуклонный рост из года в год.

Статистические карты1 представляют собой вид графических изображений статистических данных на схематичной географической карте, характеризующих уровень или степень распространения того или иного явления на определенной территории. Средствами изображения территориального размещения являются штриховка, фоновая раскраска или геометрические фигуры. Различают картограммы и картодиаграммы.

Картограммы - это схематическая географическая карта, на которой штриховкой различной густоты, точками или окраской определенной степени насыщенности показывается сравнительная интенсивность какого-либо показателя в пределах каждой единицы нанесенного на карту территориального деления (например, плотность населения по областям или республикам , распределения районов по урожайности зерновых культур и т. п.). Картограммы делятся на фоновые и точечные. Картограмма фоновая - вид картограммы, на которой штриховкой различной густоты или окраской определенной степени насыщенности показывают интенсивность какого-либо показателя в пределах территориальной единицы. Картограмма точечная - вид картограммы, где уровень выбранного явления изображается с помощью точек. Точка изображает одну единицу в совокупности или некоторое их количество, показывая на географической карте плотность или частоту проявления определенного признака.

Фоновые картограммы, как правило, используются для изображения средних или относительных показателей, точечные - для объемных (количественных) показателей (численность населения, поголовье скота и т. д.).

Вторую большую группу статистических карт составляют картодиаграммы, представляющие собой сочетание диаграмм с географической картой. В качестве изобразительных знаков в картодиаграммах используются диаграммные фигуры (столбики, квадраты, круги, фигуры, полосы), которые размещаются на контуре географической карты. Картодиаграммы дают возможность географически отразить более сложные статистико-географические построения, чем картограммы. Среди картодиаграмм следует выделить картодиаграммы простого сравнения, графики пространственного перемещения, изолинии.

На картодиаграмме простого сравнения в отличие от обычной диаграммы диаграммные фигуры, изображающие величины исследуемого показателя, расположены не в ряд, как на обычной диаграмме, а разносятся по всей карте в соответствии с тем районом, областью или страной, которые они представляют. Элементы простейшей картодиаграммы можно обнаружить на политической карте, где города отличаются различными геометрическими фигурами в зависимости от числа жителей.

Изолинии - это линии равного значения какой-либо величины в ее распространении на поверхности, в частности на географической карте или графике. Изолиния отражает непрерывное изменение исследуемой величины в зависимости от двух других переменных и применяется при картографировании природных и социально-экономических явлений. Изолинии используются для получения количественных характеристик исследуемых величин и для анализа корреляционных связей между ними.

Статистическая группировка – это разделение единиц изучаемой совокупности на качественно однородные группы по значениям одного или нескольких признаков.

Задачи, решаемые с помощью метода группировок:

Выделение социально-экономических типов явлений;

Изучение структуры явления и структурных сдвигов, происходящих в нем;

Выявление связи и зависимости между явлениями;

В соответствии с этими задачами различают следующие виды группировок:

1. Типологическая - расчленение разнородной совокупности на отдельные качественно однородные группы и выявление на этой основе экономических типов явлений;

2. Структурная - группировка, которая предназначена для изучения состава однородной совокупности по какому-либо варьирующему признаку или нескольким признакам

3. Аналитическая - группировка, выявляющая взаимосвязи между изучаемыми признаками.

Особенностями аналитической группировки является:

а) единицы группируются по факторному признаку;

б) каждая группа характеризуется средними величинами результативного признака.

Примеры видов группировок:

1. Типологические

Таблица 1

Распределение пенсионеров РФ по видам пенсионного обеспечения (на конец года, тыс. чел.)

    Структурные

Таблица 2

Распределение населения РФ по величине среднедушевых денежных доходов (в процентах)

Все население

в том числе со среднедушевыми денежными доходами, руб. в месяц:

1500,1 – 2000,0

2000,1 – 3000,0

3000,1 – 4000,0

4000,1 – 5000,0

5000,1 – 7000,0

7000,1 – 12000,0

Свыше 12000,1

    Аналитические

Таблица 3

Распределение региона по численности занятых в экономике (данные условные)

№ группы

Группы регионов по численности занятых в экономике, тыс.чел.

Число регионов

Численность занятых в экономике, тыс. чел.

Валовой региональный продукт, млрд. руб.

в среднем на один регион

в среднем на один регион

Разновидностью типологической группировки является классификация.

Под классификацией в статистике понимается группировка явлений, каких-либо объектов по относительно однообразным и устойчивым признакам (например, классификация экономики по секторам). Классификации используются в качестве национальных и международных стандартов в определенный промежуток времени.

Построение группировки начинается с определения группировочного признака (основания группировки) .

Группировочный признак – это расчленение единиц изучаемой совокупности на качественно однородные группы по значениям одного или нескольких признаков.

Группировочный признак (основание группировки) делится на:

    Количественный - число групп зависит от степени вариации группировочного признака: чем она больше, тем больше можно образовать групп;

    Атрибутивный - число групп определяется числом градаций атрибутивного признака (например, группировка населения по полу предполагает только две группы).

Если в основание группировки положен один признак, то группировка называется простой , если несколько, то – сложной (комбинационная и многомерная).

Комбинационные группировки строятся путем разбиения группы на подгруппы в соответствии с дополнительными признаками.

Многомерные группировки формируются с помощью специальных алгоритмов, когда определяются скопления в N-мерном пространстве, где каждый объект – точка.

После того, как определено основание группировки, решается вопрос о количестве групп , на которые необходимо разбить изучаемую совокупность.

Число групп зависит от:

Задач исследования;

Группировочного признака;

Объёма совокупности;

Степени вариации группировочного признака.

Если основанием группировки служит количественный признак, то для определения количества групп (группировка с равными интервалами) можно воспользоваться формулой американского ученого Стерджесса .

Формула Стерджесса:

n =1+3,322 lgN

n – число групп;

N – число единиц совокупности.

Когда определено число групп, то следует установить интервалы группировки.

Интервал группировки – это значения варьирующего признака, лежащие в определенных границах.

Интервал имеет свою величину, верхнюю и нижнюю границы или хотя бы одну из них.

Нижняя граница интервала – это минимальное значение признака, верхняя граница – наибольшее значение признака в интервале.

Величина интервала (ширина) представляет собой разность между верхней и нижней границами интервала.

Виды интервалов группировки бывают:

    Равный - применяется в тех случаях, когда вариация признака происходит в сравнительно узких границах и носит более или менее равномерный характер (таблица 3.3);

    Неравный - применяется в тех случаях, когда размах вариации признака в совокупности велик и значения признака варьируют неравномерно. Неравные интервалы делятся на прогрессивно возрастающие, прогрессивно убывающие, произвольные и специализированные (таблица 3.2)

    Открытый - это интервал, у которого указана только одна граница: верхняя - у первого, нижняя – у последнего (таблица 3.2)

    Закрытый - это интервал, у которого имеются верхняя и нижняя границы (таблица 3.3)

При равных интервалах расчет величины интервала определяется по формуле:

h =(X max - X min )/ n (2)

где X max , X min - максимальное и минимальное значения признака в совокупности соответственно.

При определении величины интервала группировки следует учитывать следующие правила:

    если величина интервала, рассчитанная по формуле (2), имеет один знак до запятой (например, 0,7; 0,58; 2,359), то полученное значение следует округлить до десятых (в приведенном примере это будут значения: 0,7; 0,6; 2,4);

    если величина интервала, рассчитанная по формуле (2), имеет две значащие цифры до запятой и несколько после запятой (например, 11,2; 23,385), то это значение следует округлить до целого числа (в указанном примере это будут значения: 11; 23);

    если величина интервала, рассчитанная по формуле (2), представляет собой трехзначное число (например, 123; 757), то это значение целесообразно округлить до ближайшего число, кратного 10 (в приведенном примере это будут значения: 120; 760);

    если интервалы групп закрытые и основанием группировки служит непрерывный признак, то нижняя граница формируется по принципу «включительно», а верхняя – по принципу «исключительно» (например, если нижняя граница i - группы равна 50, а верхняя – 100, то единица совокупности со значением признака равным 100, попадет в группу i+1) (пример 3);

    если значение признака совпадает с границами интервалов, то можно использовать открытые интервалы, введя слова «до», «менее» и «более» (таблица 3.2);

    если в основании группировки лежит дискретный признак, то верхняя граница i-го интервала равна нижней границе i+1-го интервала, увеличенной на 1.

Сводка статистических данных

Сводка и группировка материалов статистического наблюдения

Статистическая сводка - это научно организованная обработка материалов статистического наблюдения, включающая систематизацию, группировку данных, составление таблиц, подсчет групповых и общих итогов, расчет средних и относительных показателей.

Статистическая сводка осуществляется по специально составленной программе, в которой указываются методы сбора и обработки информации. Содержание сводки чаще всего отражается в системе обоснованных макетов таблиц. Результаты сводки позволяют достаточно полно охарактеризовать весь изучаемый объект и отдельные его части с помощью многочисленных показателей.

Выполнение статистической сводки состоит из следующих этапов:

1) Определение задачи сводки в соответствии с целью экономико-статистического исследования.

2) Построение необходимых группировок.

3) Проверка достоверности и полноты собранной информации. Расчет показателей, необходимых для характеристики изучаемого явления и формулировки выводов.

Если по изучаемой совокупности производится только подсчет общих итогов без какой-либо предварительной систематизации собранного материала, то сводка называется простой.

Центральное место в статистической сводке отводится группировке. Группировка является важнейшим методом статистического иссле­дования, позволяющим уловить переход количественных изменений в качественные, выявить закономерности развития изучаемого явления или процесса.

Статистическая группировка - это процесс образования однород­ных групп на основе расчленения статистической совокупности на части (группы, подгруппы) по существенным для единиц этой совокупнос­ти признакам.

В экономико-статистических исследованиях применяются группировки трех видов:

1) типологические группировки;

2) структурные группировки;

3) аналитические группировки.

Типологическая группировка используется для выявления и характеристики социально-экономических типов явлений. Примером такой группировки может служить деление совокупности предприятий на ча­сти в соответствии с их формой собственности, деление экономически активного населения региона на занятых и безработных.

Структурная группировка позволяет охарактеризовать состав явления, процесса или совокупности. Например, группировка населения по полу, возрасту или душевому доходу. Анализ результатов таких груп­пировок, выполненных за несколько периодов, позволяет оценить изменение структуры явлений во времени, что отражает важнейшие закономерности их развития.

Аналитическая группировка используется для установления взаимо­связи между отдельными явлениями и их признаками. В основе аналитической группировки лежит факторный признак, и каждая выделенная группа характеризуется средними значениями результативного призна­ка. Например, с помощью группировки предприятий по фондовооруженности труда (факторный признак) можно установить наличие зави­симости от него производительности труда (результативного признака): в группах с более высокой фондовооруженностью труда будет наблюдаться и более высокая его производительность (хотя по отдельным предприятиям это соотношение может и не наблюдаться).



Признак , на основе которого производится деление единиц совокупности на группы, называется группировочным признаком или основанием группировки.

Если группы образуются по одному признаку, то группировка называется простой (например, деление населения на возрастные группы). Группировка по двум или нескольким признакам называется сложной или комбинационной. Например, возрастные группы населения делятся на подгруппы по полу и т.д. Как правило, даже при достаточно большом объеме совокупности при построении статистических группировок огра­ничиваются двумя-четырьмя группировочными признаками.

Выбор группировочного признака сравнительно прост, если группировка производится по атрибутивному признаку. Если атрибутивный признак имеет мало разновидностей, то количество групп определяется числом этих разновидностей. Например, группировки населения по полу или социальному положению.

В случае, если атрибутивные (качественные) признаки имеют большое количество разновидностей, разрабатываются классификации разновидностей.

Классификации - это особый вид группировок, представляющих собой устойчивую номенклатуру классов и групп, образованных на основе сходства и различия единиц изучаемой совокупности. Классификации выступают в качестве статистического стандарта, устанавливаемого на определенный период. Например, ОКВЭД - Общероссийский классификатор видов экономической деятельности, продукции и услуг, классификатор основных фондов и т.д.

количественному дискретному признаку, то число групп соответствует числу вариант (значений признака), если оно не очень велико. Например, распределение рабочих по тарифному разряду или студентов по оценкам, полученным на экзамене. При большом числе вариант дискретного признака их объединяют в группы.

Когда группировка производится поколичественному непрерывному признаку, весь диапазон его изменения разбивается на интервалы «от - до». Например, при группировке предприятий по объему производства: 1-й интервал - (100-200 тыс. рублей), 2-й интервал - (200-300 тыс. рублей) и т.д., последний интервал - (800 тыс. рублей - 1 млн. рублей).

Интервал, в котором указана лишь одна граница, называется открытым. Интервал, имеющий верхнюю и нижнюю границу, называется закрытым. Длина интервала - это разница между его верхней и нижней гра­ницей. Интервалы бывают равные, неравные и специализированные. Неравные интервалы применяются в аналитических группировках для того, чтобы число единиц совокупности в группе было достаточно вели­ко, и чтобы они были приблизительно одинаково заполнены. Специали­зированные интервалы используются в типологических группировках. Границы устанавливаются там, где намечается переход от одного качества к другому.

Величина интервала и число групп при выполнении группировки по непрерывному количественному признаку определяется, исходя из целей исследования, особенностей изучаемого признака, объема и качества имеющейся информации. Количество групп и длина интервала группировки взаимосвязаны: чем больше образовано групп, тем меньше длина интервалов и наоборот.

Ориентировочно число групп с равными интервалами можно определить по формуле американского ученого Стерджесса:

где N - объем совокупности.

Логари́фм числа b по основанию a определяется как показатель степени, в которую надо возвести основание a , чтобы получить число b . Обозначение: .

Формула (3.1) устанавливает следующие соотношения между числом групп (n) и объемом статистической совокупности (N), на базе которой строится группировка:

N 15–24 25–44 45–89 90–179 180–359 360–719
n

Соответственно, формула Стерджесса для определения длины интервала группировки по непрерывному количественному признаку выглядит следующим образом:

где и соответственно, наибольшее и наименьшее значение группировочного признака.

Все сказанное позволяет выделить следующие основные стадии в последовательности выполнения статистических группировок:

1. Обоснование группировочного признака и показателей, с помощью которых предполагается характеризовать выделенные группы.

2. Определение числа групп и длины интервалов.

3. Составление макета групповой вспомогательной таблицы и выполнение необходимых расчетов.

4. Составление макета итоговой таблицы и расчет необходимых показа­телей.

5. Анализ полученных результатов и формулировка выводов.

10. Виды группировок

В зависимости от степени сложности изучаемого явления и от поставленных задач статистические группировки могут выполняться по одному или нескольким группировочным признакам.

Группировка называется простой (одномерной) , если однородные группы формируются по одному признаку одновременно.

Если однородные группы образуются по двум и более признакам, то группировка называется сложной.

В классе одномерных группировок выделяют следующие типы:

структурные – предназначены для выявления состава изучаемого явления;

типологические – предназначены для выделения в статистической совокупности различных социально-экономических типов явлений;

аналитические (факторные) – используются для изучения связей и зависимости между варьирующими признаками.

Структурные группировки

Структурные группировки используются для изучения внутреннего строения статистической совокупности и характеристики структурных сдвигов. Они дают информацию о текущем состоянии массовых явлений и применяются в целях оперативного управления.

Структурная группировка выполняется в несколько этапов:

выбор группировочного признака;

определение необходимого числа групп;

определение параметров групп;

распределение единиц наблюдения по выделенным группам;

расчет структурных характеристик;

формулировка выводов.

Выбор группировочного признака осуществляется в соответствии с целями статистического исследования. В качестве группировочного обычно выступает существенный признак. Обязательным условием выполнения любой группировки, в том числе и структурной является упорядочение статистической совокупности по значениям группировочного признака.

Определение необходимого числа групп . Число групп должно быть достаточным для объективного представления изучаемой совокупности. При большом числе групп различия между ними становятся малозаметными, а в самих группах в виду их малой наполняемости перестает действовать закон больших чисел и возможно проявления случайности. При малом же их числе в одну группу могут попасть статистические единицы с существенно различающимися значениями признака.

На количество выделяемых групп влияют следующие факторы:

уровень колеблемости группировочного признак - чем значительнее вариация признака, тем большее количество групп необходимо выделять при прочих равных условиях;

размер изучаемой статистической совокупности - чем больше размер исследуемой совокупности, тем большее количество групп необходимо выделять.

Выделенные группы должны быть достаточно заполненными. Наличие пустых групп или малое число статистических единиц в них свидетельствуют о неправильном определении их числа.

Ориентировочно число групп можно определить использую эмпирическую зависимость, называемую формулой Стерджесса:

m ≈ 1 + 3,322 × lg N ,

где m – количество групп;

N - число единиц статистической совокупности.

Зависимость Стерджесса дает хорошие результаты, если совокупность состоит из большого числа единиц, распределение близкое к нормальному, и при этом используются равные интервалы.

Существует еще один способ определения количества выделяемых групп, он связан с применением среднеквадратичного отклонения равными и неравными σ : если ширина интервала равна 0,5σ , то выделяется 12 групп, если 2/3σ ,то 9 групп, если σ – то 6 групп.

В каждой выделенной группе рассчитываются следующие параметры:

верхняя граница интервала x i в

нижняя граница интервала x i н

ширина интервала а i ;

середина интервала b i .

Нижней границей интервала x i н называется наименьшее значение признака в группе.

Верхней границей интервала x i в называется наибольшее значение признака в группе.

Интервалы группировки бывают равными и неравными (прогрессивно возрастающими, прогрессивно убывающими, произвольными, специализированными).

Если вариация признака проявляется в сравнительно узких границах, и распределение статистических единиц носит достаточно равномерный характер, то строят группировку с равными интервалами.

Для равноинтервальной группировки ширина интервала а i определяется по формуле:

а i = (X max – X min ) / m = R / m

где R – размах вариации,

R = X max - X min

При определении размаха вариации R из наблюдения исключаются аномальные значения признака. Полученное значение ширины интервала а i округляется в бóльшую сторону. На основе рассчитанной ширины интервала а i последовательно определяется границы интервалов x i н и x i в .

Определение границ начинается с первой группы. Ее нижняя граница принимается равной минимальному значению признака в совокупности, т. е. х 1 н min , верхняя граница определяется как x 1 в = х 1 н + а i

Для второй группы нижняя граница принимается равной верхней границе первой группы, т. е. x 2 н 1 в , верхняя определяется как x 2 в = х 2 н + а i и так далее.

В целом границы интервалов определяются формулами:

x i н = x i -1 в .

x i в = x i н + а i

Середина интервала (центральная варианта) b i определяется как полусумма верхней и нижней границ, т.е. по формуле:

b i = ( x i в + x i в )/2

Параметр середина интервала используется при расчете обобщающих характеристик изучаемой совокупности. Достаточно часто при выполнении группировки используются открытые интервалы. В открытых интервалах указывается только одна граница: верхняя - у последнего интервала, нижняя – у первого.

Для закрытия таких интервалов необходимо предварительно определить их ширину. Проблема ширины открытых интервалов решается следующим образом:

    при равноинтервальной группировке она есть величина постоянная;

    при неравноинтервальной - предварительно определяется закономерность изменения ширины интервала для некрайних групп, выявленная закономерность позволяет определить ширину соответствующего интервала и рассчитать недостающую границу.

Распределение единиц совокупности по группам.

Основной задачей данного этапа является подсчет числа единиц, попавших в каждую из выделенных групп n i .

При распределении единиц наблюдения по выделенным группам, особенно если группировочный признак является непрерывным, имеет место неопределенность: к какой группе относить единицы со значениями признака, совпадающими с границами интервалов? Для устранения неопределенности используют принцип единообразия – такие единицы включаются в группу, в которой нижняя граница совпадает со значением признака.

Например , имеются группы предприятий по объему производства, млн. руб.: 400 – 450; 450 – 500; 500 – 550; 550 – 600; 600 – 650.

К какой группе следует отнести предприятия с объемом производства 500млн. руб.? В соответствии с принципом единообразия - ко второй группе.

Расчет структурных характеристик.

Расчет заключается в определении для каждой группы удельного веса (доли) ее единиц в общем объеме статистической совокупности. Как и любая относительная величина этот показатель может быть определен в виде коэффициентов:

d i = n i / N

или в виде процентов

d i = ( n i / N ) ×100%

Рассчитав такие доли для всех групп, мы получаем структуру изучаемой статистической совокупности, равную полному набору долей, т.е. сумма d i = 1

или

сумма d i = 100%

На основе анализа показателей структуры делаются соответствующие выводы.

Формулировка выводов о составе совокупности

Для структурных группировок в выводах отражаются два положения:

Какие значения признака встречаются в совокупности наиболее часто, какие наиболее редко.

Каков характер изменения структуры в зависимости от изменения значения признака. С увеличением x доля может увеличиваться, либо уменьшаться. Это довольно типично для экономических показателей.

Выводы должны быть сделаны обязательно, иначе пропадает смысл группировки. Данные структурных группировок обычно представляются в форме соответствующей таблицы.

Типологическая группировка

Ее цель состоит в изучении распространенности различных типов экономических явлений в статистической совокупности. Типологические группировки применяются, как правило, к неоднородной совокупности и осуществляются посредством сложных неравноинтервальных группировок.

Результатом типологических группировок является разделение совокупности на классы, социально- экономические типы, однородные группы единиц.

По своей сути типологическая группировка представляет собой группировку-классификатор. Такие группировки часто основываются на устойчивом перечне групп, не меняющихся или меняющихся незначительно во времени.

Примером такой группировки является группировка предприятий по форме собственности (государственная, муниципальная, частная, смешанная) или группировка секторов экономики.

При выполнении типологических группировок важно правильно выбрать основание группировки. Для этого необходимо предварительно выявить возможные типы явления на основе анализа сущности и закономерностей его развития. Число групп и их параметры устанавливаются неформально на основе выделенных качественных закономерностей, часто с привлечением количественных признаков.

Аналитические группировки

Аналитические группировки предназначены для выявления связи между изучаемыми признаками. Они позволяют выявить наличие и направление связи, а также измерить ее тесноту и силу.

Все исследуемые признаки в этом случае делятся на две группы:

    факторные

    результативные.

Взаимосвязь между ними проявляется в том, что с изменением среднего значения факторного признака систематически изменяется среднее значение результативного признака.

Сложные группировки

К сложным группировкам относятся группировки, выполняемые по двум и более основаниям. Сложные группировки делятся на-

    комбинационные

    многомерные.

Комбинационные группировки выполнятся по нескольким признакам последовательно. Последовательность устанавливается исходя из логики взаимосвязи показателей. Как правило, группировку начинают с атрибутивного признака. При комбинационной группировке совокупность логически последовательно разбивается на однородные части по отдельным признакам: на группы - по одному признаку, затем внутри каждой группы по второму признаку - на подгруппы и т.д. Такие группировки предназначены для более глубокого анализа изучаемого явления, позволяют выявить и сравнить различия и связи между исследуемыми признаками, которые невозможно установить на основе изолированных группировок по каждому из исследуемых признаков. Однако следует иметь в виду, что при изучении влияния большого числа признаков применение комбинационных группировок невозможно, так как это приводит к дроблению информации, а значит, к затушевыванию проявлений закономерности. Даже при наличии больших объемов информации приходится ограничиваться двумя – четырьмя признаками.

Комбинационная группировка по двум признакам (X, Y ) оформляется в виде шахматной таблицы, в которой значения одного признака X откладываются по строкам, а значения второго признака Y – по столбцам. На пересечении j –ого столбца и i -ой строки (в теле таблицы) находятся частоты совместного проявления значения признака Y в j- ом столбце и значения признака X в i -ой строке.

К многомерным группировкам относятся группировки, выполненные по нескольким группировочным признакам одновременно.

Цель многомерных группировок – классификация данных на основе множества признаков, то есть выделение групп статистических единиц, однородных по нескольким признакам одновременно.

В процессе такой группировки решаются, например, задачи типизации – выделяются самостоятельные экономические или социальные типы явлений.

Так, приемами многомерной классификации можно всю совокупность промышленных предприятий разбить на «мелкие», «средние» и «крупные», используя следующие признаки: численность промышленно- производственного персонала, объем продукции, стоимость ОПФ, потребление материальных ресурсов и т.д. Можно выделить типы предприятий по финансовому положению на основе таких показателей как размер прибыли, уровень рентабельности производства, уровень капитализации, уровень ликвидности ценных бумаг и т.д.

В психологии многомерные группировки используются для выделения типов людей по степени их профессиональной пригодности, в медицине – для диагностики болезней на основе множества симптомов.

При выполнении многомерных группировок могут быть использованы два основных подхода:

Первый заключается в том, что рассчитывается обобщающий показатель по совокупности группировочных признаков и проводится простая группировка по этому обобщающему показателю.

Второй подход состоит в использовании методом кластерного анализа.

Основой статистической группировки является группировочный признак - признак, по которому происходит разделение единиц совокупности на отдельные группы. От выбора группировочного признака полностью зависит правильность построения всей группировки. В качестве основания группировки необходимо использовать наиболее существенные признаки, имеющие четкое теоретическое обоснование. Группировочный признак должен в полной мере передавать специфику исследуемых социально-экономических явлений и процессов (рис. 3.2).

Рис. 3.2. Классификация видов группировочного признака

Основанием группировки могут служить две различные по форме выражения группы признаков - атрибутивные и количественные. Первые передают качественное состояние единицы наблюдения, вторые - количественное, числовое. Например, группировка населения по национальности является атрибутивной, по возрасту - количественной.

Статистическая группировка может быть разделена на виды по ряду характерных признаков: решаемые задачи, число группировочных признаков и отношения между ними, состояние исходных данных (рис. 3.3).


Рис. 3.3. Классификация видов статистической группировки


По решаемым задачам группировки делятся на типологические, структурные и аналитические. Особым видом является ряд распределения.

Типологическая группировка - это вид статистической группировки, в процессе которой происходит разделение разнородной совокупности на однородные группы с целью выявления типов социально-экономических явлений и процессов. Типологические группировки позволяют детально изучить процесс развития искомого явления или процесса, оценить силу воздействия различных факторов на изменения в его состоянии. К примеру, все население может быть разделено на возрастные группы: дети, молодежь, лица зрелого возраста, пожилые люди и т.п. Однако конкретные числовые характеристики, определяющие рамки каждой группы, со временем нередко меняются, создавая возможность принадлежности одной единицы наблюдения к различным типам.

Структурная группировка - это вид статистической группировки, в процессе которой происходит разделение однородной совокупности на однородные группы с целью выявления структуры социально-экономических явлений и процессов. Например, структура населения может быть изучена по национальности и месту проживания, оценена по концентрации живущих на той или иной территории, а анализ группировки за ряд лет позволит охарактеризовать структурные сдвиги по исследуемому признаку.

Аналитическая группировка - это вид статистической группировки, выявляющей зависимости между взаимодействующими признаками.

Статистическая теория разделяет признаки по функциям, выполняемым во взаимосвязи, на факторные и результативные. Факторный признак - это признак, под воздействием которого меняется другой признак - результативный.

Основой такой группировки является признак-фактор, по результативному признаку подсчитывается его среднее значение в каждой из выделенных групп. Сравнение изменений значений обоих признаков характеризует связь между ними. Если с увеличением значения факторного признака увеличивается значение результативного, то говорят о прямой связи между признаками, в противном случае - об обратной.

При исследовании воздействия на результат нескольких факторов строится многофакторная группировка. Ее задача заключается в выделении профилирующего факторного признака, оказывающего наибольшее влияние на результат.

По числу группировочных признаков различают простую и сложную группировки. В основу простой группировки кладется один группировочный признак, в основу сложной - два признака и более. В свою очередь, сложная группировка может быть комбинационной или многомерной. Основание комбинационной группировки составляют от двух до четырех группировочных признаков, многомерной - любое число признаков свыше четырех.

Сложная группировка обеспечивает возможность детального изучения единицы наблюдения сразу по нескольким признакам. Основным правилом построения всех сложных группировок является первичное разделение единиц совокупности на группы по одному признаку, затем - на подгруппы по другому признаку и т.д. Предпочтительно первичное разделение на группы по атрибутивным признакам, вторичное - по количественным. Необходимым условием построения сложной группировки является большое число наблюдений для достижения достаточного количества единиц в каждой из подгрупп. В противном случае присутствует риск получения малообоснованных результатов.

По отношению между признаками сложные группировки бывают иерархические и неиерархические. При иерархической группировке значения второго признака определяются областью значений первого. При неиерархической группировке значения второго признака не зависят от значений первого.

В процессе экономико-статистического исследования нередко возникает необходимость анализа и сравнения общественных явлений и процессов в конкретных территориальных границах. Для этого используется пространственная группировка - группировка, основанная на географическом признаке.

Группировка может быть построена по взаимоисключающему характеру признака, т.е. по признаку, которым одни единицы совокупности обладают, а другие - нет. В теории статистики такой признак называется альтернативным . Типичным примером является группировка населения по полу.



Похожие статьи