Квадрат стандартного відхилення. Оцінка дисперсії, середньоквадратичне відхилення. Вибірка може бути

Визначення

Середньоквадратичне відхилення ( англ. Standard Deviation, SD) є показником, який використовується в теорії ймовірності та математичної статистики для оцінки ступеня розсіювання випадкової величини щодо її математичного очікування. В інвестуванні стандартне відхилення прибутковості цінних паперів чи портфеля використовується з метою оцінки міри ризику. Що ступінь розсіювання прибутковості цінного паперу щодо очікуваного прибутковості (математичне очікування прибутковості), то вище ризик інвестування, і навпаки.

Середньоквадратичне відхилення зазвичай позначається грецькою літерою σ (сигма), а стандартне відхилення латинською літерою S або як Std(X), де X – випадкова величина.

Формула

Справжнє значення середньоквадратичного відхилення

Якщо відомий точний розподіл дискретної випадкової величини, а саме, відомо її значення при кожному результаті і може бути оцінена ймовірність кожного результату, формула розрахунку середньоквадратичного відхилення буде виглядати наступним чином.

Де X i – значення випадкової величини X за i-го результату; M(X) математичне очікування випадкової величини X; p i - Імовірність i-го результату; N – кількість можливих наслідків.

При цьому математичне очікування випадкової величини розраховується за такою формулою:

Стандартне відхилення генеральної сукупності

Насправді замість точного розподіл випадкової величини зазвичай доступна лише вибірка даних. У цьому випадку розраховується оцінне значення середньоквадратичного відхилення, яке в цьому випадку називають стандартним відхиленням (S). Якщо оцінка ґрунтується на всій генеральній сукупності даних, необхідно використати таку формулу.

Де X i - i-е значення випадкової величини X; X – середньоарифметична генеральна сукупність; N – обсяг генеральної сукупності.

Стандартне відхилення вибірки

Якщо використовується не вся генеральна сукупність даних, а вибірка з неї, то формула розрахунку стандартного відхилення ґрунтується на незміщеній оцінці дисперсії.

Де X i - i-е значення випадкової величини X; X - середньоарифметичне вибірки; N – обсяг вибірки.

Приклади розрахунку

Приклад 1

Портфельний менеджер має оцінити ризики інвестування в акції двох компаній А та Б. При цьому він розглядає 5 сценаріїв розвитку подій, інформація щодо яких представлена ​​в таблиці.

Оскільки ми знаємо точне розподіл прибутковості кожної з акцій, ми можемо розрахувати справжнє значення середньоквадратичного відхилення прибутковості кожної з них.

Крок 1.Розрахуємо математичне очікування доходності кожної з акцій.

M(А) = -5%×0,02+6%×0,25+15%×0,40+24%×0,30+34%×0,03 = 15,62%

M(Б) = -18%×0,02+2%×0,25+16%×0,40+27%×0,30+36%×0,03 = 22,14%

Крок 2Підставимо отримані дані у першу формулу.

Як ми можемо бачити, акції Компанії А характеризуються меншим рівнем ризику, оскільки вони нижчі від середньоквадратичного відхилення прибутковості. Слід зазначити, як і очікувана дохідність вони нижчі, ніж в акцій Компанії Б.

Приклад 2

Аналітик має у своєму розпорядженні дані про прибутковість двох цінних паперів за останні 5 років, які представлені в таблиці.

Оскільки точний розподіл прибутковості невідомий, а в розпорядженні аналітика є лише вибірка з генеральної сукупності даних, ми можемо розрахувати стандартне відхилення вибірки на підставі незміщеної дисперсії.

Крок 1.Розрахуємо очікувану прибутковість для кожного цінного паперу як середньоарифметичну вибірку.

X А = (7 + 15 + 2 – 5 + 6) ÷ 5 = 5%

X Б = (3 – 2 + 12 + 4 +8) ÷ 5 = 5%

Крок 2Розрахуємо стандартне відхилення прибутковості кожної з цінних паперів за формулою для вибірки з генеральної сукупності даних.

Слід зазначити, що обидві цінні папери мають рівну очікувану прибутковість 5%. При цьому стандартне відхилення прибутковості у цінного паперу Б нижче, що за інших рівних робить його більш привабливим об'єктом інвестування внаслідок кращого профілю ризик-прибутковість.

Стандартне відхилення в Excel

В Excel передбачено дві функції для розрахунку стандартного відхилення вибірки та генеральної сукупності.

Для вибірки скористайтесь функцією «СТАНДОТКЛОН.В»:

  1. У діапазоні осередків B1:F1
  2. Виберіть вихідний осередок B2.
  3. fx у спливаючому вікні « Вставка функції" Оберіть категорію " Повний алфавітний список» та виберіть функцію « СТАНДОТКЛОН.».
  4. В полі " Число1» виберіть діапазон осередків B1:F1, поле « Число2OK».

Для генеральної сукупності використовується функція "СТАНДОТКЛОН.Г":

  1. У діапазоні осередків B1:F1введено значення випадкової величини X.
  2. Виберіть вихідний осередок B2.
  3. У командному рядку натисніть кнопку fx у спливаючому вікні « Вставка функції" Оберіть категорію " Повний алфавітний список» та виберіть функцію « СТАНДОТКЛОН.Г».
  4. В полі " Число1» виберіть діапазон осередків B1:F1, поле « Число2» залиште порожнім і натисніть кнопку « OK».

Інтерпретація

В інвестуванні стандартне відхилення прибутковості використовується як міра волатильності. Що його значення, то вище ризик, пов'язані з інвестуванням у цей актив, і навпаки. При інших рівних параметрах, перевагу слід віддавати активу, у якого цей показник буде мінімальним.

Дисперсія- це середня арифметична квадратів відхилень кожного значення ознаки від загальної середньої. Залежно від вихідних даних дисперсія може бути незваженою (простою) або зваженою.

Дисперсія розраховується за такими формулами:

· Для несгрупованих даних

· Для згрупованих даних

Порядок розрахунку дисперсії зважену:

1. визначають середню арифметичну зважену

2. визначаються відхилення варіант від середньої

3. зводять у квадрат відхилення кожної варіанти від середньої

4. множать квадрати відхилень на ваги (частоти)

5. підсумовують отримані твори

6. отриману суму ділять на суму ваг

Формула для визначення дисперсії може бути перетворена на таку формулу:

Проста

Порядок розрахунку дисперсії простий:

1. визначають середню арифметичну

2. зводять у квадрат середню арифметичну

3. зводять у квадрат кожну варіанту ряду

4. знаходимо суму квадратів варіант

5. ділять суму квадратів варіант з їхньої число, тобто. визначають середній квадрат

6. визначають різницю між середнім квадратом ознаки та квадратом середньої

Також формула для визначення зваженої дисперсії може бути перетворена в наступну формулу:

тобто. дисперсія дорівнює різниці середньої з квадратів значень ознаки та квадрата середньої арифметичної. При користуванні перетвореною формулою виключається додаткова процедура розрахунку відхилень індивідуальних значень ознаки від х і виключається помилка в розрахунку, пов'язана з округленням відхилень

Дисперсія має ряд властивостей, деякі з них дозволяють спростити її обчислення:

1) дисперсія постійної величини дорівнює нулю;

2) якщо всі варіанти значень ознаки зменшити на те саме число, то дисперсія не зменшиться;

3) якщо всі варіанти значень ознаки зменшити в те саме число раз (раз), то дисперсія зменшиться в раз

Середнє квадратичне відхилення S- являє собою квадратний корінь з дисперсії:

· Для несгрупованих даних:

· для варіаційного ряду:

Розмах варіації, середнє лінійне та середнє квадратичне відхилення є іменованими величинами. Вони мають самі одиниці виміру, як і індивідуальні значення ознаки.

Дисперсія та середнє квадратичне відхилення найбільш широко застосовуваних показників варіації. Пояснюється це тим, що вони входять до більшості теорем теорії ймовірності, яка є фундаментом математичної статистики. Крім того, дисперсія може бути розкладена на складові елементи, що дозволяють оцінити вплив різних факторів, що зумовлюють варіацію ознаки.

Розрахунок показників варіації для банків, згрупованих за розміром прибутку, показано у таблиці.

Розмір прибутку, млн. руб. Число банків розрахункові показники
3,7 - 4,6 (-) 4,15 8,30 -1,935 3,870 7,489
4,6 - 5,5 5,05 20,20 - 1,035 4,140 4,285
5,5 - 6,4 5,95 35,70 - 0,135 0,810 0,109
6,4 - 7,3 6,85 34,25 +0,765 3,825 2,926
7,3 - 8,2 7,75 23,25 +1,665 4,995 8,317
Разом: 121,70 17,640 23,126

Середнє лінійне та середнє квадратичне відхилення показують на скільки в середньому коливається величина ознаки у одиниць та досліджуваної сукупності. Так, у даному випадкусередня величина коливання розміру прибутку становить: за середнім лінійним відхиленням 0,882 млн. руб.; за середнім квадратичним відхиленням - 1,075 млн. руб. Середнє квадратичне відхилення завжди більше середнього лінійного відхилення. Якщо розподіл ознаки, близький до нормального, між S і d існує взаємозв'язок: S=1,25d, або d=0,8S. Середнє квадратичне відхилення показує, як розташована основна маса одиниць сукупності щодо середньої арифметичної. Незалежно від форми розподілу 75 значень ознаки потрапляють в інтервал х 2S, а принаймні 89 всіх значень потрапляють в інтервал х 3S (теорема П.Л.Чебишева).

Одним із основних інструментів статистичного аналізу є розрахунок середнього квадратичного відхилення. Даний показник дозволяє зробити оцінку стандартного відхилення за вибіркою або генеральною сукупністю. Давайте дізнаємося, як використовувати формулу визначення середньоквадратичного відхилення в Excel.

Відразу визначимо, що являє собою середньоквадратичне відхилення і як виглядає його формула. Ця величина є коренем квадратним із середнього арифметичного числа квадратів різниці всіх величин ряду та їхнього середнього арифметичного. Існує тотожне найменування цього показника - стандартне відхилення. Обидві назви цілком рівнозначні.

Але, природно, що в Екселі користувачеві не доводиться це вираховувати, оскільки за нього робить програма. Давайте дізнаємося, як порахувати стандартне відхилення в Excel.

Розрахунок у Excel

Розрахувати вказану величину в Екселі можна за допомогою двох спеціальних функцій СТАНДОТКЛОН.(за вибірковою сукупністю) та СТАНДОТКЛОН.Г(за генеральною сукупністю). Принцип їхньої дії абсолютно однаковий, але викликати їх можна трьома способами, про які ми поговоримо нижче.

Спосіб 1: майстер функцій


Спосіб 2: вкладка "Формули"


Спосіб 3: ручне введення формули

Існує також спосіб, коли взагалі не потрібно буде викликати вікно аргументів. Для цього слід запровадити формулу вручну.


Як бачимо, механізм розрахунку середньоквадратичного відхилення в Excel дуже простий. Користувачеві потрібно лише ввести числа із сукупності або посилання на комірки, які їх містять. Усі розрахунки виконує сама програма. Набагато складніше усвідомити, що ж є показник, що розраховується, і як результати розрахунку можна застосувати на практиці. Але розуміння цього вже належить більше до сфери статистики, ніж навчання роботи з програмним забезпеченням.

Х i -випадкові (поточні) величини;

середнє значення випадкових величин за вибіркою, розраховується за такою формулою:

Отже, дисперсія – це середній квадрат відхилень . Тобто спочатку розраховується середнє значення, потім береться різниця між кожним вихідним та середнім значенням, зводиться у квадрат , Складається і потім ділиться на кількість значень в даній сукупності.

Різниця між окремим значенням та середньою відображає міру відхилення. У квадрат зводиться для того, щоб усі відхилення стали виключно позитивними числамиі щоб уникнути взаємознищення позитивних та негативних відхилень при їх підсумовуванні. Потім, маючи квадрати відхилень, ми просто розраховуємо середню арифметичну.

Розгадка магічного слова «дисперсія» полягає у цих трьох словах: середній – квадрат – відхилень.

Середнє квадратичне відхилення (СКО)

Витягуючи з дисперсії квадратний корінь, отримуємо так зване « середньоквадратичне відхилення".Зустрічаються назви "стандартне відхилення" або "сигма" (від назви грецької літери σ .). Формула середнього квадратичного відхилення має вигляд:

Отже, дисперсія – це сигма у квадраті, або – середнє квадратичне відхилення у квадраті.

Середньоквадратичне відхилення, очевидно, також характеризує міру розсіювання даних, але тепер (на відміну дисперсії) його можна порівнювати з вихідними даними, так як одиниці виміру у них однакові (це випливає з формули розрахунку). Розмах варіації – це різниця між крайніми значеннями. Середньоквадратичне відхилення як міра невизначеності також бере участь у багатьох статистичних розрахунках. З її допомогою встановлюють ступінь точності різних оцінок та прогнозів. Якщо варіація дуже велика, то стандартне відхилення теж вийде великим, отже, і прогноз буде неточним, що висловиться, наприклад, у дуже широких інтервалах довірчих.

Тому в методах статистичної обробки даних в оцінках об'єктів нерухомості залежно від необхідної точності поставленого завдання використовують правило двох або трьох сигм.

Для порівняння правила двох сигм та правила трьох сигм використовуємо формулу Лапласа:

Ф - Ф ,

де Ф(x) – функція Лапласа;



Мінімальне значення

β = максимальне значення

s = значення сигми (середнє квадратичне відхилення)

a = середнє значення

У цьому випадку використовується приватний вид формули Лапласа, коли межі α і β значень випадкової величини X одно відстоять від центру розподілу a = M(X) на деяку величину d: a = a-d, b = a+d. Або (1) Формула (1) визначає можливість заданого відхилення d випадкової величини X з нормальним законом розподілу від її математичного очікування М(X) = a. Якщо у формулі (1) прийняти послідовно d = 2s та d = 3s, то отримаємо: (2), (3).

Правило двох сигм

Майже вірогідно (з довірчою ймовірністю 0,954) можна стверджувати, що значення випадкової величини X з нормальним законом розподілу відхиляються від її математичного очікування M(X) = a на величину, не більшу 2s (двох середніх квадратичних відхилень). Довірчою ймовірністю (Pд) називають ймовірність подій, що умовно приймаються за достовірні (їх ймовірність близька до 1).

Проілюструємо правило двох сигм геометрично. На рис. 6 зображена крива Гауса з центром розподілу а. Площа, обмежена всією кривою та віссю Оx, дорівнює 1 (100%), а площа криволінійної трапеції між абсцисами а–2s та а+2s, згідно з правилом двох сигм, дорівнює 0,954 (95,4% від усієї площі). Площа заштрихованих ділянок дорівнює 1-0,954 = 0,046 (5% від всієї площі). Ці ділянки називають критичною областю значень випадкової величини. Значення випадкової величини, які у критичну область, малоймовірні і практично умовно приймаються за неможливі.

Імовірність умовно неможливих значень називають рівнем важливості випадкової величини. Рівень значущості пов'язаний із довірчою ймовірністю формулою:

де q – рівень значимості, виражений у відсотках.

Правило трьох сигм

При вирішенні питань, що вимагають більшої надійності, коли довірчу ймовірність (Pд) приймають рівною 0,997 (точніше - 0,9973), замість правила двох сигм, згідно з формулою (3), використовують правило трьох сигм.



Згідно правилу трьох сигмпри довірчій ймовірності 0,9973 критичною областю буде область значень ознаки поза інтервалом (а-3s, а+3s). Рівень значущості складає 0,27%.

Інакше кажучи, ймовірність те, що абсолютна величина відхилення перевищить потрійне середнє квадратичне відхилення, дуже мала, саме дорівнює 0,0027=1-0,9973. Це означає, що лише 0,27% випадків може статися. Такі події, з принципу неможливості малоймовірних подій, вважатимуться практично неможливими. Тобто. Вибірка високоточна.

У цьому полягає сутність правила трьох сигм:

Якщо випадкова величина розподілена нормально, то абсолютна величина її відхилення від математичного очікування вбирається у потрійного середнього квадратичного відхилення (СКО).

На практиці правило трьох сигм застосовують так: якщо розподіл досліджуваної випадкової величини невідомий, але умова, зазначена в наведеному правилі, виконується, тобто підстава припускати, що досліджувана величина розподілена нормально; в іншому випадку вона не розподілена нормально.

Рівень значимості приймають залежно від дозволеного ступеня ризику та поставленого завдання. Для оцінки нерухомості зазвичай приймається менш точна вибірка, дотримуючись правила двох сигм.

Найбільш досконалою характеристикою варіації є середнє квадратичне відкладення, яке називають стандартом (або стандартним відхиленням). Середнє квадратичне відхилення() дорівнює квадратному кореню із середнього квадрата відхилень окремих значень ознаки від середньої арифметичної:

Середнє квадратичне відхилення просте:

Середнє зважене квадратичне відхилення застосовується для згрупованих даних:

Між середнім квадратичним та середнім лінійним відхиленнями в умовах нормального розподілумає місце таке співвідношення: ~ 1,25.

Середнє квадратичне відхилення, будучи основною абсолютною мірою варіації, використовується щодо значень ординат кривої нормального розподілу, в розрахунках, пов'язаних з організацією вибіркового спостереження та встановленням точності вибіркових характеристик, і навіть в оцінці меж варіації ознаки в однорідної сукупності.

Дисперсія, її види, середньоквадратичне відхилення.

Дисперсія випадкової величини- міра розкиду цієї випадкової величини, тобто її відхилення від математичного очікування. У статистиці часто використовується позначення чи . Квадратний корінь з дисперсії називається середньоквадратичним відхиленням, стандартним відхиленням або стандартним розкидом.

Загальна дисперсія (σ 2) вимірює варіацію ознаки у всій сукупності під впливом всіх факторів, що зумовили цю варіацію. Разом з тим, завдяки методу угруповань можна виділити та виміряти варіацію, зумовлену групувальною ознакою, та варіацію, що виникає під впливом неврахованих факторів.

Міжгрупова дисперсія (σ 2 м.гр) характеризує систематичну варіацію, тобто відмінності у величині досліджуваної ознаки, що виникають під впливом ознаки - фактора, покладеного в основу угруповання.

Середньоквадратичне відхилення(Синоніми: середнє квадратичне відхилення, середньоквадратичне відхилення, квадратичне відхилення; близькі терміни: стандартне відхилення, стандартний розкид) - в теорії ймовірностей і статистиці найбільш поширений показник розсіювання значень випадкової величини щодо її математичного очікування. При обмежених масивах вибірок значень замість математичного очікування використовується середнє арифметичне сукупності вибірок.

Середньоквадратичне відхилення вимірюється в одиницях виміру самої випадкової величини і використовується при розрахунку стандартної помилки середнього арифметичного, при побудові довірчих інтервалів, при статистичній перевірці гіпотез, при вимірі лінійного взаємозв'язку між випадковими величинами. Визначається як квадратний корінь з дисперсії випадкової величини.


Середньоквадратичне відхилення:

Стандартне відхилення(Оцінка середньоквадратичного відхилення випадкової величини xщодо її математичного очікування на основі незміщеної оцінки її дисперсії):

де - Дисперсія; - i-й елемент вибірки; - Обсяг вибірки; - Середнє арифметичне вибірки:

Слід зазначити, що обидві оцінки є зміщеними. Загалом незміщену оцінку побудувати неможливо. Проте оцінка з урахуванням оцінки несмещенной дисперсії є заможною.

Сутність, сфера застосування та порядок визначення моди та медіани.

Крім статечних середніх у статистиці для відносної характеристики величини варіює ознаки та внутрішньої будови рядів розподілу користуються структурними середніми, які представлені, в основному, модою та медіаною.

Мода— це варіант ряду, що найчастіше зустрічається. Мода застосовується, наприклад, щодо розміру одягу, взуття, що користується найбільшим попитом у покупців. Модою для дискретного ряду є варіанти, що мають найбільшу частоту. При обчисленні моди для інтервального варіаційного ряду необхідно спочатку визначити модальний інтервал (за максимальною частотою), а потім значення модальної величини ознаки за формулою:

- - Значення моди

- нижня межа модального інтервалу

- - Величина інтервалу

- - Частота модального інтервалу

- - Частота інтервалу, що передує модальному

- - Частота інтервалу, наступного за модальним

Медіанаце значення ознаки, що лежить в основі ранжованого ряду та ділить цей ряд на дві рівні за чисельністю частини.

Для визначення медіани в дискретному ряду за наявності частот спочатку обчислюють напівсуму частот, а потім визначають яке значення варіанта припадає на неї. (Якщо відсортований ряд містить непарну кількість ознак, то номер медіани обчислюють за формулою:

М е = (n (число ознак у сукупності) + 1)/2,

у разі парного числа ознак медіана дорівнюватиме середньої з двох ознак що знаходяться в середині ряду).

При обчисленні медіанидля інтервального варіаційного ряду спочатку визначають медіанний інтервал, в межах якого знаходиться медіана, а потім значення медіани за формулою:

- - Шукана медіана

- нижня межа інтервалу, який містить медіану

- - Величина інтервалу

- - Сума частот або число членів ряду

Сума накопичених частот інтервалів, що передують медіанному

- - Частота медіанного інтервалу

приклад. Знайти моду та медіану.

Рішення:
У цьому прикладі модальний інтервал перебуває у межах вікової групи 25-30 років, оскільки цей інтервал припадає найбільша частота (1054).

Розрахуємо величину моди:

Це означає, що модальний вік студентів дорівнює 27 рокам.

Обчислимо медіану. Медіанний інтервал знаходиться у віковій групі 25-30 років, тому що в межах цього інтервалу розташована варіанта, яка поділяє сукупність на дві рівні частини (?f i/2=3462/2=1731). Далі підставляємо у формулу необхідні числові дані та отримуємо значення медіани:

Це означає, що одна половина студентів має вік до 27,4 року, а інша понад 27,4 роки.

Крім моди і медіани можуть бути використані такі показники, як квартилі, що ділять ранжований ряд на 4 рівні частини, децилі- 10 частин та перцентілі – на 100 частин.

Поняття вибіркового спостереження та сфера його застосування.

Вибіркове спостереженнязастосовується, коли застосування суцільного спостереження фізично неможливочерез великий масив даних або економічно недоцільно. Фізична неможливість має місце, наприклад, щодо пасажиропотоків, ринкових цін, сімейних бюджетів. Економічна недоцільність має місце в оцінці якості товарів, що з їх знищенням, наприклад, дегустація, випробування цегли на міцність тощо.

Статистичні одиниці, відібрані для спостереження, становлять вибіркову сукупність чи вибірку, а їх масив - генеральну сукупність (ГС). При цьому число одиниць у вибірці позначають n, а у всій ГС - N. Ставлення n/Nназивається відносний розмір або частка вибірки.

Якість результатів вибіркового спостереження залежить від репрезентативності вибірки, тобто від цього, наскільки вона представницька в ГС. Для забезпечення репрезентативності вибірки необхідно дотримуватись принцип випадковості відбору одиниць, який передбачає, що у включення одиниці ГС у вибірку неспроможна вплинути якийсь інший чинник крім випадку.

Існує 4 способи випадкового відборуу вибірку:

  1. Власне випадковийвідбір або «метод лото», коли статистичним величинам присвоюються порядкові номери, що заносяться на певні предмети (наприклад, барила), які потім перемішуються в певній ємності (наприклад, у мішку) і вибираються навмання. Насправді цей спосіб здійснюють за допомогою генератора випадкових чисел або математичних таблиць випадкових чисел.
  2. Механічнийвідбір, за яким відбирається кожна ( N/n)-я величина генеральної сукупності. Наприклад, якщо вона містить 100 000 величин, а потрібно вибрати 1 000, то вибірку потрапить кожна 100 000 / 1000 = 100-а величина. Причому якщо вони не ранжовані, то перша вибирається навмання з першої сотні, а номери інших будуть на сотню більше. Наприклад, якщо першою виявилася одиниця № 19, то наступною має бути № 119, потім № 219, потім № 319 тощо. Якщо одиниці генеральної сукупності ранжовані, то першою вибирається № 50, потім № 150, потім № 250 і таке інше.
  3. Відбір величин із неоднорідного масиву даних ведеться стратифікованим(Розшарованим) способом, коли генеральна сукупність попередньо розбивається на однорідні групи, до яких застосовується випадковий або механічний відбір.
  4. Особливий спосіб складання вибірки є серійнийвідбір, у якому випадково чи механічно вибирають окремі величини, які серії (послідовності з якогось номера за якийсь поспіль), всередині яких ведуть суцільне спостереження.

Якість вибіркових спостережень залежить і від типу вибірки: повторнаабо безповторна.

При повторному відборістатистичні величини, що потрапили у вибірку, або їх серії після використання повертаються в генеральну сукупність, маючи шанс потрапити в нову вибірку. При цьому у всіх величин генеральної сукупності однакова можливість включення у вибірку.

Неповторний відбірозначає, що статистичні величини, що потрапили у вибірку, або їх серії після використання не повертаються в генеральну сукупність, а тому для інших величин останньої підвищується ймовірність потрапляння в наступну вибірку.

Безповторний відбір дає точніші результати, тому застосовується частіше. Але є ситуації, коли його не можна застосувати (вивчення пасажиропотоків, споживчого попиту тощо) і тоді ведеться повторний відбір.

Гранична помилка вибірки спостереження, середня помилка вибірки, порядок їхнього розрахунку.

Розглянемо докладно перелічені вище способи формування вибіркової сукупності і помилки, що виникають при цьому. репрезентативності .
Власне-випадковаВибірка ґрунтується на відборі одиниць з генеральної сукупності навмання без будь-яких елементів системності. Технічно власне-випадковий відбір проводять методом жеребкування (наприклад, розіграші лотерей) або за таблицею випадкових чисел.

Власно-випадковий відбір «у чистому вигляді» у практиці вибіркового спостереження застосовується рідко, але він є вихідним серед інших видів відбору, у ньому реалізуються основні засади вибіркового спостереження. Розглянемо деякі питання теорії вибіркового методу та формули помилок для простої випадкової вибірки.

Помилка вибіркового спостереження- це різницю між величиною параметра у генеральній сукупності, та її величиною, обчисленої за результатами вибіркового спостереження. Для середньої кількісної ознаки помилка вибірки визначається

Показник називається граничною помилкою вибірки.
Вибіркова середня є випадковою величиною, яка може приймати різні значенняв залежності від того, які одиниці потрапили у вибірку. Отже, помилки вибірки є випадковими величинами і можуть приймати різні значення. Тому визначають середню із можливих помилок - середню помилку вибірки, яка залежить від:

Об'єм вибірки: чим більша чисельність, тим менша величина середньої помилки;

Ступені зміни досліджуваної ознаки: що менше варіація ознаки, отже, і дисперсія, то менше середня помилка вибірки.

При випадковому повторному відборісередня помилка розраховується:
.
Практично генеральна дисперсія точно не відома, але в теорії ймовірностідоведено, що
.
Оскільки величина за досить великих n близька до 1, вважатимуться, що . Тоді середня помилка вибірки може бути розрахована:
.
Але у випадках малої вибірки (при n<30) коэффициент необходимо учитывать, и среднюю ошибку малой выборки рассчитывать по формуле
.

При випадковій безповторній вибірцінаведені формули коригуються на величину. Тоді середня помилка безповторної вибірки:
та .
Т.к. завжди менше, то множник () завжди менше 1. Це означає, що середня помилка при безповторному відборі завжди менше, ніж при повторному.
Механічна вибірказастосовується, коли генеральна сукупність у будь-який спосіб упорядкована (наприклад, списки виборців за алфавітом, телефонні номери, номери будинків, квартир). Відбір одиниць здійснюється через певний інтервал, що дорівнює зворотному значенню відсотка вибірки. Так за 2% вибірці відбирається кожна 50 одиниця =1/0,02 , при 5% кожна 1/0,05=20 одиниця генеральної сукупності.

Початок відліку вибирається різними способами: випадковим чином, із середини інтервалу, зі зміною початку відліку. Головне при цьому – уникнути систематичної помилки. Наприклад, при 5% вибірці, якщо першою одиницею обрано 13-ту, то наступні 33, 53, 73 і т.д.

За точністю механічний відбір близький до власно-випадкової вибірки. Тому визначення середньої помилки механічної вибірки використовують формули власне-випадкового відбору.

При типовому відборі обстежувана сукупність попередньо розбивається на однорідні, однотипні групи. Наприклад, при обстеженні підприємств це можуть бути галузі, підгалузі, щодо населення - райони, соціальні чи вікові групи. Потім здійснюється незалежний вибір із кожної групи механічним або власне-випадковим способом.

Типова вибірка дає більш точні результати проти іншими способами. Типізація генеральної сукупності забезпечує представництво у вибірці кожної типологічної групи, що дозволяє виключити вплив міжгрупової дисперсії на середню помилку вибірки. Отже, при знаходженні помилки типової вибірки згідно з правилом складання дисперсій () необхідно врахувати лише середню з групових дисперсій. Тоді середня помилка вибірки:
при повторному відборі
,
при безповторному відборі
,
де - середня із внутрішньогрупових дисперсій у вибірці.

Серійний (або гніздовий) відбір застосовується у разі, коли генеральна сукупність розбита на серії чи групи на початок вибіркового обстеження. Цими серіями можуть бути упаковки готової продукції, студентські групи, бригади. Серії для обстеження вибираються механічним чи власне-випадковим способом, а всередині серії проводиться суцільне обстеження одиниць. Тому середня помилка вибірки залежить лише від міжгрупової (міжсерійної) дисперсії, яка обчислюється за такою формулою:

де r – число відібраних серій;
- середня і-та серія.

Середня помилка серійної вибірки розраховується:

при повторному відборі:
,
при безповторному відборі:
,
де R – загальна кількість серій.

Комбінованийвідбірє поєднанням розглянутих способів відбору.

Середня помилка вибірки за будь-якого способу відбору залежить головним чином абсолютної чисельності вибірки й у меншою мірою - від відсотка вибірки. Припустимо, що проводиться 225 спостережень у першому випадку з генеральної сукупності 4500 одиниць і у другому - 225000 одиниць. Дисперсії в обох випадках дорівнюють 25. Тоді в першому випадку при 5% відборі помилка вибірки складе:

У другому випадку при 0,1%-ному відборі вона дорівнюватиме:

Таким чином, при зменшенні відсотка вибірки у 50 разів, помилка вибірки збільшилася незначно, оскільки чисельність вибірки не змінилася.
Припустимо, що кількість вибірки збільшили до 625 спостережень. У цьому випадку помилка вибірки дорівнює:

Збільшення вибірки в 2,8 разу за однієї й тієї ж чисельності генеральної сукупності знижує розміри помилки вибірки більш як 1,6 разу.

Методи та способи формування вибіркової сукупності.

У статистиці застосовуються різні способи формування вибіркових сукупностей, що обумовлюється завданнями дослідження та залежить від специфіки об'єкта вивчення.

Основною умовою проведення вибіркового обстеження є запобігання виникненню систематичних помилок, що виникають внаслідок порушення принципу рівних можливостей потрапляння у вибірку кожної одиниці генеральної сукупності. Попередження систематичних помилок досягається внаслідок застосування науково обґрунтованих способів формування вибіркової сукупності.

Існують такі способи відбору одиниць із генеральної сукупності:

1) індивідуальний відбір - у вибірку відбираються окремі одиниці;

2) груповий відбір - у вибірку потрапляють якісно однорідні групи або серії одиниць, що вивчаються;

3) комбінований відбір - це комбінація індивідуального та групового відбору.
Способи відбору визначаються правилами формування вибіркової сукупності.

Вибірка може бути:

  • власне-випадковаполягає в тому, що вибіркова сукупність утворюється в результаті випадкового (ненавмисного) відбору окремих одиниць із генеральної сукупності. При цьому кількість відібраних у вибіркову сукупність одиниць зазвичай визначається, виходячи з прийнятої частки вибірки. Частка вибірки є відношення числа одиниць вибіркової сукупності n чисельності одиниць генеральної сукупності N, тобто.
  • механічнаполягає в тому, що відбір одиниць у вибіркову сукупність виробляється з генеральної сукупності, розбитої на рівні інтервали (групи). При цьому розмір інтервалу в генеральній сукупності дорівнює зворотній величині частки вибірки. Так, при 2% вибірці відбирається кожна 50-а одиниця (1:0,02), при 5% вибірці - кожна 20 одиниця (1:0,05) і т.д. Таким чином, відповідно до прийнятої частки відбору, генеральна сукупність механічно розбивається на рівновеликі групи. З кожної групи у вибірку відбирається лише одна одиниця.
  • типова -при якій генеральна сукупність спочатку розчленовується на однорідні типові групи. Потім із кожної типової групи власне-випадковою або механічною вибіркою проводиться індивідуальний відбір одиниць у вибіркову сукупність. Важливою особливістю типової вибірки і те, що вона дає точніші результати проти іншими способами відбору одиниць у вибіркову сукупність;
  • серійна- за якої генеральну сукупність ділять на однакові за обсягом групи - серії. У вибіркову сукупність відбираються серії. Усередині серій проводиться суцільне спостереження одиниць, що потрапили до серії;
  • комбінована- вибірка може бути двоступінчастою. У цьому генеральна сукупність спочатку розбивається групи. Потім здійснюють відбір груп, а всередині останніх здійснюється відбір окремих одиниць.

У статистиці розрізняють такі способи відбору одиниць у вибіркову сукупність:

  • одноступінчаставибірка - кожна відібрана одиниця відразу ж піддається вивченню за заданою ознакою (власне-випадкова та серійна вибірки);
  • багатоступінчаставибірка - виробляють підбір з генеральної сукупності окремих груп, та якщо з груп вибираються окремі одиниці (типова вибірка з механічним способом відбору одиниць у вибіркову сукупність).

Крім того розрізняють:

  • повторний відбір- За схемою повернутої кулі. При цьому кожна одиниця, що потрапила у вибірку, іди серія повертається в генеральну сукупність і тому має шанс знову потрапити у вибірку;
  • безповторний відбір- За схемою неповернутої кулі. Він має більш точні результати при тому самому обсязі вибірки.

Визначення необхідного обсягу вибірки (використання таблиці Стьюдента).

Одним із наукових принципів у теорії вибіркового методу є забезпечення достатньої кількості відібраних одиниць. Теоретично необхідність дотримання цього принципу представлена ​​в доказах граничних теорем теорії ймовірностей, які дозволяють встановити, який обсяг одиниць слід вибрати з генеральної сукупності, щоб він був достатнім та забезпечував репрезентативність вибірки.

Зменшення стандартної помилки вибірки, а отже, збільшення точності оцінки завжди пов'язане зі збільшенням обсягу вибірки, тому вже на стадії організації вибіркового спостереження доводиться вирішувати питання про те, яким має бути обсяг вибіркової сукупності, щоб була забезпечена необхідна точність результатів спостережень. Розрахунок необхідного обсягу вибірки будується за допомогою формул, виведених з формул граничних помилок вибірки (А), відповідних тому чи іншому виду та способу відбору. Так, для випадкового повторного обсягу вибірки (n) маємо:

Суть цієї формули - у цьому, що з випадковому повторному відборі необхідної чисельності обсяг вибірки прямо пропорційний квадрату коефіцієнта довіри (t2)і дисперсії варіаційної ознаки (?2) і обернено пропорційний квадрату граничної помилки вибірки (?2). Зокрема, зі збільшенням граничної помилки вдвічі необхідна чисельність вибірки може бути зменшена вчетверо. З трьох параметрів два (t і ?) задаються дослідником.

При цьому дослідник виходячиз метою завдань вибіркового обстеження має вирішити питання: у якому кількісному поєднанні краще включити ці параметри для забезпечення оптимального варіанту? В одному випадку його може більше влаштовувати надійність отриманих результатів (t), ніж міра точності (?), В іншому - навпаки. Складніше вирішити питання щодо величини граничної помилки вибірки, оскільки цим показником дослідник на стадії проектування вибіркового спостереження немає, у практиці прийнято ставити величину граничної помилки вибірки, зазвичай, не більше до 10 % гаданого середнього рівня ознаки. До встановлення передбачуваного середнього рівня можна підходити по-різному: використовувати дані подібних раніше проведених обстежень або скористатися даними основи вибірки і зробити невелику пробну вибірку.

Найбільш складно встановити під час проектування вибіркового спостереження третій параметр у формулі (5.2) - дисперсію вибіркової сукупності. У цьому випадку необхідно використовувати всю інформацію, що є у розпорядженні дослідника, отриману в раніше проведених подібних та пробних обстеженнях.

Питання визначеннянеобхідної чисельності вибірки ускладнюється, якщо вибіркове обстеження передбачає вивчення кількох ознак одиниць відбору. В цьому випадку середні рівні кожної з ознак та їх варіація, як правило, різні, і тому вирішити питання про те, дисперсії якої з ознак віддати перевагу, можливо лише з урахуванням мети та завдань обстеження.

При проектуванні вибіркового спостереження передбачаються заздалегідь задана величина припустимої помилки вибірки відповідно до завдань конкретного дослідження та ймовірність висновків за результатами спостереження.

Загалом формула граничної помилки вибіркової середньої величини дозволяє визначати:

Величину можливих відхилень показників генеральної сукупності від показників вибіркової сукупності;

Необхідну чисельність вибірки, що забезпечує необхідну точність, коли межі можливої ​​помилки не перевищать деякої заданої величини;

Імовірність того, що у проведеній вибірці помилка матиме задану межу.

Розподіл Стьюдентатеоретично ймовірностей — це однопараметричне сімейство абсолютно безперервних розподілів.

Ряди динаміки (інтервальні, моментні), змикання рядів динаміки.

Ряди динаміки- це значення статистичних показників, які представлені у певній хронологічній послідовності.

Кожен динамічний ряд містить дві складові:

1) показники періодів часу (роки, квартали, місяці, дні чи дати);

2) показники, що характеризують об'єкт, що досліджується, за тимчасові періоди або на відповідні дати, які називають рівнями ряду.

Рівні ряду виражаютьсяяк абсолютними, і середніми чи відносними величинами. Залежно від характеру показників будують динамічні ряди абсолютних, відносних та середніх величин. Ряди динаміки з відносних та середніх величин будують на основі похідних рядів абсолютних величин. Розрізняють інтервальні та моментні ряди динаміки.

Динамічний інтервальний рядмістить значення показників за певний період часу. В інтервальному ряду рівні можна підсумовувати, одержуючи обсяг явища за триваліший період, або звані накопичені результати.

Динамічний моментний рядвідбиває значення показників на певний час (дату часу). У моментних рядах дослідника може цікавити лише різницю явищ, що відбиває зміна рівня низки між певними датами, оскільки сума рівнів тут немає реального змісту. Накопичені результати тут не розраховуються.

Найважливішою умовою правильної побудови динамічних рядів є сумісність рівнів рядів, що належать до різних періодів. Рівні повинні бути представлені в однорідних величинах, повинна мати місце однакова повнота охоплення різних частин явища.

Для того щобуникнути спотворення реальної динаміки, у статистичному дослідженні проводяться попередні розрахунки (змикання рядів динаміки), що передують статистичному аналізу динамічних рядів. Під змиканням рядів динаміки розуміється об'єднання до одного ряду двох і більше рядів, рівні яких розраховані за різною методологією або не відповідають територіальним кордонам тощо. Змикання рядів динаміки може припускати також приведення абсолютних рівнів рядів динаміки до загальної основи, що нівелює непорівнянність рівнів динаміки.

Поняття сумісності рядів динаміки, коефіцієнти, темпи зростання та приросту.

Ряди динаміки- Це ряди статистичних показників, що характеризують розвиток явищ природи та суспільства в часі. Статистичні збірники, що публікуються Держкомстатом Росії, містять велику кількість рядів динаміки в табличній формі. Ряди динаміки дозволяють виявити закономірності розвитку явищ, що вивчаються.

Ряди динаміки містять два види показників. Показники часу(Роки, квартали, місяці та ін) або моменти часу (на початок року, на початок кожного місяця і т.п.). Показники рівнів ряду. Показники рівнів рядів динаміки можуть бути виражені абсолютними величинами (виробництво продукту в тоннах або рублях), відносними величинами (питома вага міського населення у %) та середніми величинами (середня заробітна плата працівників галузі за роками тощо). У табличній формі ряд динаміки містить два стовпці або два рядки.

Правильне побудова рядів динаміки передбачає виконання низки вимог:

  1. усі показники низки динаміки мають бути науково обґрунтованими, достовірними;
  2. показники низки динаміки мають бути зіставні за часом, тобто. мають бути обчислені за однакові періоди часу чи однакові дати;
  3. показники низки динаміки мають бути зіставні територією;
  4. показники низки динаміки мають бути зіставні за змістом, тобто. обчислені за єдиною методологією, однаковим способом;
  5. показники низки динаміки мають бути зіставні по колу господарств, що враховуються. Усі показники низки динаміки повинні бути наведені в одних і тих самих одиницях вимірювання.

Статистичні показникиможуть характеризувати або результати досліджуваного процесу у період, або стан досліджуваного явища певний час, тобто. показники можуть бути інтервальними (періодичними) та моментними. Відповідно спочатку ряди динаміки можуть бути або інтервальними, або моментними. Моментні ряди динаміки у свою чергу можуть бути з рівними та нерівними проміжками часу.

Початкові ряди динаміки можуть бути перетворені на ряд середніх величин і ряд відносних величин (ланцюговий та базисний). Такі ряди динаміки називають похідними рядами динаміки.

Методика розрахунку середнього рівня серед динаміки різна, обумовлена ​​виглядом низки динаміки. На прикладах розглянемо види рядів динаміки та формули для розрахунку середнього рівня.

Абсолютні прирости (Δy) показують, наскільки одиниць змінився наступний рівень ряду порівняно з попереднім (гр.3 - ланцюгові абсолютні прирости) або в порівнянні з початковим рівнем (гр.4 - базисні абсолютні прирости). Формули розрахунку можна записати так:

При зменшенні абсолютних значень ряду буде відповідно "зменшення", "зниження".

Показники абсолютного приросту свідчать, що, наприклад, 1998 р. виробництво продукту " А " збільшилося проти 1997 р. на 4 тис. т, а проти 1994 р. — на 34 тис. т.; за рештою років див. табл. 11.5 гр. 3 та 4.

Коефіцієнт зростанняпоказує, скільки разів змінився рівень низки проти попереднім (гр.5 — ланцюгові коефіцієнти зростання чи зниження) чи порівняно з початковим рівнем (гр.6 — базисні коефіцієнти зростання чи зниження). Формули розрахунку можна записати так:

Темпи зростанняпоказують, скільки відсотків становить наступний рівень низки проти попереднім (гр.7 — ланцюгові темпи зростання) чи проти початковим рівнем (гр.8 — базисні темпи зростання). Формули розрахунку можна записати так:

Приміром, 1997 р. обсяги виробництва продукту " А " проти 1996 р. становив 105,5 % (

Темпи прироступоказують, скільки відсотків збільшився рівень звітного періоду проти попереднім (гр.9- ланцюгові темпи приросту) чи проти початковим рівнем (гр.10- базисні темпи приросту). Формули розрахунку можна записати так:

Т пр = Т р - 100% або Т пр = абсолютний приріст / рівень попереднього періоду * 100%

Приміром, 1996 р. проти 1995 р. продукту " А " вироблено більше на 3,8 % (103,8 %- 100%) чи (8:210)х100%, а проти 1994 р. - на 9% (109% - 100%).

Якщо абсолютні рівні в ряду зменшуються, то темп буде меншим за 100% і відповідно буде темп зниження (темп приросту зі знаком мінус).

Абсолютне значення 1% приросту(Гр. 11) показує, скільки одиниць треба зробити в даному періоді, щоб рівень попереднього періоду зріс на 1%. У прикладі, 1995 р. треба було виробити 2,0 тис. т., а 1998 р. — 2,3 тис. т., тобто. значно більше.

Визначити величину абсолютного значення 1% приросту можна двома способами:

Рівень попереднього періоду поділити на 100;

Ланцюгові абсолютні прирости розділити на відповідні ланцюгові темпи приросту.

Абсолютне значення 1% приросту =

У динаміці, особливо протягом тривалого періоду, важливий спільний аналіз темпів приросту зі змістом кожного відсотка приросту чи зниження.

Зауважимо, що розглянута методика аналізу рядів динаміки застосовується як для рядів динаміки, рівні яких виражені абсолютними величинами (т, тис. руб., Число працівників і т.д.), так і для рядів динаміки, рівні яких виражені відносними показниками (% шлюбу ,% зольності вугілля та ін) або середніми величинами (середня врожайність у ц/га, середня заробітна плата тощо).

Поряд із розглянутими аналітичними показниками, що обчислюються за кожен рік у порівнянні з попереднім або початковим рівнем, при аналізі рядів динаміки необхідно обчислити середні за період аналітичні показники: середній рівень ряду, середній річний абсолютний приріст (зменшення) та середній річний темп зростання та темп приросту.

Методи розрахунку середнього рівня низки динаміки було розглянуто вище. У аналізованому нами інтервальному ряду динаміки середній рівень ряду обчислюється за формулою середньої арифметичної простий:

Середньорічний обсяг виробництва товару за 1994- 1998 гг. становив 218,4 тис. т.

Середньорічний абсолютний приріст обчислюється також за формулою середньої арифметичної простий:

Щорічні абсолютні прирости змінювалися за роками від 4 до 12 тис.т (див.гр.3), а середньорічний приріст виробництва у період 1995 — 1998 гг. становив 8,5 тис. т.

Методи розрахунку середнього темпу зростання та середнього темпу приросту вимагають докладнішого розгляду. Розглянемо їх з прикладу наведених у таблиці річних показників рівня низки.

Середній рівень низки динаміки.

Ряд динаміки (або часовий ряд)- це числові значення певного статистичного показника у послідовні моменти або періоди часу (тобто розташовані у хронологічному порядку).

Числові значення того чи іншого статистичного показника, що становить низку динаміки, називають рівнями рядуі зазвичай позначають буквою y. Перший член ряду y 1називають початковим або базисним рівнем, а останній y n - кінцевим. Моменти або періоди часу, до яких належать рівні, позначають через t.

Ряди динаміки, як правило, представляють у вигляді таблиці або графіка, причому по осі абсцис будується шкала часу t, а по осі ординат - шкала рівнів ряду y.

Середні показники низки динаміки

Кожен ряд динаміки можна розглядати як сукупність nмінливих у часі показників, які можна узагальнювати як середніх величин. Такі узагальнені (середні) показники особливо необхідні у порівнянні змін того чи іншого показника у різні періоди, у різних країнах тощо.

Узагальненою характеристикою низки динаміки може бути перш за все середній рівень ряду. Спосіб розрахунку середнього рівня залежить від того, чи моментний ряд або інтервальний (періодний).

В разі інтервальногонизки його середній рівень визначається за формулою простий середньої арифметичної величини з рівнів низки, тобто.

=
Якщо мається моментнийряд, що містить nрівнів ( y1, y2, …, yn) з рівними проміжками між датами (моментами часу), такий ряд легко перетворити на ряд середніх величин. При цьому показник (рівень) початку кожного періоду одночасно є показником на кінець попереднього періоду. Тоді середня величина показника для кожного періоду (проміжок між датами) може бути розрахована як напівсума значень упочатку і поклала край періоду, тобто. як . Кількість таких середніх буде. Як зазначалося раніше, для рядів середніх величин середній рівень розраховується за середньою арифметичною.

Отже, можна записати:
.
Після перетворення чисельника отримуємо:
,

де Y1і Yn- Перший та останній рівні ряду; Yi- Проміжні рівні.

Ця середня відома у статистиці як середня хронологічнадля моментних лав. Таку назву вона отримала від слова «cronos» (час, лат.), оскільки розраховується з показників, що змінюються в часі.

У разі нерівнихпроміжків між датами середню хронологічну для моментного ряду можна розрахувати як середню арифметичну із середніх значень рівнів на кожну пару моментів, зважених за величиною відстаней (відрізків часу) між датами, тобто.
.
В даному випадкупередбачається, що в проміжках між датами рівні набули різних значень, і ми з двох відомих ( yiі yi+1) визначаємо середні, з яких потім вже розраховуємо загальну середню для всього періоду, що аналізується.
Якщо ж передбачається, що кожне значення yiзалишається незмінним до наступного (i+ 1)- го моменту, тобто. відома точна дата зміни рівнів, то розрахунок можна здійснювати за формулою середньої арифметичної зваженої:
,

де - час, протягом якого рівень залишався незмінним.

Крім середнього рівня у рядах динаміки розраховуються й інші середні показники - середня зміна рівнів ряду (базисним та ланцюговим способами), середній темп зміни.

Базова середня абсолютна змінаявляє собою приватне від поділу останньої базової абсолютної зміни на кількість змін. Тобто

Ланцюгова середня абсолютна зміна рівнів ряду є часткою від поділу суми всіх ланцюгових абсолютних змін на кількість змін, тобто

По знаку середніх абсолютних змін судять про характер зміни явища у середньому: зростання, спад чи стабільність.

З правила контролю базисних та ланцюгових абсолютних змін випливає, що базисна та ланцюгова середня зміна мають бути рівними.

Поруч із середніми абсолютним зміною розраховується і середнє відносне теж базисним і ланцюговим методами.

Базисна середня відносна змінавизначається за формулою:

Ланцюгова середня відносна змінавизначається за формулою:

Природно, базисне і ланцюгове середнє відносне зміни мають бути однаковими і порівнянням їх із критеріальним значенням 1 робиться висновок про характер зміни явища в середньому: зростання, спад чи стабільність.
Відніманням 1 з базисної або ланцюгової середньої відносної зміни утворюється відповідний середній темп зміни, за знаком якого можна судити про характер зміни досліджуваного явища, відбитого даним рядом динаміки.

Сезонні коливання та індекси сезонності.

Сезонні коливання – стійкі внутрішньорічні коливання.

Основний принцип господарювання для отримання максимального ефекту – це максимізація доходів та мінімізація витрат. Вивчаючи сезонні коливання, вирішується завдання максимального рівняння в кожному рівні року.

При вивченні сезонних коливань вирішуються дві взаємозалежні завдання:

1. Виявлення специфіки розвитку явища у внутрішньорічній динаміці;

2. Вимірювання сезонних коливань з побудовою моделі сезонної хвилі;

Для вимірювання сезонних коливань зазвичай обчислюють індичок сезонності. У загальному вигляді вони визначаються ставленням вихідних рівнянь низки динаміки до теоретичних рівнянь, що виступають як база для порівняння.

Оскільки на сезонні коливання накладаються випадкові відхилення, їх усунення роблять усереднення індексів сезонності.

В цьому випадку для кожного періоду річного циклу визначаються узагальнені показники у вигляді середніх сезонних індексів:

Середні індекси сезонних коливань вільні від впливу випадкових відхилень основної тенденції розвитку.

Залежно від характеру тренду, формула середнього індексу сезонності може приймати такі види:

1.Для рядів внутрішньорічної динаміки з яскраво вираженою основною тенденцією розвитку:

2. Для рядів внутрішньорічної динаміки в якій тренд, що підвищується або знижується, відсутній, або незначний:

Де – загальне середнє;

Методи аналізу основної тенденції.

На розвиток явищ за часом впливають фактори різні за характером та силою впливу. Деякі їх носять випадковий характер, інші мають практично постійне вплив і формують у лавах динаміки певну тенденцію розвитку.

Важливим завданням статистики є виявлення серед динаміки тренду, звільненого від дії різних випадкових чинників. З цією метою ряди динаміки піддаються обробці методами укрупнення інтервалів, ковзної середньої та аналітичного вирівнювання та ін.

Метод укрупнення інтервалівзаснований на укрупненні періодів часу, до яких відносяться рівні динаміки, тобто. являє собою заміну даних, що стосуються дрібних часових періодів, даними по більшим періодам. Особливо ефективний, коли початкові рівні ряду належать до коротких проміжків часу. Наприклад, ряди показників, що стосуються щоденних подій, замінюються рядами, що належать до тижневих, помісячних і т.д. Це дозволить більш чітко показати «вісь розвитку явища». Середня, обчислена за укрупненими інтервалами, дозволяє виявляти напрям та характер (прискорення чи уповільнення зростання) основної тенденції розвитку.

Метод ковзної середньоїсхожий з попереднім, але в даному випадку фактичні рівні замінюються середніми рівнями, розрахованими для послідовно рухливих (ковзаючих) укрупнених інтервалів, що охоплюють mрівнів низки.

Наприклад, якщо прийняти m=3,то спочатку розраховується середня з перших трьох рівнів ряду, потім - з того ж числа рівнів, але починаючи з другого за рахунком, далі - починаючи з третього і т.д. Отже, середня хіба що «ковзає» з низки динаміки, пересуваючись однією термін. Розраховані з mчленів ковзаючі середні відносяться до середини (центру) кожного інтервалу.

Цей метод усуває лише випадкові коливання. Якщо ж ряд має сезонну хвилю, то вона збережеться і після згладжування методом ковзної середньої.

Аналітичне вирівнювання. З метою усунення випадкових коливань та виявлення тренду застосовується вирівнювання рівнів ряду за аналітичними формулами (або аналітичне вирівнювання). Його суть полягає у заміні емпіричних (фактичних) рівнів теоретичними, які розраховані за певним рівнянням, прийнятим за математичну модель тренда, де теоретичні рівні розглядаються як функція часу: . У цьому кожен фактичний рівень сприймається як сума двох складових: , де - систематична складова і виражена певним рівнянням, а - випадкова величина, що викликає коливання навколо тренда.

Завдання аналітичного вирівнювання зводиться до наступного:

1. Визначення на основі фактичних даних виду гіпотетичної функції, здатної найбільш адекватно відобразити тенденцію розвитку досліджуваного показника.

2. Знаходження за емпіричними даними параметрів зазначеної функції (рівняння)

3. Розрахунок за знайденим рівнянням теоретичних (вирівняних) рівнів.

Вибір тієї чи іншої функції здійснюється, зазвичай, з урахуванням графічного зображення емпіричних даних.

Як моделі служать рівняння регресії, параметри яких розраховують за способом найменших квадратів

Нижче наводяться найчастіше використовувані для вирівнювання динамічних рядів рівняння регресії із зазначенням для відображення яких саме тенденцій розвитку вони найбільше підходять.

Для знаходження параметрів наведених вище рівнянь існують спеціальні алгоритми та комп'ютерні програми. Зокрема, для знаходження параметрів рівняння прямої може бути використаний такий алгоритм:

Якщо періоди або моменти часу пронумерувати так, щоб вийшло St = 0, то наведені вище алгоритми істотно спростяться і перетворяться на

Вирівняні рівні на графіку розташуються на одній прямій, що проходить на найближчій відстані від фактичних рівнів даного динамічного ряду. Сума квадратів відхилень є відображенням впливу випадкових факторів.

З її допомогою розрахуємо середню (стандартну) помилку рівняння:

Тут n – число спостережень, а m – число параметрів у рівнянні (їх у нас два – b 1 і b 0).

Основна тенденція (тренд) показує, як впливають систематичні фактори на рівні низки динаміки, а коливання рівнів біля тренду () служить мірою впливу залишкових факторів.

Для оцінки якості використовуваної моделі динамічного ряду застосовується також критерій F Фішера. Він є відношення двох дисперсій, саме ставлення дисперсії, викликаної регресією, тобто. досліджуваним чинником, дисперсії, викликаної випадковими причинами, тобто. залишковою дисперсією:

У розгорнутому вигляді формула цього критерію може бути подана так:

де n – число спостережень, тобто. число рівнів ряду,

m – число параметрів у рівнянні, y – фактичний рівень ряду,

Вирівняний рівень ряду - середній рівень ряду.

Більше вдала, ніж інші, модель не завжди може виявитися досить задовільною. Її можна визнати такою тільки в тому випадку, коли критерій F у неї переступить відому критичну межу. Ця межа встановлюється за допомогою таблиць F-розподілу.

Сутність та класифікація індексів.

Під індексом у статистиці розуміють відносний показник, що характеризує зміну величини будь-якого явища в часі, просторі або в порівнянні з будь-яким еталоном.

Основним елементом індексного відношення є індексована величина. Під індексованою величиною розуміють значення ознаки статистичної сукупності, зміна якого є об'єктом вивчення.

За допомогою індексів вирішуються три основні завдання:

1) оцінка зміни складного явища;

2) визначення впливу окремих чинників зміну складного явища;

3) порівняння величини якогось явища з величиною минулого періоду, величиною по іншій території, а також з нормативами, планами, прогнозами.

Індекси класифікують за 3-ма ознаками:

2) за рівнем охоплення елементів сукупності;

3) за методами розрахунку загальних індексів.

За змістоміндексованих величин індекси поділяються на індекси кількісних (об'ємних) показників та індекси якісних показників. Індекси кількісних показників - індекси фізичного обсягу промислової продукції, фізичного обсягу продажів, чисельності та ін Індекси якісних показників - індекси цін, собівартості, продуктивності праці, середньої заробітної плати та ін.

За рівнем охоплення одиниць сукупності індекси поділяються на два класи: індивідуальні та загальні. Для їх характеристики введемо такі умовні позначення, прийняті на практиці застосування індексного методу:

q- кількість (обсяг) будь-якого продукту в натуральному виразі ; р- Вартість одиниці виробленої продукції; z- собівартість одиниці виробленої продукції; t- Витрати часу на виробництво одиниці продукції (трудоємність) ; w- Вироблення продукції у вартісному вираженні в одиницю часу; v- Вироблення продукції в натуральному вираженні в одиницю часу; Т- Загальні витрати часу чи чисельність працівників.

Для того щоб розрізняти, до якого періоду або об'єкта відносяться індексовані величини, прийнято праворуч внизу за відповідним символом ставити підрядкові знаки. Так, наприклад, в індексах динаміки, як правило, для порівнюваних (поточних, звітних) періодів використовується підрядковий знак 1 і для періодів, з якими проводиться порівняння,

Індивідуальні індексислужать для характеристики зміни окремих елементів складного явища (наприклад-зміна обсягу випуску продукції одного виду). Вони є відносними величинами динаміки, виконанням зобов'язань, порівнянням індексованих величин.

Індивідуальний індекс фізичного обсягу продукції визначається

З аналітичної точки зору наведені індивідуальні індекси динаміки аналогічні коефіцієнтам (темпам) зростання і характеризують зміну індексованої величини в поточному періоді в порівнянні з базисним, тобто показують, у скільки разів вона зросла (зменшилася) або скільки відсотків складає її зростання (зниження). Значення індексів виражають у коефіцієнтах чи процентах.

Загальний (зведений) індексвідбиває зміна всіх елементів складного явища.

Агрегатний індексє основною формою індексу. Агрегатним він називається тому, що його чисельник і знаменник являють собою набір «агрегат»

Середні індекси, визначення.

Крім агрегатних індексів у статистиці застосовується інша їх форма - середньозважені індекси. До їх обчислення вдаються тоді, коли інформація, що є в розпорядженні, не дозволяє розрахувати загальний агрегатний індекс. Так, якщо відсутні дані про ціни, але є інформація про вартість продукції в поточному періоді і відомі індивідуальні індекси цін за кожним товаром, то загальний індекс цін як агрегатний визначити не можна, проте можливо обчислити його як середній з індивідуальних. Так само, якщо не відомі кількості вироблених окремих видів продукції, але відомі індивідуальні індекси та вартість продукції базисного періоду, то можна визначити загальний індекс фізичного обсягу продукції як середньозважену величину.

Середній індекс -цеіндекс, обчислений як середня величина із індивідуальних індексів. Агрегатний індекс є основною формою загального індексу, тому середній індекс має бути тотожним агрегатному індексу. При обчисленні середніх індексів використовують дві форми середніх: арифметична і гармонійна.

Середній арифметичний індекс тотожний агрегатному індексу, якщо вагами індивідуальних індексів будуть складові знаменника агрегатного індексу. Тільки в цьому випадку величина індексу, розрахованого за формулою середньої арифметичної, дорівнюватиме агрегатному індексу.

Поділіться з друзями або збережіть для себе:

Завантаження...