Нормальний розподіл функції гауса. Нормальне розподілення безперервної випадкової величини. Нормальний розподіл у MS EXCEL

Нормальний розподіл - найпоширеніший вид розподілу. З ним доводиться зустрічатися при аналізі похибок вимірювань, контролі технологічних процесів та режимів, а також при аналізі та прогнозуванні різних явищ у біології, медицині та інших галузях знань.

Термін «нормальний розподіл» застосовується в умовному значенні як загальноприйнятий у літературі, хоч і не зовсім вдалий. Так, твердження, що якась ознака підпорядковується нормальному закону розподілу, зовсім не означає наявність будь-яких непорушних норм, що нібито лежать в основі явища, відображенням якого є ознака, що розглядається, а підпорядкування іншим законам розподілу не означає якусь анормальність даного явища.

Головна особливість нормального розподілу полягає в тому, що він є граничним, до якого наближаються інші розподіли. Нормальний розподіл вперше відкрито Муавром 1733 року. Нормальному закону підпорядковуються лише безперервні випадкові величини. Щільність нормального закону розподілу має вигляд.

Математичне очікування для нормального закону розподілу дорівнює. Дисперсія дорівнює.

Основні властивості нормального розподілу.

1. Функція щільності розподілу визначена на всій числовій осі Ох , тобто кожному значенню х відповідає цілком певне значення функції.

2. При всіх значеннях х (як позитивних, так і негативних) функція щільності набуває позитивних значень, тобто нормальна крива розташована над віссю Ох .

3. Межа функції щільності при необмеженому зростанні х дорівнює нулю, .

4. Функція щільності нормального розподілу у точці має максимум .

5. Графік функції щільності симетричний щодо прямої.

6. Крива розподілу має дві точки перегину з координатами і .

7. Мода та медіана нормального розподілу збігаються з математичним очікуванням а .

8. Форма нормальної кривої не змінюється при зміні параметра а .

9. Коефіцієнти асиметрії та ексцесу нормального розподілу дорівнюють нулю.

Очевидна важливість обчислення цих коефіцієнтів для емпіричних рядів розподілу, оскільки вони характеризують скошеність і крутість даного ряду в порівнянні з нормальним.

Імовірність попадання в інтервал знаходиться за формулою , де непарна табульована функція.

Визначимо ймовірність того, що нормально розподілена випадкова величинавідхиляється від свого математичного очікування на меншу величину, тобто знайдемо ймовірність здійснення нерівності або ймовірність подвійної нерівності. Підставляючи у формулу, отримаємо

Виразивши відхилення випадкової величини Х у частках середнього квадратичного відхилення, тобто поклавши в останній рівності, отримаємо .


Тоді при отримаємо ,

при отримаємо ,

при отримаємо.

З останньої нерівності випливає, що практично розсіювання нормально розподіленої випадкової величини укладено на ділянці . Імовірність того, що випадкова величина не потрапить на цю ділянку, дуже мала, а саме дорівнює 0,0027, тобто ця подія може статися лише у трьох випадках із 1000. Такі події можна вважати практично неможливими. На наведених міркуваннях ґрунтується правило трьох сигм, що формулюється наступним чином: якщо випадкова величина має нормальний розподіл, то відхилення цієї величини від математичного очікування по абсолютній величині не перевищує потрійного середнього квадратичного відхилення.

Приклад 28 . Деталь, виготовлена ​​автоматично, вважається придатною, якщо відхилення її контрольованого розміру від проектного не перевищує 10 мм. Випадкові відхилення контрольованого розміру від проектного підпорядковані нормальному закону розподілу із середнім квадратичним відхиленням мм та математичним очікуванням. Скільки відсотків придатних деталей виготовляє автомат?

Рішення. Розглянемо випадкову величину Х - Відхилення розміру від проектного. Деталь буде визнана придатною, якщо випадкова величина належить до інтервалу . Імовірність виготовлення придатної деталі знайдемо за формулою . Отже, відсоток придатних деталей, що виготовляються автоматично, дорівнює 95,44%.

Біноміальний розподіл

Біноміальним є розподіл ймовірностей появи m числа подій у п незалежних випробуваннях, у кожному з яких ймовірність появи події постійна та дорівнює р . Імовірність можливого числа події обчислюється за формулою Бернуллі: ,

де. Постійні п і р , що входять до цього виразу, параметри біномного закону. Біноміальний розподіл описує розподіл ймовірностей дискретної випадкової величини.

Основні числові характеристики біномного розподілу. Математичне очікування одно. Дисперсія дорівнює . Коефіцієнти асиметрії та ексцесу рівні та . При необмеженому зростанні числа випробувань А і Е прагнуть нуля, отже, можна припустити, що биномиальное розподіл сходиться до нормального зі зростанням числа випробувань.

Приклад 29 . Виробляються незалежні випробування з однаковою ймовірністю появи події А у кожному випробуванні. Знайти ймовірність появи події А в одному випробуванні, якщо дисперсія числа появ у трьох випробуваннях дорівнює 0,63.

Рішення. Для біномного розподілу . Підставимо значення, отримаємо звідси або тоді та .

Розподіл Пуассона

Закон розподілу рідкісних явищ

Розподіл Пуассона описує кількість подій m , що відбуваються за однакові проміжки часу за умови, що події відбуваються незалежно одна від одної з постійною середньою інтенсивністю. При цьому кількість випробувань п велика, а ймовірність появи події у кожному випробуванні р мала. Тому розподіл Пуассон називають законом рідкісних явищ або найпростішим потоком. Параметром розподілу Пуассона є величина, що характеризує інтенсивність появи подій п випробуваннях. Формула розподілу Пуассона .

Пуассонівським розподілом добре описуються кількість вимог на виплату страхових сум за рік, кількість викликів, що надійшли на телефонну станцію за певний час, кількість відмов елементів при випробуванні на надійність, бракованих виробів і так далі.

Основні числові характеристики розподілу Пуассона. Математичне очікування одно дисперсії і одно а . Тобто . Це є відмінною особливістюцього розподілу. Коефіцієнти асиметрії та ексцесу відповідно рівні.

Приклад 30 . Середня кількість виплат страхових сум на день дорівнює двом. Знайти ймовірність того, що за п'ять днів доведеться виплатити: 1) 6 страхових сум; 2) менше шести сум; 3) не менше шести. або експонентнеРозподіл.

Цей розподіл часто спостерігається щодо термінів служби різних пристроїв, часу безвідмовної роботи окремих елементів, частин системи та системи загалом, під час розгляду випадкових проміжків часу між появами двох послідовних рідкісних подій.

Щільність показового розподілу визначається параметром, який називають інтенсивністю відмов. Цей термін пов'язаний із конкретною областю додатку – теорією надійності.

Вираз інтегральної функції показового розподілу можна визначити, використовуючи властивості диференціальної функції:

Математичне очікування показового розподілу, дисперсія, середнє квадратичне відхилення. Таким чином, для цього розподілу характерно, що середнє квадратичне відхилення чисельно дорівнює математичному очікуванню. При будь-якому значенні параметра коефіцієнти асиметрії та ексцеса - постійні величини.

Приклад 31 . Середній час роботи телевізора до першої відмови дорівнює 500 годин. Знайти ймовірність того, що навмання взятий телевізор пропрацює без поломок більше 1000 годин.

Рішення. Оскільки середній час роботи до першої відмови дорівнює 500, то . Шукану ймовірність знайдемо за формулою.

Закон нормального розподілу, так званий закон Гауса - один із найпоширеніших законів. Це фундаментальний закон у теорії ймовірностей та в її застосуванні. Нормальний розподіл найчастіше зустрічається у вивченні природних та соціально-економічних явищ. Інакше висловлюючись, більшість статистичних сукупностей у природі та суспільстві підпорядковується закону нормального розподілу. Відповідно можна сказати, що сукупності великої кількостівеликих за обсягом вибірок підпорядковуються закону нормального розподілу. Ті із сукупностей, які відхиляються від нормального розподілу внаслідок спеціальних перетворень, можуть бути наближені до нормального. У зв'язку з цим слід пам'ятати, що принципова особливість цього закону стосовно інших законів розподілу полягає в тому, що він є законом кордону, до якого наближаються інші закони розподілу у певних (типових) умовах.

Слід зазначити, що термін "нормальний розподіл" має умовний зміст як загальноприйнятий у математичній та статистико-математичній літературі термін. Твердження, що той чи інший ознака будь-якого явища підпорядковується закону нормального розподілу, зовсім не означає непорушність норм, ніби властивих досліджуваному явищу, а віднесення останнього до другого виду закону означає якусь анормальність даного явища. У цьому вся сенсі термін " нормальний розподіл " не зовсім вдалий.

Нормальний розподіл (закон Гаус-Лапласа) є типом безперервного розподілу. Де Муавр (1773, Франція) вивів нормальний закон розподілу ймовірностей. Основні ідеї цього відкриття були використані в теорії помилок вперше К. Гауссом (1809, Німеччина) та А. Лапласом (1812, Франція), які зробили витчутний теоретичний внесок у розробку самого закону. Зокрема, К. Гаусс у своїх розробках виходив із визнання найімовірнішим значенням випадкової величини-середню арифметичну. Загальні умови виникнення нормального розподілу встановив А.М. Ляпунова. Їм було доведено, що якщо досліджувана ознака є результатом сумарного впливу багатьох факторів, кожен з яких мало пов'язаний з більшістю інших, і вплив кожного фактора на кінцевий результат набагато перекривається сумарним впливом всіх інших факторів, то розподіл стає близьким до нормального.

Нормальним називають розподіл ймовірностей безперервної випадкової величини, що має щільність:

1 +1 (& #) 2

/ (х, х,<т) = - ^ е 2 ст2

де х - математичне очікування чи середня величина. Як видно, нормальний розподіл визначається двома параметрами: х та °. Щоб встановити нормальний розподіл, достатньо знати математичне очікування або середнє і середнє квадратичне відхилення. Ці дві величини визначають центр угруповання та форму

кривою на графіку. Графік функції і (хх, в) називається нормальною кривою (крива Гауса) з параметрами х та в (рис. 12).

Крива нормального розподілу має точки перегину при X ± 1. Якщо уявити графічно, то між X = + l і 1 = -1 знаходиться 0,683 частини всієї площі кривої (тобто 68,3%). У межах X = + 2 і X-2 знаходяться 0,954 площі (95,4%), а між X = + 3 і X = - 3 - 0,997 частини всієї площі розподілу (99,7%). На рис. 13 проілюстровано характер нормального розподілу з одно-, дво- та трисигмовими кордонами.

При нормальному розподілі середня арифметична, мода та медіана дорівнюватимуть між собою. Форма нормальної кривої має вигляд одновершинної симетричної кривої, гілки якої асимптотично наближаються до осі абсцис. Найбільша ордината кривої відповідає х = 0. У цій точці на осі абсцис розміщується чисельне значення ознак, що дорівнює середній арифметичній, моді та медіані. По обидва боки від вершини кривої її гілки приходять, змінюючи у певних точках форму опуклості на увігнутість. Ці точки симетричні і відповідають значенням х = ± 1, тобто величин ознаки, відхилення яких від середньої чисельно дорівнює середньому квадратичному відхилення. Ордината, що відповідає середній арифметичній, ділить всю площу між кривою та віссю абсцис навпіл. Отже, ймовірності появи значень досліджуваної ознаки більших і менших за середню

арифметичній дорівнюватимуть 0,50, тобто х, (~^х) = 0,50 В

Рис.12. Крива нормального розподілу (крива Гауса)

Форму та положення нормальної кривої зумовлюють значення середнього та середнього квадратичного відхилення. Математично доведено, що зміна величини середнього (математичного очікування) не змінює форми нормальної кривої, а призводить лише до її зміщення уздовж осі абсцис. Крива зрушується вправо, якщо ~ росте, і вліво, якщо ~ приходить.

Рис.14. Криві нормального розподілу з різними значеннями параметрав

Про зміну форми графіка нормальної кривої при зміні

середнього квадратичного відхилення можна судити по максимуму

диференціальної функції нормального розподілу, рівний 1

Як видно, при зростанні величини ° максимальна крива ординату буде зменшуватися. Отже, крива нормального розподілу стискатиметься до осі абсцис і прийматиме більш плосковершинну форму.

І, навпаки, при зменшенні параметра нормальна крива витягується в позитивному напрямку осі ординат, а форма "дзвона" стає більш гостровершиною (рис. 14). Зазначимо, що незалежно від величини параметрів ~ і в площу, обмежена віссю абсцис і кривою, завжди дорівнює одиниці (властивість щільності розподілу). Це наочно ілюструє графік (рис. 13).

Названі вище особливості прояву "нормальності" розподілу дозволяють виділити низку загальних властивостей, які мають криві нормального розподілу:

1) будь-який нормальний крива досягає точки максимуму = х) приходить безперервно праворуч і ліворуч від нього, поступово наближаючись до осі абсцис;

2) будь-яка нормальна крива симетрична по відношенню до прямої,

паралельної осі ординат і проходить через точку максимуму = х)

максимальна ордината дорівнює ^^^ я;

3) будь-яка нормальна крива має форму "дзвона", має опуклість, яка спрямована вгору до точки максимуму. У точках х ~ ° і х + в вона змінює опуклість, і чим менше а, тим гостріше "дзвін", а чим більше а, тим більш нахилею стає вершина "дзвона" (рис.14). Зміна математичного очікування (за незмінної величини

в) не призводить до зміни форми кривої.

При х = 0 і ° = 1 нормальну криву називають нормованою кривою чи нормальним розподілом у канонічному вигляді.

Нормована крива описується такою формулою:

Побудова нормальної кривої за емпіричними даними проводиться за формулою:

пі 1 - "" = --- 7 = е

де і ™ – теоретична частота кожного інтервалу (групи) розподілу; - сума частот, рівну обсягу сукупності; - крок інтервалу;

ж - відношення довжини кола до її діаметру, яке складає

е - основа натуральних логарифмів, що дорівнює 2,71828;

Друга та третя частини формули) є функцією

нормованого відхилення ЦЧ), яку можна розрахувати для будь-яких значень X. Таблиці значень ЦЧ) зазвичай називають "таблиці ординат нормальної кривої" (додаток 3). При використанні цих функцій робоча формула нормального розподілу набуває простого вигляду:

приклад.Розглянемо випадок побудови нормальної кривої з прикладу даних про розподіл 57 працівників за рівнем денного заробітку (табл. 42). За даними таблиці 42, знаходимо середню арифметичну:

~ = ^ = І6 54 =

Розраховуємо середнє квадратичне відхилення:

Для кожного рядка таблиці знаходимо значення нормованого відхилення

х і ~ х | 12 г => - = - ^ 2 = 1.92

а 6.25 (дд Я першого інтервалу тощо).

У графі 8 табл. 42 записуємо табличне значення функції Ді) з програми, наприклад, для першого інтервалу X = 1.92 знаходимо "1,9" проти "2" (0.0632).

Для обчислення теоретичних частот, тобто ординат кривої нормального розподілу, обчислюється множник:

* = ^ = 36,5 а 6,25

Усі знайдені табличні значення функції /(г) множимо на 36,5. Так, для першого інтервалу отримуємо 0,0632x36,5 = 2,31 т. Прийнято нечисленні

частоти (п "<5) об'єднувати (у нашому прикладі - перші два та останні два інтервали).

Якщо крайні теоретичні частоти значно відрізняються від нуля, розбіжність між сумами емпіричних та теоретичних частот може бути значною.

Графік розподілу емпіричних і теоретичних частот (нормальна крива) за даними прикладу, що розглядається, показано на малюнку 15.

Розглянемо приклад визначення частот нормального розподілу випадку, як у крайніх інтервалах відсутня частота (табл. 43). Тут емпірична

X - нормоване відхилення, (в) а - середнє квадратичне відхилення.

частота першого інтервалу дорівнює нулю. Отримана сума неуточнених частот не дорівнює сумі їх емпіричних значень (56*57). І тут розраховується теоретична частота для вмивання отриманих значень центру інтервалу, нормованого відхилення та її функції.

У таблиці 43 ці величини обведено прямокутником. При побудові графіка нормальної кривої у разі теоретичну криву продовжують. У даному випадку нормальна крива буде продовжена у бік негативних відхилень від середньої, оскільки перша не уточнена частота дорівнює 5. Розрахована теоретична частота (уточнена) для першого інтервалу дорівнюватиме одиниці. За сумою уточнені частоти збігаються з емпіричними

Таблиця 42

Розрахункові величини

Статистичні параметри

Інтервал,

Кількість одиниць,

х) 2

нормоване відділення,

теоретична

частота нормального ряду розподілу,

/ 0) х - а

>>

Тисяча шістсот п'ятдесят чотири

а = 6,25

^i = 36,5 а

Таблиця 43

Розрахунок частот нормального розподілу (вирівнювання емпіричних частот за нормальним законом)

Кількість одиниць,

Розрахункові величини

Статистичні параметри

Інтервал (і-2)

Середнє значення (центр) інтервалу,

(Je, -xf

^ x t-x) 1 n та

нормоване відхилення

x s- х

t= x --L

табличне значення функції, f(t)

теоретична

частота нормального ряду розподілу

уточнене значення теоретичної частоти,

ш

-

-

-

-

-

про = 2,41

Рис. 15. Емпіричний розподіл(1) та нормальна крива (2)

Криву нормального розподілу за досліджуваною сукупністю можна побудувати й іншим способом (на відміну від розглянутого вище). Так, якщо необхідно мати наближену уявлення про відповідність фактичного нормального розподілу, обчислення здійснюють наступним послідовності. Визначають максимальну ординату, яка відповідає середньому розміру ознаки), потім, обчисливши середнє квадратичне відхилення, розраховують координати точок кривої нормального розподілу за схемою, викладеною в таблицях 42 і 43. Так, за вихідними та розрахунковими даними таблиці 43 повинні середню ~ = 26 Ця величина Середня збігається з центром четвертого інтервалу (25-27). Отже, частота цього інтервалу "20" може бути прийнята (при побудові графіка) максимальну ординату). Маючи обчислену дисперсію (в = 2,41 см. табл. 43), розраховуємо значення координат всіх необхідних точок кривої нормального розподілу (табл. 44, 45). За отриманими координатами креслимо нормальну криву (рис. 16), прийнявши максимальну частоту ординату четвертого інтервалу.

Узгодженість емпіричного розподілу із нормальним може бути встановлена ​​також шляхом спрощених розрахунків. Так, якщо відношення показника ступеня асиметрії (^) до своєї середньоквадратичної помилки ш а "або відношення показника ексцесу (Ех) до своєї середньоквадратичної помилки т& перевищує за абсолютною величиною число «3», робиться висновок про невідповідність емпіричного розподілу характеру нормального розподілу (тобто,

Ац Е х

якщо А> 3 або ш е "> 3).

Є й інші, нетрудомісткі прийоми встановлення "нормальності" розподілу: а) порівняння середньої арифметичної з модою та медіаною; б) використання цифр Вестергард; в) застосування графічного образу за допомогою напівлогарифмічної сітки Турбіна;г) обчислення спеціальних критеріїв узгодження та ін.

Таблиця 44

Координати 7 точок кривої нормального розподілу

Таблиця 45

Обчислення координат точок кривої нормального розподілу

x - 1,5 (7 =

х - а = 23,6

х - 0,5 (7 = = 24,8

х + 0,5ст = 27,2

х + а = 28,4

X+1,5 (7 =

Рис.16. Крива нормального розподілу, побудована по семи точках

Насправді щодо сукупності щодо узгодження її розподілу з нормальним часто користуються " правилом 3сг " .

Математично доведено ймовірність того, що відхилення від середньої по абсолютній величині буде менше потрійного середнього квадратичного відхилення, що дорівнює 0,9973, тобто, ймовірність того, що абсолютна величина відхилення перевищує потрійне середнє квадратичне відхилення дорівнює 0,0027 або дуже мала. Виходячи з принципу неможливості малоймовірних подій, можна вважати практично неможливим "випадок перевищення" 3 ст. Якщо випадкова величина розподілена нормально, абсолютна величина її відхилення від математичного очікування (середньої) не перевищує потрійного середнього квадратичного відхилення.

У практичних розрахунках діють в такий спосіб. Якщо за невідомого характеру розподілу досліджуваної випадкової величини розраховане значення відхилення від середньої виявиться менше значення 3 СТ, тобто підстави вважати, що ознака, що досліджується, розподілена нормально. Якщо зазначений параметр перевищить числове значення 3 СТ, вважатимуться, що розподіл досліджуваної величини не узгоджується з нормальним розподілом.

Обчислення теоретичних частот для досліджуваного емпіричного ряду розподілу прийнято називати вирівнюванням емпіричних кривих за нормальним (або будь-яким іншим) законом розподілу. Цей процес має важливе як теоретичне, так і практичне значення. Вирівнювання емпіричних даних розкриває закономірність у тому розподілі, яка може бути завуальована випадковою формою свого прояви. Встановлену в такий спосіб закономірність можна використовуватиме вирішення низки практичних завдань.

З розподілом, близьким до нормального, дослідник зустрічається в різних сферах науки та галузях практичної діяльності людини. В економіці такого роду розподіли трапляються рідше, ніж, скажімо, у техніці чи біології. Зумовлено це самою природою соціально-економічних явищ, які характеризуються великою складністю взаємопов'язаних та взаємопов'язаних факторів, а також наявністю низки умов, що обмежують вільну гру випадків. Але економіст повинен звертатися до нормального розподілу, аналізуючи будову емпіричних розподілів як до деякого еталону. Таке порівняння дозволяє з'ясувати характер внутрішніх умов, які визначають дану фігуру розподілу.

Проникнення сфери статистичних досліджень у область соціально-економічних явищ дозволило розкрити існування великої кількості різного типу кривих розподілів. Однак не слід вважати, що теоретична концепція кривої нормального розподілу взагалі мало придатна у статистико-математичному аналізі такого типу явищ. Вона може бути не завжди прийнятна в аналізі конкретного статистичного розподілу, але в галузі теорії та практики вибіркового методу дослідження має першорядне значення.

Назвемо основні аспекти застосування нормального розподілу у статистико-математичному аналізі.

1. Для визначення ймовірності конкретного значення ознаки. Це необхідно при перевірці гіпотез щодо відповідності того чи іншого емпіричного розподілу нормальному.

2. Оцінюючи низки параметрів, наприклад, середніх, методом максимальної правдоподібності. Суть його полягає у визначенні такого закону, якому підпорядковується сукупність. Визначається та оцінка, яка дає максимальні значення. Найкраще наближення до параметрів генеральної сукупності дає відношення:

у = - 2 = е 2

3. Для визначення ймовірності вибіркових середніх щодо генеральних середніх.

4. При визначенні довірчого інтервалу, де знаходиться наближене значення показників генеральної сукупності.

Нормальний розподіл ( normal distribution) - відіграє важливу роль в аналізі даних.

Іноді замість терміну нормальне розподілвживають термін гауссівський розподілна честь К. Гаусса (старіші терміни, що практично не вживаються в даний час: закон Гаусса, Гаусса-Лапласа розподіл).

Одновимірний нормальний розподіл

Нормальний розподіл має щільність:

У цій формулі фіксовані параметри, - середня, - стандартне відхилення.

Графіки щільності за різних параметрів наведено .

Характеристична функція нормального розподілу має вигляд:

Диференціюючи характеристичну функцію та вважаючи t = 0, Отримуємо моменти будь-якого порядку.

Крива щільності нормального розподілу симетрична щодо і має у цій точці єдиний максимум, рівний

Параметр стандартного відхилення змінюється від 0 до ∞.

Середнє змінюється у межах від -∞ до +∞.

При збільшенні параметра крива розтікається вздовж осі х, при прагненні 0 стискається навколо середнього значення (параметр характеризує розкид, розсіювання).

При зміні крива зрушується вздовж осі х(Див. графіки).

Варіюючи параметри і ми отримуємо різноманітні моделі випадкових величин, що у телефонії.

Типове застосування нормального закону в аналізі, наприклад телекомунікаційних даних - моделювання сигналів, опис шумів, перешкод, помилок, трафіку.

Графіки одновимірного нормального розподілу

Малюнок 1. Графік щільності нормального розподілу: середнє 0, стандартне відхилення 1

Малюнок 2. Графік щільності стандартного нормального розподілу з областями, що містять 68% та 95% всіх спостережень

Малюнок 3. Графіки щільностей нормальних розподілів з нульовим середнім та різними відхиленнями (=0.5, =1, =2)

Малюнок 4 Графіки двох нормальних розподілів N(-2,2) та N(3,2).

Зауважте, що центр розподілу зрушився при зміні параметра .

Зауваження

В програмі STATISTICAпід позначенням N(3,2) розуміється нормальний чи гауссів закон із параметрами: середнє = 3 і стандартне відхилення =2.

У літературі іноді другий параметр трактується як дисперсія, тобто. квадратстандартного відхилення.

Обчислення процентних точок нормального розподілу за допомогою ймовірнісного калькулятора STATISTICA

За допомогою ймовірнісного калькулятора STATISTICAможна обчислити різні характеристики розподілів, не вдаючись до громіздких таблиць, які у старих книгах.

Крок 1.Запускаємо Аналіз / Імовірнісний калькулятор / Розподілу.

У розділі розподілу оберемо нормальне.

Рисунок 5. Запуск калькулятора імовірнісних розподілів

Крок 2Вказуємо параметри, що нас цікавлять.

Наприклад, ми хочемо обчислити 95% квантиль нормального розподілу із середнім 0 та стандартним відхиленням 1.

Укажіть ці параметри в полях калькулятора (див. поля калькулятора середнє та стандартне відхилення).

Введемо параметр p = 0,95.

Галочка "Зворотна ф.р". з'явиться автоматично. Поставимо галочку "Графік".

Натисніть кнопку «Обчислити» у верхньому правому кутку.

Малюнок 6. Налаштування параметрів

Крок 3У полі Z отримуємо результат: значення квантилю дорівнює 1,64 (див. наступне вікно).

Рисунок 7. Перегляд результату роботи калькулятора

Малюнок 8. Графіки щільності та функції розподілу. Пряма x=1,644485

9. Графіки функції нормального розподілу. Вертикальні пунктирні прямі-x=-1.5, x=-1, x=-0.5, x=0

10. Графіки функції нормального розподілу. Вертикальні пунктирні прямі - x = 0.5, x = 1, x = 1.5, x = 2

Оцінка параметрів нормального розподілу

Значення нормального розподілу можна обчислити за допомогою інтерактивного калькулятора.

Двовимірний нормальний розподіл

Одновимірний нормальний розподіл природно узагальнюється на двовимірненормальний розподіл.

Наприклад, якщо ви розглядаєте сигнал лише в одній точці, то вам достатньо одномірного розподілу, у двох точках – двовимірного, у трьох точках – тривимірного тощо.

Загальна формула для двовимірного нормального розподілу має вигляд:

Де - парна кореляція між X 1і X 2;

X 1відповідно;

Середнє та стандартне відхилення змінної X 2відповідно.

Якщо випадкові величини Х 1і Х 2незалежні, то кореляція дорівнює 0 = 0, відповідно середній член в експоненті занулюється, і ми маємо:

f(x 1 ,x 2) = f(x 1)*f(x 2)

Для незалежних величин двовимірна щільність розпадається у добутку двох одномірних щільностей.

Графіки щільності двовимірного нормального розподілу

Рисунок 11. Графік щільності двовимірного нормального розподілу (нульовий вектор середніх, одинична матриця ковараційного)

Рисунок 12. Перетин графіка щільності двовимірного нормального розподілу площиною z=0.05

Малюнок 13. Графік щільності двовимірного нормального розподілу (нульовий вектор мат. очікування, матриця кваріації з 1 на головній діагоналі і 0.5 на побічній)

Рисунок 14. Перетин графіка щільності двовимірного нормального розподілу (нульовий вектор мат. очікування, матриця кваріації з 1 на головній діагоналі і 0.5 на побічній) площиною z= 0.05

Малюнок 15. Графік щільності двовимірного нормального розподілу (нульовий вектор мат. очікування, матриця кваріації з 1 на головній діагоналі і -0.5 на побічній)

Малюнок 16. Перетин графіка щільності двовимірного нормального розподілу (нульовий вектор мат. очікування, матриця кваріації з 1 на головній діагоналі і -0.5 на побічній) площиною z=0.05

Малюнок 17. Перетину графіків густин двомірного нормального розподілу площиною z=0.05

Для кращого розуміння двовимірного нормального розподілу спробуйте вирішити таке завдання.

Завдання. Подивіться графік двовимірного нормального розподілу. Подумайте, чи можна його уявити як обертання графіка одновимірного нормального розподілу? Коли потрібно застосувати деформацію?

У статті докладно показано, що таке нормальний закон розподілу випадкової величини і як ним користуватися під час вирішення практично завдань.

Нормальний розподіл у статистиці

Історія закону налічує 300 років. Першим відкривачем став Абрахам де Муавр, який вигадав апроксимацію ще 1733 року. Через багато років Карл Фрідріх Гаусс (1809) і П'єр-Симон Лаплас (1812) вивели математичні функції.

Лаплас також виявив чудову закономірність та сформулював центральну граничну теорему (ЦПТ), згідно з якою сума великої кількості малих та незалежних величин має нормальний розподіл.

Нормальний закон не є фіксованим рівнянням залежності однієї змінної від іншої. Фіксується лише характер цієї залежності. Конкретна форма розподілу визначається спеціальними параметрами. Наприклад, у = аx + b- Це рівняння прямої. Однак де саме вона проходить і під яким нахилом визначається параметрами аі b. Також із нормальним розподілом. Зрозуміло, що це функція, яка описує тенденцію високої концентрації значень біля центру, та її точна форма задається спеціальними параметрами.

Крива нормального розподілу Гауса має такий вигляд.

Графік нормального розподілу нагадує дзвін, тож можна зустріти назву дзвоноподібна крива. Графік має «горб» у середині і різке зниження щільності по краях. У цьому полягає суть нормального розподілу. Імовірність того, що випадкова величина виявиться біля центру набагато вищою, ніж те, що вона сильно відхилиться від середини.

На малюнку вище зображені дві ділянки під кривою Гауса: синій та зелений. Підстави, тобто. інтервали, в обох ділянок рівні. Але помітно вирізняються висоти. Синя ділянка віддалена від центру, і має істотно меншу висоту, ніж зелена, яка знаходиться в самому центрі розподілу. Отже, відрізняються і площі, тобто ймовірності попадання в зазначені інтервали.

Формула нормального розподілу (щільності) така.

Формула складається з двох математичних констант:

π - Число пі 3,142;

е– основа натурального логарифму 2,718;

двох змінних параметрів, що задають форму конкретної кривої:

m– математичне очікування (у різних джерелах можуть використовуватись інші позначення, наприклад, µ або a);

σ 2– дисперсія;

ну і сама змінна x, на яку обчислюється щільність ймовірності.

Конкретна форма нормального розподілу залежить від 2-х параметрів: ( m) та ( σ 2). Коротко позначається N(m, σ 2)або N(m, σ). Параметр m(маточування) визначає центр розподілу, якому відповідає максимальна висота графіка. Дисперсія σ 2характеризує розмах варіації, тобто «розмазаність» даних.

Параметр математичного очікування зміщує центр розподілу вправо чи вліво, не впливаючи на форму кривої щільності.

А ось дисперсія визначає гострість кривої. Коли дані мають малий розкид, то вся їхня маса концентрується біля центру. Якщо ж у даних великий розкид, то вони розмазуються по широкому діапазону.

Щільність розподілу немає прямого практичного застосування. Для розрахунку можливостей потрібно проінтегрувати функцію щільності.

Імовірність того, що випадкова величина виявиться меншою за деяке значення x, визначається функцією нормального розподілу:

Використовуючи математичні властивості будь-якого безперервного розподілу, нескладно розрахувати будь-які інші ймовірності, оскільки

P(a ≤ X< b) = Ф(b) – Ф(a)

Стандартний нормальний розподіл

Нормальний розподіл залежить від параметрів середньої та дисперсії, через що погано видно його властивості. Добре мати певний зразок розподілу, який залежить від масштабу даних. І вона існує. Називається стандартним нормальним розподілом. Насправді це нормальний нормальний розподіл, тільки з параметрами математичного очікування 0, а дисперсією – 1, коротко записується N(0, 1).

Будь-який нормальний розподіл легко перетворюється на стандартне шляхом нормування:

де z– нова змінна, яка використовується замість x;
m- математичне очікування;
σ - стандартне відхилення.

Для вибіркових даних беруться оцінки:

Середнє арифметичне та дисперсія нової змінної zтепер також дорівнюють 0 і 1 відповідно. У цьому вся легко переконатися з допомогою елементарних алгебраїчних перетворень.

У літературі зустрічається назва z-оцінка. Це воно саме – нормовані дані. Z-оцінкуможна безпосередньо порівнювати з теоретичними можливостями, т.к. її масштаб збігається із зразком.

Подивимося тепер, як виглядає щільність стандартного нормального розподілу (для z-оцінок). Нагадаю, що функція Гауса має вигляд:

Підставимо замість (x-m)/σбукву z, а замість σ – одиницю, отримаємо функцію щільності стандартного нормального розподілу:

Графік густини:

Центр, як і очікувалося, знаходиться в точці 0. У цій точці функція Гауса досягає свого максимуму, що відповідає прийняттю випадковою величиною свого середнього значення (тобто. x-m=0). Щільність у цій точці дорівнює 0,3989, що можна порахувати навіть у розумі, т.к. e 0 =1 і залишається розрахувати лише співвідношення 1 на корінь із 2 пі.

Таким чином, за графіком добре видно, що значення, що мають маленькі відхилення від середньої, випадають частіше за інші, а ті, які сильно віддалені від центру, зустрічаються значно рідше. Шкала осі абсцис вимірюється у стандартних відхиленнях, що дозволяє відв'язатися від одиниць вимірювання та отримати універсальну структуру нормального розподілу. Крива Гауса для нормованих даних чудово демонструє інші властивості нормального розподілу. Наприклад, що воно є симетричним щодо осі ординат. У межах ±1σ від середньої арифметичної сконцентрована більшість всіх значень (прикидаємо поки що на око). У межах ±2σ перебуває більшість даних. У межах ±3σ перебувають майже всі дані. Остання властивість широко відома під назвою правило трьох сигмдля нормального розподілу.

Функція нормального стандартного розподілу дозволяє розраховувати ймовірності.

Зрозуміло, вручну ніхто не вважає. Все підраховано та розміщено у спеціальних таблицях, які є наприкінці будь-якого підручника зі статистики.

Таблиця нормального розподілу

Таблиці нормального розподілу зустрічаються двох типів:

- Таблиця щільності;

- Таблиця функції(Інтеграла від щільності).

Таблиця щільностівикористовується рідко. Тим не менш, побачимо, як вона виглядає. Допустимо, потрібно отримати щільність для z = 1, тобто. щільність значення, віддаленого від матожидания на 1 сигму. Нижче показано шматок таблиці.

Залежно від організації даних шукаємо потрібне значення за назвою стовпця та рядка. У нашому прикладі беремо рядок 1,0 і стовпець 0 , т.к. сотих часток немає. Шукане значення дорівнює 0,2420 (0 до 2420 опущений).

Функція Гауса симетрична щодо осі ординат. Тому φ(z)= φ(-z), тобто. щільність для 1 тотожна щільності для -1 що чітко видно на малюнку.

Щоб не марнувати папір, таблиці друкують тільки для позитивних значень.

На практиці частіше використовують значення функціїстандартного нормального розподілу, тобто ймовірності для різних z.

У таких таблицях містяться лише позитивні значення. Тому для розуміння та знаходження будь-якихпотрібних ймовірностей слід знати властивості стандартного нормального розподілу.

Функція Ф(z)симетрична щодо свого значення 0,5 (а не осі ординат, як густина). Звідси справедлива рівність:

Цей факт показаний на зображенні:

Значення функції Ф(-z)і Ф(z)ділять графік на 3 частини. Причому верхня та нижня частини рівні (позначені галочками). Для того, щоб доповнити ймовірність Ф(z)до 1, достатньо додати недостатню величину Ф(-z). Вийде рівність, вказана трохи вище.

Якщо необхідно знайти можливість потрапляння в інтервал (0; z)тобто ймовірність відхилення від нуля в позитивний бік до деякої кількості стандартних відхиленьдостатньо від значення функції стандартного нормального розподілу відібрати 0,5:

Для наочності можна подивитись малюнок.

На кривій Гауса, ця ж ситуація виглядає як площа від центру вправо до z.

Досить часто аналітика цікавить можливість відхилення в обидві сторони від нуля. Оскільки функція симетрична щодо центру, попередню формулу потрібно помножити на 2:

Малюнок нижче.

Під кривою Гауса це центральна частина, обмежена вибраним значенням -zзліва та zправоруч.

Зазначені характеристики слід взяти до уваги, т.к. Табличні значення рідко відповідають цікавому інтервалу.

Для полегшення завдання у підручниках зазвичай публікують таблиці для функції виду:

Якщо потрібна можливість відхилення в обидві сторони від нуля, то, як ми щойно переконалися, табличне значення для цієї функції просто множиться на 2.

Тепер подивимося на конкретні приклади. Нижче показано таблицю стандартного нормального розподілу. Знайдемо табличні значення для трьох z: 1,64, 1,96 та 3.

Як зрозуміти зміст цих чисел? Почнемо з z=1,64, для якого табличне значення становить 0,4495 . Найпростіше пояснити сенс малюнку.

Тобто ймовірність того, що стандартизована нормально розподілена випадкова величина потрапить в інтервал від 0 до 1,64 , дорівнює 0,4495 . При вирішенні завдань зазвичай потрібно розрахувати ймовірність відхилення в обидві сторони, тому помножимо величину 0,4495 на 2 та отримаємо приблизно 0,9. Займана площа під кривою Гауса показана нижче.

Таким чином, 90% усіх нормально розподілених значень потрапляє до інтервалу ±1,64σвід середньої арифметичної. Я не випадково вибрав значення z=1,64, т.к. околиця навколо середньої арифметичної, що займає 90% всієї площі, іноді використовується для розрахунку довірчих інтервалів. Якщо перевірене значення не потрапляє в зазначену область, його наступ малоймовірно (всього 10%).

Проте для перевірки гіпотез частіше використовується інтервал, що накриває 95% усіх значень. Половина ймовірності від 0,95 – це 0,4750 (Див. друге виділене в таблиці значення).

Для цієї ймовірності z = 1,96.Тобто. в межах майже ±2σвід середньої є 95% значень. Лише 5% випадають за ці межі.

Ще одне цікаве та часто використовується табличне значення відповідає z=3, воно одно за нашою таблицею 0,4986 . Помножимо на 2 і отримаємо 0,997 . Отже, у межах ±3σвід середньої арифметичної укладено майже всі значення.

Так виглядає правило 3 сигми для нормального розподілу на діаграмі.

За допомогою статистичних таблиць можна отримати будь-яку можливість. Однак цей метод дуже повільний, незручний та сильно застарів. Сьогодні все робиться на комп'ютері. Далі переходимо до практики розрахунків у Excel.

Нормальний розподіл у Excel

У Excel є кілька функцій для підрахунку ймовірностей чи зворотних значень нормального розподілу.

Функція НОРМ.СТ.РАСП

Функція НОРМ.СТ.РАСПпризначена для розрахунку щільності ϕ(z)чи ймовірності Φ(z)за нормованими даними ( z).

=НОРМ.СТ.РАСП(z;інтегральна)

z– значення стандартизованої змінної

інтегральна- якщо 0, то розраховується щільністьϕ(z) , якщо 1 – значення функції Ф(z), тобто. ймовірність P(Z

Розрахуємо щільність та значення функції для різних z: -3, -2, -1, 0, 1, 2, 3(їх вкажемо в осередку А2).

Для розрахунку густини знадобиться формула =НОРМ.СТ.РАСП(A2;0). На діаграмі нижче – червона точка.

Для розрахунку значення функції =НОРМ.СТ.РАСП(A2;1). На діаграмі зафарбована площа під нормальною кривою.

Насправді частіше доводиться розраховувати ймовірність того, що випадкова величина не вийде за деякі межі від середньої (у середньоквадратичних відхиленнях, що відповідають змінній z), тобто. P(|Z| .

Визначимо, чому дорівнює ймовірність попадання випадкової величини у межі ±1z, ±2z та ±3zвід нуля. Потрібна формула 2Ф(z)-1, Excel =2*НОРМ.СТ.РАСП(A2;1)-1.

На діаграмі добре видно основні основні властивості нормального розподілу, включаючи правило трьох сигм. Функція НОРМ.СТ.РАСП– це автоматична таблиця значень функції нормального розподілу Excel.

Може стояти і зворотне завдання: за ймовірністю P(Z знайти стандартизовану величину zтобто квантиль стандартного нормального розподілу.

Функція НОРМ.СТ.ОБР

НОРМ.СТ.ОБРрозраховує зворотне значення функції стандартного нормального розподілу. Синтаксис складається з одного параметра:

=НОРМ.СТ.ОБР(імовірність)

ймовірність- Це ймовірність.

Дана формула використовується так само часто, як і попередня, адже за тими ж таблицями доводиться шукати не тільки ймовірності, а й квантили.

Наприклад, при розрахунку довірчих інтервалів визначається довірча ймовірність, за якою потрібно розрахувати величину z.

Враховуючи те, що довірчий інтервал складається з верхньої та нижньої межі та те, що нормальний розподіл симетрично щодо нуля, достатньо отримати верхню межу (позитивне відхилення). Нижня межа береться із негативним знаком. Позначимо довірчу ймовірність як γ (гамма), тоді верхня межа довірчого інтервалу розраховується за такою формулою.

Розрахуємо в Excel значення z(що відповідає відхилення від середньої в сигмах) для кількох ймовірностей, включаючи ті, які знає напам'ять будь-який статистик: 90%, 95% і 99%. У осередку B2 зазначимо формулу: =НОРМ.СТ.ОБР((1+A2)/2). Змінюючи значення змінної (ймовірності в осередку А2) отримаємо різні межі інтервалів.

Довірчий інтервал для 95% дорівнює 1,96, тобто майже 2 середньоквадратичні відхилення. Звідси легко навіть в умі оцінити можливий розкид нормальної випадкової величини. Загалом довірчим ймовірностям 90%, 95% і 99% відповідають довірчі інтервали ±1,64, ±1,96 та ±2,58 σ.

У цілому нині функції НОРМ.СТ.РАСП і НОРМ.СТ.ОБР дозволяють зробити будь-який розрахунок, що з нормальним розподілом. Але, щоб полегшити та зменшити кількість дій, у Excel є кілька інших функцій. Наприклад, для розрахунку довірчих інтервалів середньої можна використовувати ДОВЕРИТ.НОРМ. Для перевірки середньої арифметичної є формула Z.ТЕСТ.

Розглянемо ще кілька корисних формул із прикладами.

Функція НОРМ.РАСП

Функція НОРМ.РАСПвідрізняється від НОРМ.СТ.РАСПлише тим, що її використовують для обробки даних будь-якого масштабу, а не лише нормованих. Параметри нормального розподілу вказуються у синтаксисі.

=НОРМ.РАСП(x;середнє;стандартне_відкл;інтегральна)

середня– математичне очікування, яке використовується як перший параметр моделі нормального розподілу

стандартне_відкл– середньоквадратичне відхилення – другий параметр моделі

інтегральна– якщо 0, то розраховується щільність, якщо 1 – значення функції, тобто. P(X

Наприклад, щільність для значення 15, яке витягли з нормальної вибірки з маточенням 10, стандартним відхиленням 3, розраховується так:

Якщо останній параметр поставити 1, отримаємо ймовірність того, що нормальна випадкова величина виявиться менше 15 при заданих параметрах розподілу. Таким чином, ймовірності можна розраховувати безпосередньо за вихідними даними.

Функція НОРМ.ОБР

Це квантиль нормального розподілу, тобто. значення зворотної функції. Синтаксис наступний.

=НОРМ.ОБР(ймовірність;середнє;стандартне_відкл)

ймовірність- Імовірність

середня- маточіння

стандартне_відкл- середньоквадратичне відхилення

Призначення те саме, що й у НОРМ.СТ.ОБР, тільки функція працює з даними будь-якого масштабу.

Приклад показаний у ролику наприкінці статті.

Моделювання нормального розподілу

Для деяких завдань потрібна генерація нормальних випадкових чисел. Готовий функції цього немає. Однак Excel має дві функції, які повертають випадкові числа: ВИПАДМІЖі СЛЧИС.Перша видає випадкові рівномірно розподілені цілі числа у зазначених межах. Друга функція генерує рівномірно розподілені випадкові числа між 0 і 1. Щоб зробити штучну вибірку з будь-яким заданим розподілом, потрібна функція СЛЧИС.

Припустимо, для проведення експерименту необхідно отримати вибірку з нормально розподіленої генеральної сукупності з маточенням 10 і стандартним відхиленням 3. Для одного випадкового значення напишемо формулу Excel.

НОРМ.ОБР(СЛЧИС();10;3)

Простягнемо її на необхідну кількість осередків і нормальна вибірка готова.

Для моделювання стандартизованих даних слід користуватися НОРМ.СТ.ОБР.

Процес перетворення рівномірних чисел на нормальні можна показати на наступній діаграмі. Від рівномірних ймовірностей, що генеруються формулою СЛЧИС, проведено горизонтальні лінії до графіка функції нормального розподілу. Потім від точок перетину ймовірностей із графіком опущені проекції на горизонтальну вісь.

Нормальний закон розподілу ймовірностей

Без перебільшення його можна назвати філософським законом. Спостерігаючи за різними об'єктами та процесами навколишнього світу, ми часто стикаємося з тим, що чогось буває мало, і що буває норма:


Перед вами важливий вигляд функції щільностінормального розподілу ймовірностей, і я вітаю вас на цьому цікавому уроці.

Які приклади можна навести? Їхня просто темрява. Це, наприклад, зростання, вага людей (і не тільки), їхня фізична сила, розумові здібності і т.д. Існує «основна маса» (за тією чи іншою ознакою)і є відхилення в обидві сторони.

Це різні характеристики неживих об'єктів (ті самі розміри, вага). Це випадкова тривалість процесів, наприклад, час забігу стометрівки або перетворення смоли на бурштин. З фізики згадалися молекули повітря: серед них є повільні, швидкі, але більшість рухаються зі «стандартними» швидкостями.

Далі відхиляємося від центру ще одне стандартне відхилення і розраховуємо висоту:

Зазначаємо точки на кресленні (зелений колір)і бачимо, що цього цілком достатньо.

На завершальному етапі акуратно креслимо графік, та особливо акуратновідбиваємо його опуклість/увігнутість! Ну і, мабуть, ви давно зрозуміли, що вісь абсцис – це горизонтальна асимптота, І «залазити» за неї категорично не можна!

При електронному оформленні рішення графік легко побудувати в Екселі, і несподівано для себе я навіть записав короткий відеоролик на цю тему. Але спочатку поговоримо про те, як змінюється форма нормальної кривої в залежності від значень і .

При збільшенні чи зменшенні «а» (При постійному «сигма»)графік зберігає свою форму та переміщається вправо / влівовідповідно. Так, наприклад, при функція набуває вигляду і наш графік «переїжджає» на 3 одиниці вліво – рівно на початок координат:


Нормально розподілена величина з нульовим математичним очікуванням отримала цілком природну назву - центрована; її функція щільності – парна, І графік симетричний щодо осі ординат.

У разі зміни «сигми» (При постійному "а"), графік «залишається дома», але змінює форму. При збільшенні він стає нижчим і витягнутим, наче восьминіг, що розтягує щупальця. І, навпаки, при зменшенні графіка стає вужчим і високим- Виходить «здивований восьминіг». Так, при зменшенні«сигми» вдвічі: попередній графік звужується і витягується вгору вдвічі:

Все в повній відповідності до геометричними перетвореннями графіків.

Нормальний розподіл із одиничним значенням «сигма» називається нормованим, а якщо воно ще й центровано(наш випадок), то такий розподіл називають стандартним. Воно має ще простішу функцію щільності, яка вже зустрічалася в локальної теореми Лапласа: . Стандартний розподіл знайшов широке застосування практично, і дуже скоро ми остаточно зрозуміємо його призначення.

Ну а тепер дивимось кіно:

Так, абсолютно вірно - якось незаслужено у нас залишилася в тіні функція розподілу ймовірностей. Згадуємо її визначення:
- Імовірність того, що випадкова величина набуде значення, МЕНШЕ, ніж змінна , яка "пробігає" всі дійсні значення до "плюс" нескінченності.

Усередині інтеграла зазвичай використовують іншу букву, щоб не виникало «накладок» з позначеннями, бо тут кожному значенню ставиться у відповідність невласний інтеграл, який дорівнює деякому числуз інтервалу.

Майже всі значення не піддаються точному розрахунку, але, як ми тільки що бачили, із сучасними обчислювальними потужностями з цим немає жодних труднощів. Так, для функції стандартного розподілу відповідна екселівська функція взагалі містить один аргумент:

=НОРМСТРАСП(z)

Раз, два – і готово:

На кресленні добре видно виконання всіх властивостей функції розподілу, і з технічних нюансів тут слід звернути увагу на горизонтальні асимптотиі точку перегину.

Тепер згадаємо одне з ключових завдань теми, а саме з'ясуємо, як знайти – ймовірність того, що нормальна випадкова величина набуде значення з інтервалу. Геометрично ця ймовірність дорівнює площіміж нормальною кривою та віссю абсцис на відповідній ділянці:

але щоразу вимучувати наближене значення нерозумно, і тому тут раціональніше використовувати «легку» формулу:
.

! Згадує також , що

Тут можна знову задіяти Ексель, але є пара вагомих "але": по-перше, він не завжди під рукою, а по-друге, "готові" значення, швидше за все, викличуть питання у викладача. Чому?

Про це я неодноразово розповідав раніше: свого часу (і ще не дуже давно) розкішшю був звичайний калькулятор, і в навчальній літературі досі зберігся «ручний» спосіб вирішення завдання. Його суть полягає в тому, щоб стандартизуватизначення «альфа» та «бета», тобто звести рішення до стандартного розподілу:

Примітка : функцію легко отримати із загального випадкуза допомогою лінійної заміни. Тоді й:

і з проведеної заміни випливає формула переходу від значень довільного розподілу – до відповідних значень стандартного розподілу.

Навіщо це потрібно? Справа в тому, що значення скрупульозно підраховані нашими предками і зведені до спеціальної таблиці, яка є в багатьох книгах за тервером. Але ще частіше зустрічається таблиця значень, з якою ми вже мали справу в інтегральної теореми Лапласа:

Якщо в нашому розпорядженні є таблиця значень функції Лапласа , То вирішуємо через неї:

Дробові значення традиційно округляємо до 4 знаків після коми, як це зроблено у типовій таблиці. І для контролю є Пункт 5 макета.

Нагадую, що , і щоб уникнути плутанини завжди контролюйте, таблиця ЯКИЙ функції перед очима.

Відповідьпотрібно дати у відсотках, тому розраховану ймовірність потрібно помножити на 100 і забезпечити результат змістовним коментарем:

- з перельотом від 5 до 70 м впаде приблизно 15,87% снарядів

Тренуємося самостійно:

Приклад 3

Діаметр підшипників, виготовлених на заводі, є випадковою величиною, розподіленою нормально з математичним очікуванням 1,5 см і середнім квадратичним відхиленням 0,04 см. Знайти ймовірність того, що розмір навмання взятого підшипника коливається від 1,4 до 1,6 см.

У зразку рішення і далі я використовуватиму функцію Лапласа як найпоширеніший варіант. До речі, зверніть увагу, що згідно з формулюванням, тут можна включити кінці інтервалу до розгляду. Втім, це критично.

І вже у цьому прикладі нам зустрівся особливий випадок – коли інтервал симетричний щодо математичного очікування. У такій ситуації його можна записати у вигляді і, користуючись непарністю функції Лапласа, спростити робочу формулу:


Параметр "дельта" називають відхиленнямвід математичного очікування, і подвійну нерівність можна «упаковувати» за допомогою модуля:

- Імовірність того, що значення випадкової величини відхилиться від математичного очікування менш ніж на .

Добре те рішення, яке вміщується в один рядок:)
- Імовірність того, що діаметр навмання взятого підшипника відрізняється від 1,5 см не більше ніж на 0,1 см.

Результат цього завдання вийшов близьким до одиниці, але хотілося б ще більшої надійності - а саме, дізнатися межі, в яких знаходиться діаметр майже всіхпідшипників. Чи існує якийсь критерій щодо цього? Існує! На поставлене запитання відповідає так зване

правило «трьох сигм»

Його суть полягає в тому, що практично достовірним є той факт, що нормально розподілена випадкова величина набуде значення з проміжку .

І насправді, ймовірність відхилення від матожидания менш ніж становить:
або 99,73%

У «перерахунку на підшипники» – це 9973 штуки з діаметром від 1,38 до 1,62 см і лише 27 «некондиційних» екземплярів.

У практичних дослідженнях правило "трьох сигм" зазвичай застосовують у зворотному напрямку: якщо статистичновстановлено, що майже всі значення досліджуваної випадкової величиниукладаються в інтервал довжиною 6 стандартних відхилень, то з'являються вагомі підстави вважати, що ця величина розподілена за нормальним законом. Перевірка здійснюється за допомогою теорії статистичних гіпотез.

Продовжуємо вирішувати суворі радянські завдання:

Приклад 4

Випадкова величина помилки зважування розподілена за нормальним законом з нульовим математичним очікуванням і стандартним відхиленням 3 грами. Знайти ймовірність того, що чергове зважування буде проведено з помилкою, що не перевищує модуля 5 грам.

Рішеннядуже просте. За умовою, і відразу зауважимо, що за чергового зважування (чогось чи когось)ми майже 100% отримаємо результат із точністю до 9 грам. Але в задачі фігурує вужче відхилення і за формулою:

- Імовірність того, що чергове зважування буде проведено з помилкою, що не перевищує 5 грам.

Відповідь:

Вирішене завдання принципово відрізняється від начебто схожого Приклад 3уроку про рівномірному розподілі. Там була похибка округленнярезультатів вимірів, тут йдеться про випадкової похибки самих вимірів. Такі похибки виникають у зв'язку з технічними характеристиками приладу (діапазон припустимих помилок, як правило, вказують у його паспорті), а також з вини експериментатора – коли ми, наприклад, «на око» знімаємо свідчення зі стрілки тієї ж ваги.

Окрім інших, існують ще так звані систематичніпомилки виміру. Це вже невипадковіпомилки, які виникають через некоректне налаштування або експлуатацію приладу. Так, наприклад, невідрегульовані ваги підлоги можуть стабільно «додавати» кілограм, а продавець систематично обвішувати покупців. Або не систематично можна обрахувати. Однак, у будь-якому випадку, випадковою така помилка не буде, і її маточкування відмінно від нуля.

…терміново розробляю курс з підготовки продавців =)

Самостійно вирішуємо зворотне завдання:

Приклад 5

Діаметр валика - випадкова нормально розподілена випадкова величина, середнє квадратичне відхилення її дорівнює мм. Знайти довжину інтервалу, симетричного щодо математичного очікування, куди з ймовірністю потрапить довжина діаметра валика.

Пункт 5* розрахункового макетав допомогу. Зверніть увагу, що тут не відоме математичне очікування, але це не заважає вирішити поставлене завдання.

І екзаменаційне завдання, яке я настійно рекомендую для закріплення матеріалу:

Приклад 6

Нормально розподілена випадкова величина задана своїми параметрами (математичне очікування) та (середнє квадратичне відхилення). Потрібно:

а) записати щільність ймовірності та схематично зобразити її графік;
б) знайти ймовірність того, що набуде значення з інтервалу ;
в) знайти ймовірність того, що відхилиться по модулю не більше ніж на ;
г) застосовуючи правило "трьох сигм", знайти значення випадкової величини.

Такі завдання пропонуються повсюдно, і за роки практики мені їх довелося вирішити сотні та сотні штук. Обов'язково попрактикуйтесь у ручній побудові креслення та використанні паперових таблиць;)

Ну а я розберу приклад підвищеної складності:

Приклад 7

Щільність розподілу ймовірностей випадкової величини має вигляд . Знайти, математичне очікування, дисперсію, функцію розподілу, побудувати графіки щільності та функції розподілу, знайти.

Рішення: Насамперед, звернемо увагу, що в умові нічого не сказано про характер випадкової величини Сама собою присутність експоненти ще нічого не означає: це може виявитися, наприклад, показовеабо взагалі довільне безперервний розподіл. І тому «нормальність» розподілу ще треба обґрунтувати:

Оскільки функція визначена при будь-комудійсному значенні , і його можна призвести до виду , то випадкова величина розподілена за нормальним законом.

Наводимо. Для цього виділяємо повний квадратта організуємо триповерховий дріб:


Обов'язково виконуємо перевірку, повертаючи показник у вихідний вигляд:

що ми й хотіли побачити.

Таким чином:
- за правилу дій зі ступенями«відщипуємо». І тут можна одразу записати очевидні числові характеристики:

Тепер знайдемо значення параметра. Оскільки множник нормального розподілу має вигляд і , то:
, звідки висловлюємо та підставляємо на нашу функцію:
, після чого ще раз пробіжимося по запису очима і переконаємося, що отримана функція має вигляд .

Побудуємо графік щільності:

та графік функції розподілу :

Якщо під рукою немає Екселя і навіть звичайного калькулятора, останній графік легко будується вручну! У точці функція розподілу набуває значення і тут знаходиться

Поділіться з друзями або збережіть для себе:

Завантаження...