Плътност на вероятността на нормално разпределена случайна променлива. Нормален закон за разпределение на вероятностите

Теорията на вероятностите разглежда доста голям брой различни закони за разпределение. За решаване на проблеми, свързани с изграждането на контролни диаграми, само няколко от тях представляват интерес. Най-важното от тях е нормален закон за разпределение, който се използва за конструиране на контролни диаграми, използвани в количествен контрол, т.е. когато имаме работа с непрекъсната случайна променлива. Нормалният закон за разпределение заема особено място сред другите закони за разпределение. Това се обяснява с факта, че, първо, най-често се среща в практиката, и, второ, това е ограничаващ закон, към който други закони на разпределение се приближават при много общи типични условия. Що се отнася до второто обстоятелство, в теорията на вероятностите е доказано, че сумата от достатъчно голям брой независими (или слабо зависими) случайни променливи, подчинени на каквито и да било закони за разпределение (при някои много свободни ограничения), приблизително се подчинява на нормалния закон и това е вярно още по-точно, ако се добавят повече случайни променливи. Повечето от случайните променливи, срещани в практиката, като например грешките на измерване, могат да бъдат представени като сума от много голям брой относително малки членове - елементарни грешки, всяка от които е причинена от отделна причина, независима от други. Нормалният закон се появява в случаите, когато случайна променлива хе резултат от голям брой различни фактори. Всеки фактор поотделно си струва хвлияе слабо и е невъзможно да се посочи кой влияе повече от останалите.

Нормална дистрибуция(Разпределение на Лаплас–Гаус) – вероятностно разпределение на непрекъсната случайна променлива хтака че плътността на разпределение на вероятността за - ¥<х< + ¥ принимает действительное значение:

Exp (3)

Тоест нормалното разпределение се характеризира с два параметъра m и s, където m е математическото очакване; s е стандартното отклонение на нормалното разпределение.

Стойности 2 е дисперсията на нормалното разпределение.

Математическото очакване m характеризира положението на разпределителния център, а стандартното отклонение s (SD) е характеристика на дисперсията (фиг. 3).

f(x) f(x)


Фигура 3 – Нормални функции на плътност на разпределение с:

а) различни математически очаквания m; б) различни стандартни отклонения s.

По този начин стойността μ определя се от позицията на кривата на разпределението по абсцисната ос. Измерение μ - същото като размерността на случайната променлива х. С нарастването на математическото очакване m и двете функции се изместват паралелно надясно. С намаляваща дисперсия s 2 плътността става все по-концентрирана около m, докато функцията на разпределение става все по-стръмна.

Стойността на σ определя формата на кривата на разпределение. Тъй като площта под кривата на разпределение трябва винаги да остава равна на единица, с увеличаване на σ кривата на разпределение става по-плоска. На фиг. Фигура 3.1 показва три криви за различни σ: σ1 = 0,5; σ2 = 1,0; σ3 = 2,0.

Фигура 3.1 – Функции на плътност на нормалното разпределение сразлични стандартни отклонения s.

Функцията на разпределение (интегрална функция) има формата (фиг. 4):

(4)

Фигура 4 – Интегрална (а) и диференциална (б) нормални функции на разпределение

Особено важна е линейната трансформация на нормално разпределена случайна променлива х, след което се получава случайна променлива Зс математическо очакване 0 и дисперсия 1. Тази трансформация се нарича нормализация:

Може да се извърши за всяка случайна променлива. Нормализацията позволява всички възможни варианти на нормалното разпределение да бъдат сведени до един случай: m = 0, s = 1.

Нормалното разпределение с m = 0, s = 1 се нарича нормализирано нормално разпределение (стандартизирано).

Стандартно нормално разпределение(стандартно разпределение на Лаплас-Гаус или нормализирано нормално разпределение) е вероятностното разпределение на стандартизирана нормална случайна променлива З, чиято плътност на разпределение е равна на:

при - ¥<z< + ¥

Функционални стойности Ф(z)определя се по формулата:

(7)

Функционални стойности Ф(z)и плътност f(z)нормализираното нормално разпределение се изчислява и таблично. Таблицата е съставена само за положителни стойности zЕто защо:

F (z) = 1Ф(z) (8)

Използвайки тези таблици, можете да определите не само стойностите на функцията и плътността на нормализираното нормално разпределение за дадено z, но също и стойностите на общата функция на нормалното разпределение, тъй като:

; (9)

. 10)

В много проблеми, включващи нормално разпределени случайни променливи, е необходимо да се определи вероятността за възникване на случайна променлива х, подчинени на нормалния закон с параметри m и s, за определена област. Такава секция може да бъде например полето на толеранс за параметър от горната стойност Uдо дъното Л.

Вероятност за попадане в интервала от х 1 към х 2 може да се определи по формулата:

По този начин вероятността за попадение на случайна променлива (стойност на параметър) хв полето на толеранс се определя по формулата

Примери за случайни променливи, разпределени по нормален закон, са височината на човек и масата на уловената риба от същия вид. Нормалното разпределение означава следното : има стойности на човешкия ръст, масата на рибата от същия вид, които интуитивно се възприемат като „нормални“ (и всъщност осреднени), и в достатъчно голяма извадка те се срещат много по-често от тези, които се различават нагоре или надолу.

Нормалното вероятностно разпределение на непрекъсната случайна променлива (понякога разпределение на Гаус) може да се нарече камбанообразно поради факта, че функцията на плътността на това разпределение, симетрична спрямо средната стойност, е много подобна на разреза на камбана (червена крива на фигурата по-горе).

Вероятността да срещнете определени стойности в извадка е равна на площта на фигурата под кривата, а в случай на нормално разпределение виждаме, че под горната част на „камбаната“, която съответства на стойности ​с тенденция към средното, площта и следователно вероятността е по-голяма, отколкото под ръбовете. По този начин получаваме същото нещо, което вече беше казано: вероятността да срещнете човек с „нормален“ ръст и да хванете риба с „нормално“ тегло е по-висока, отколкото за стойности, които се различават нагоре или надолу. В много практически случаи грешките при измерване се разпределят по закон, близък до нормалния.

Нека погледнем отново фигурата в началото на урока, която показва функцията на плътност на нормално разпределение. Графиката на тази функция е получена чрез изчисляване на определена извадка от данни в софтуерния пакет STATISTICA. На него колоните на хистограмата представляват интервали от извадкови стойности, чието разпределение е близко до (или, както обикновено се казва в статистиката, не се различава съществено от) действителната графика на функцията за плътност на нормалното разпределение, която е червена крива . Графиката показва, че тази крива наистина има формата на камбана.

Нормалното разпределение е ценно по много начини, защото като знаете само очакваната стойност на непрекъсната случайна променлива и нейното стандартно отклонение, можете да изчислите всяка вероятност, свързана с тази променлива.

Нормалното разпределение има и предимството, че е едно от най-лесните за използване. статистически тестове, използвани за проверка на статистически хипотези – t тест на Стюдънт- може да се използва само ако примерните данни се подчиняват на нормалния закон за разпределение.

Функция на плътност на нормалното разпределение на непрекъсната случайна променливаможе да се намери с помощта на формулата:

,

Където х- стойност на променящото се количество, - средна стойност, - стандартно отклонение, д=2,71828... - основата на естествения логаритъм, =3,1416...

Свойства на функцията за плътност на нормалното разпределение

Промените в средната стойност преместват нормалната крива на функцията на плътността към оста вол. Ако се увеличи, кривата се премества надясно, ако намалява, след това наляво.

Ако стандартното отклонение се промени, височината на върха на кривата се променя. Когато стандартното отклонение нараства, върхът на кривата е по-висок, а когато намалява, е по-нисък.

Вероятност случайна променлива с нормално разпределение да попада в даден интервал

Още в този параграф ще започнем да решаваме практически проблеми, чийто смисъл е посочен в заглавието. Нека да разгледаме какви възможности предлага теорията за решаване на проблеми. Изходната концепция за изчисляване на вероятността случайна променлива с нормално разпределение да попадне в даден интервал е кумулативната функция на нормалното разпределение.

Кумулативна функция на нормалното разпределение:

.

Въпреки това е проблематично да се получат таблици за всяка възможна комбинация от средно и стандартно отклонение. Следователно, един от простите начини за изчисляване на вероятността нормално разпределена случайна променлива да попадне в даден интервал е да се използват вероятностни таблици за стандартизираното нормално разпределение.

Нормалното разпределение се нарича стандартизирано или нормализирано., чиято средна стойност е , а стандартното отклонение е .

Стандартизирана функция за плътност на нормалното разпределение:

.

Кумулативна функция на стандартизираното нормално разпределение:

.

Фигурата по-долу показва интегралната функция на стандартизираното нормално разпределение, чиято графика е получена чрез изчисляване на определена извадка от данни в софтуерния пакет STATISTICA. Самата графика е червена крива, а примерните стойности се доближават до нея.


За да увеличите снимката, можете да щракнете върху нея с левия бутон на мишката.

Стандартизирането на случайна променлива означава преминаване от оригиналните единици, използвани в задачата, към стандартизирани единици. Стандартизацията се извършва по формулата

На практика всички възможни стойности на случайна променлива често са неизвестни, така че стойностите на средното и стандартното отклонение не могат да бъдат определени точно. Те се заменят със средноаритметичната стойност на наблюденията и стандартното отклонение с. величина zизразява отклоненията на стойностите на случайна променлива от средната аритметична стойност при измерване на стандартните отклонения.

Отворен интервал

Таблицата на вероятностите за стандартизираното нормално разпределение, която може да се намери в почти всяка книга по статистика, съдържа вероятностите случайна променлива със стандартно нормално разпределение Зще приеме стойност, по-малка от определено число z. Тоест ще попадне в отворения интервал от минус безкрайност до z. Например, вероятността количеството Зпо-малко от 1,5, равно на 0,93319.

Пример 1.Компанията произвежда части, чийто експлоатационен живот е нормално разпределен със средна стойност от 1000 часа и стандартно отклонение от 200 часа.

За произволно избрана част изчислете вероятността животът й да бъде най-малко 900 часа.

Решение. Нека въведем първата нотация:

Желаната вероятност.

Стойностите на случайната променлива са в отворен интервал. Но знаем как да изчислим вероятността една случайна променлива да приеме стойност, по-малка от дадена, и според условията на задачата трябва да намерим такава, равна или по-голяма от дадена. Това е другата част от пространството под нормалната крива на плътност (камбана). Следователно, за да намерите желаната вероятност, трябва да извадите от единицата споменатата вероятност случайната променлива да приеме стойност, по-малка от зададените 900:

Сега случайната променлива трябва да бъде стандартизирана.

Продължаваме да въвеждаме нотацията:

z = (х ≤ 900) ;

х= 900 - зададена стойност на случайната променлива;

μ = 1000 - средна стойност;

σ = 200 - стандартно отклонение.

Използвайки тези данни, получаваме условията на проблема:

.

Според таблици на стандартизирана случайна променлива (граница на интервал) z= −0,5 съответства на вероятност от 0,30854. Извадете го от единицата и получете това, което се изисква в изложението на проблема:

Така че вероятността частта да има експлоатационен живот от поне 900 часа е 69%.

Тази вероятност може да се получи с помощта на функцията на MS Excel NORM.DIST (интегрална стойност - 1):

П(х≥900) = 1 - П(х≤900) = 1 - NORM.DIST(900; 1000; 200; 1) = 1 - 0,3085 = 0,6915.

За изчисленията в MS Excel - в един от следващите параграфи на този урок.

Пример 2.В даден град средният годишен семеен доход е нормално разпределена случайна променлива със средна стойност 300 000 и стандартно отклонение 50 000. Известно е, че доходът на 40% от семействата е по-малък от А. Намерете стойността А.

Решение. В този проблем 40% не е нищо повече от вероятността случайната променлива да вземе стойност от отворен интервал, която е по-малка от определена стойност, обозначена с буквата А.

За да намерите стойността А, първо съставяме интегралната функция:

Според условията на проблема

μ = 300000 - средна стойност;

σ = 50000 - стандартно отклонение;

х = А- количеството, което трябва да се намери.

Измисляне на равенство

.

От статистическите таблици намираме, че вероятността от 0,40 съответства на стойността на границата на интервала z = −0,25 .

Следователно ние създаваме равенството

и намерете решението му:

А = 287300 .

Отговор: 40% от семействата имат доходи под 287 300.

Затворен интервал

В много задачи се изисква да се намери вероятността нормално разпределена случайна променлива да приеме стойност в интервала от z 1 към z 2. Тоест ще попадне в затворен интервал. За да се решат такива проблеми, е необходимо да се намерят в таблицата вероятностите, съответстващи на границите на интервала, и след това да се намери разликата между тези вероятности. Това изисква изваждане на по-малката стойност от по-голямата. Примери за решения на тези често срещани проблеми са следните и от вас се иска да ги решите сами, след което можете да видите правилните решения и отговори.

Пример 3.Печалбата на предприятието за определен период е случайна величина, подчинена на нормалния закон за разпределение със средна стойност 0,5 млн. и стандартно отклонение 0,354. Определете с точност до два знака след десетичната запетая вероятността печалбата на предприятието да бъде от 0,4 до 0,6 c.u.

Пример 4.Дължината на изработения детайл е случайна величина, разпределена по нормалния закон с параметри μ =10 и σ =0,071. Намерете вероятността от дефекти с точност до два знака след десетичната запетая, ако допустимите размери на детайла трябва да бъдат 10±0,05.

Съвет: в този проблем, в допълнение към намирането на вероятността случайна променлива да попадне в затворен интервал (вероятността да получите недефектна част), трябва да извършите още едно действие.

ви позволява да определите вероятността стандартизираната стойност Зне по-малко -zи не повече +z, Където z- произволно избрана стойност на стандартизирана случайна променлива.

Приблизителен метод за проверка на нормалността на разпределение

Приблизителен метод за проверка на нормалността на разпределението на пробните стойности се основава на следното свойство на нормалното разпределение: коефициент на асиметрия β 1 и коефициент на ексцес β 2 са равни на нула.

Коефициент на асиметрия β 1 числено характеризира симетрията на емпиричното разпределение спрямо средната стойност. Ако коефициентът на асиметрия е нула, тогава средноаритметричната стойност, медианата и модата са равни: и кривата на плътността на разпределението е симетрична спрямо средната стойност. Ако коефициентът на асиметрия е по-малък от нула (β 1 < 0 ), тогава средноаритметичната стойност е по-малка от медианата, а медианата от своя страна е по-малка от режим () и кривата е изместена надясно (в сравнение с нормалното разпределение). Ако коефициентът на асиметрия е по-голям от нула (β 1 > 0 ), тогава средноаритметичната стойност е по-голяма от медианата, а медианата от своя страна е по-голяма от режима () и кривата е изместена наляво (в сравнение с нормалното разпределение).

Коефициент на ексцесия β 2 характеризира концентрацията на емпиричното разпределение около средноаритметичното по посока на оста Ойи степента на пик на кривата на плътността на разпределението. Ако коефициентът на ексцес е по-голям от нула, тогава кривата е по-удължена (в сравнение с нормалното разпределение)по оста Ой(графиката е по-заострена). Ако коефициентът на ексцес е по-малък от нула, тогава кривата е по-плоска (в сравнение с нормалното разпределение)по оста Ой(графиката е по-тъпа).

Коефициентът на асиметрия може да се изчисли с помощта на функцията SKOS на MS Excel. Ако проверявате един масив от данни, тогава трябва да въведете диапазона от данни в едно поле „Число“.


Коефициентът на ексцес може да се изчисли с помощта на функцията KURTESS на MS Excel. При проверка на един масив от данни е достатъчно също да въведете диапазона от данни в едно поле „Число“.


И така, както вече знаем, при нормално разпределение коефициентите на изкривяване и ексцес са равни на нула. Но какво ще стане, ако получим коефициенти на изкривяване от -0,14, 0,22, 0,43 и коефициенти на ексцес от 0,17, -0,31, 0,55? Въпросът е съвсем справедлив, тъй като на практика имаме работа само с приблизителни, примерни стойности на асиметрия и ексцес, които са обект на някакво неизбежно, неконтролирано разсейване. Следователно не може да се изисква тези коефициенти да бъдат строго равни на нула; те трябва да бъдат само достатъчно близки до нула. Но какво означава достатъчно?

Необходимо е да се сравнят получените емпирични стойности с приемливи стойности. За да направите това, трябва да проверите следните неравенства (сравнете стойностите на модулните коефициенти с критичните стойности - границите на зоната за тестване на хипотезата).

За коефициента на асиметрия β 1 .

Случайната променлива се извиква разпределени по нормалния (гаусов) закон с параметри А И () , ако плътността на разпределение на вероятностите има формата

Една нормално разпределена величина винаги има безкраен брой възможни стойности, така че е удобно да се изобрази графично с помощта на графика на плътността на разпределението. Според формулата

вероятността една случайна променлива да приеме стойност от интервал е равна на площта под графиката на функция в този интервал (геометричното значение на определен интеграл). Разглежданата функция е неотрицателна и непрекъсната. Графиката на функцията има формата на камбана и се нарича крива на Гаус или нормална крива.

Фигурата показва няколко криви на плътност на разпределение на случайна променлива, зададена съгласно нормалния закон.

Всички криви имат една максимална точка и докато се отдалечавате от нея надясно и наляво, кривите намаляват. Максимумът се постига при и е равен на .

Кривите са симетрични спрямо вертикална линия, прекарана през най-високата точка. Площта на подграфа на всяка крива е 1.

Разликата между отделните криви на разпределение е само, че общата площ на подграфа, еднаква за всички криви, се разпределя по различен начин между различните секции. Основната част от областта на подграфа на всяка крива е концентрирана в непосредствена близост до най-вероятната стойност и тази стойност е различна за трите криви. За различни стойности и Аполучават се различни нормални закони и различни графики на функцията на разпределение на плътността.

Теоретичните изследвания показват, че повечето случайни променливи, срещани в практиката, имат нормален закон на разпределение. Според този закон се разпределят скоростта на газовите молекули, теглото на новородените, размерът на дрехите и обувките на населението на страната и много други случайни събития от физическо и биологично естество. Тази закономерност за първи път е забелязана и теоретично обоснована от А. Моавр.

За , функцията съвпада с функцията, която вече беше обсъдена в локалната гранична теорема на Moivre–Laplace. Плътността на вероятността за нормално разпределение е лесна изразено чрез:

За такива стойности на параметрите се нарича нормален закон основен .

Функцията на разпределение за нормализирана плътност се нарича Функция на Лаплас и е обозначен Φ(x). Също така вече сме срещали тази функция.

Функцията на Лаплас не зависи от конкретни параметри Аи σ. За функцията на Лаплас, използвайки методи за приблизителна интеграция, са съставени таблици със стойности на интервала с различна степен на точност. Очевидно функцията на Лаплас е странна, следователно няма нужда да поставяте нейните стойности в таблицата за отрицателни.



За случайна променлива, разпределена по нормалния закон с параметри Аи , математическото очакване и дисперсията се изчисляват с помощта на формулите: , .Стандартното отклонение е равно на .

Вероятността нормално разпределена величина да приеме стойност от интервала е равна на

където е функцията на Лаплас, въведена в интегралната гранична теорема.

Често при задачи се изисква да се изчисли вероятността отклонението на нормално разпределена случайна променлива хот математическото си очакване по абсолютна стойност не превишава определена стойност, т.е. изчисляване на вероятността. Прилагайки формула (19.2), имаме:

В заключение представяме едно важно следствие от формула (19.3). Нека поставим тази формула. Тогава, т.е. вероятността абсолютната стойност на отклонението хот неговото математическо очакване няма да надвишава , равно на 99,73%. На практика такова събитие може да се счита за надеждно. Това е същността на правилото на трите сигми.

Правилото на трите сигми. Ако една случайна променлива е разпределена нормално, тогава абсолютната стойност на нейното отклонение от математическото очакване практически не надвишава три пъти стандартното отклонение.

Случаен, ако в резултат на експеримент може да приеме реални стойности с определени вероятности. Най-пълната, всеобхватна характеристика на случайна променлива е законът за разпределение. Законът за разпределение е функция (таблица, графика, формула), която ви позволява да определите вероятността случайна променлива X да приеме определена стойност xi или да попадне в определен интервал. Ако една случайна променлива има даден закон на разпределение, тогава се казва, че тя се разпределя според този закон или се подчинява на този закон на разпределение.

Всеки разпределителен законе функция, която напълно описва случайна променлива от вероятностна гледна точка. На практика вероятностното разпределение на случайна променлива X често трябва да се преценява само от резултатите от теста.

Нормална дистрибуция

Нормална дистрибуция, наричано още разпределение на Гаус, е вероятностно разпределение, което играе критична роля в много области на знанието, особено във физиката. Една физическа величина следва нормално разпределение, когато е подложена на влиянието на огромен брой случайни шумове. Ясно е, че тази ситуация е изключително често срещана, така че можем да кажем, че от всички разпределения нормалното разпределение е най-често срещаното в природата - оттук и едно от имената му.

Нормалното разпределение зависи от два параметъра - преместване и мащаб, тоест от математическа гледна точка това не е едно разпределение, а цяло семейство от тях. Стойностите на параметъра съответстват на стойностите на средната (математическо очакване) и разпространението (стандартно отклонение).

Стандартното нормално разпределение е нормално разпределение с математическо очакване 0 и стандартно отклонение 1.

Коефициент на асиметрия

Коефициентът на асиметрия е положителен, ако дясната опашка на разпределението е по-дълга от лявата, и отрицателен в противен случай.

Ако разпределението е симетрично спрямо математическото очакване, тогава неговият коефициент на асиметрия е нула.

Коефициентът на изкривяване на извадката се използва за тестване на разпределението за симетрия, както и за груб предварителен тест за нормалност. Тя ви позволява да отхвърлите, но не ви позволява да приемете хипотезата за нормалност.

Коефициент на ексцесия

Коефициентът на ексцес (пиков коефициент) е мярка за остротата на пика на разпределението на случайна променлива.

„Минус три“ в края на формулата се въвежда така, че коефициентът на ексцес на нормалното разпределение да е равен на нула. То е положително, ако пикът на разпределението около математическото очакване е остър, и отрицателно, ако пикът е плавен.

Моменти на случайна величина

Моментът на случайна величина е числена характеристика на разпределението на дадена случайна величина.

Кратка теория

Нормално е вероятностното разпределение на непрекъсната случайна променлива, чиято плътност има формата:

където е математическото очакване и е стандартното отклонение.

Вероятност да приеме стойност, принадлежаща на интервала:

където е функцията на Лаплас:

Вероятността абсолютната стойност на отклонението да е по-малка от положително число:

По-специално, когато е изпълнено равенството:

При решаването на проблеми, които практиката поставя, трябва да се работи с различни разпределения на непрекъснати случайни променливи.

В допълнение към нормалното разпределение, основните закони на разпределение на непрекъснати случайни променливи:

Пример за решение на проблем

Част се изработва на машина. Дължината му е случайна променлива, разпределена по нормален закон с параметри , . Намерете вероятността дължината на частта да бъде между 22 и 24,2 см. От какво отклонение на дължината на частта може да се гарантира с вероятност 0,92; 0,98? В какви граници, симетрични спрямо , ще лежат почти всички размери на частите?

Решение:

Вероятността случайна променлива, разпределена по нормален закон, да бъде в интервала:

Получаваме:

Вероятността случайна променлива с нормално разпределение да се отклони от средната стойност с не повече от .