Анализ на закона за разпределение на случайна величина. Закон за разпределение на случайни величини

Функцията на разпределение на случайна променлива X е функцията F(x), която изразява за всяко x вероятността случайната променлива X да приеме стойността, по-малък х

Пример 2.5. Дадена е серия на разпределение на случайна променлива

Намерете и изобразете графично неговата функция на разпределение. Решение. Според дефиницията

F(jc) = 0 at хх

F(x) = 0,4 + 0,1 = 0,5 при 4 F(x) = 0,5 + 0,5 = 1 при х > 5.

И така (вижте Фиг. 2.1):


Свойства на функцията на разпределение:

1. Функцията на разпределение на случайна променлива е неотрицателна функция между нула и едно:

2. Функцията на разпределение на случайна променлива е ненамаляваща функция по цялата числена ос, т.е. при х 2 >x

3. При минус безкрайност функцията на разпределение е равна на нула, при плюс безкрайност е равна на единица, т.е.

4. Вероятност за попадение на случайна променлива хв интервалае равен на определен интеграл от неговата плътност на вероятността, вариращ от Апреди b(виж Фиг. 2.2), т.е.


Ориз. 2.2

3. Функцията на разпределение на непрекъсната случайна променлива (виж фиг. 2.3) може да се изрази чрез плътността на вероятността по формулата:

F(x)= Jp(*)*. (2.10)

4. Неправилен интеграл в безкрайни границина плътността на вероятността на непрекъсната случайна променлива е равна на единица:

Геометрични свойства / и 4 плътностите на вероятността означават, че нейната графика е крива на разпределение - лежи не под оста x, И цялата зонафигури, ограничена от кривата на разпределение и оста x, равно на едно.

За непрекъсната случайна променлива хочаквана стойност M(X)и дисперсия D(X)се определят по формулите:

(ако интегралът е абсолютно сходящ); или

(ако горните интеграли се събират).

Заедно с цифровите характеристики, отбелязани по-горе, концепцията за квантили и процентни точки се използва за описание на случайна променлива.

Квантилно ниво q(или q-квантил) е такава стойностx qслучайна величина, при което неговата функция на разпределение приема стойност, равно на q,т.е.

  • 100Точката q%-ou е квантилът X~ q.
  • ? Пример 2.8.

Въз основа на данните в пример 2.6 намерете квантила xqj и точката на 30% случайна променлива Х.

Решение. По дефиниция (2.16) F(xo t3)= 0.3, т.е.

~Y~ = 0,3, откъде идва квантилът? х 0 3 = 0,6. 30% случайна променлива точка х, или квантил X)_o,z = xoj"се намира по подобен начин от уравнението ^ = 0,7. където *, = 1,4. ?

Сред числените характеристики на случайна променлива има начален v* и централен R* моменти от k-ти ред, определени за дискретни и непрекъснати случайни променливи по формулите:


Случайна величинаПроменлива се нарича променлива, която в резултат на всеки тест приема една неизвестна преди това стойност в зависимост от случайни причини. Случайни променливиозначавани с главни латински букви: $X,\ Y,\ Z,\ \dots $ По своя тип случайните променливи могат да бъдат отделенИ непрекъснато.

Дискретна случайна променлива- това е случайна променлива, чиито стойности не могат да бъдат повече от изброими, т.е. крайни или изброими. Под изброимост имаме предвид, че стойностите на случайна променлива могат да бъдат номерирани.

Пример 1 . Ето примери за дискретни случайни променливи:

а) броят на попаденията в целта с $n$ изстрела, тук възможните стойности са $0,\ 1,\ \dots ,\ n$.

б) броят на падналите емблеми при хвърляне на монета, тук възможните стойности са $0,\ 1,\ \dots ,\ n$.

в) броя на корабите, пристигащи на борда (изброим набор от стойности).

г) броят на повикванията, пристигащи в телефонната централа (изброим набор от стойности).

1. Закон за вероятностно разпределение на дискретна случайна променлива.

Дискретна случайна променлива $X$ може да приема стойности $x_1,\dots ,\ x_n$ с вероятности $p\left(x_1\right),\ \dots ,\ p\left(x_n\right)$. Съответствието между тези стойности и техните вероятности се нарича закон за разпределение на дискретна случайна променлива. По правило това съответствие се посочва с помощта на таблица, чийто първи ред показва стойностите $x_1,\dots ,\ x_n$, а вторият ред съдържа вероятностите $p_1,\dots ,\ p_n$, съответстващи на тези ценности.

$\begin(масив)(|c|c|)
\hline
X_i & x_1 & x_2 & \dots & x_n \\
\hline
p_i & p_1 & p_2 & \dots & p_n \\
\hline
\край (масив)$

Пример 2 . Нека случайната променлива $X$ е броят точки, хвърлени при хвърляне на зар. Такава случайна променлива $X$ може да приема следните стойности: $1,\ 2,\ 3,\ 4,\ 5,\ 6$. Вероятностите за всички тези стойности са равни на $1/6$. Тогава законът за разпределение на вероятностите на случайната променлива $X$:

$\begin(масив)(|c|c|)
\hline
1 & 2 & 3 & 4 & 5 & 6 \\
\hline

\hline
\край (масив)$

Коментирайте. Тъй като в закона за разпределение на дискретна случайна променлива $X$ събитията $1,\ 2,\ \dots ,\ 6$ образуват пълна група от събития, тогава сборът на вероятностите трябва да е равен на единица, т.е. \sum(p_i)=1$.

2. Математическо очакване на дискретна случайна променлива.

Очакване на случайна променливазадава своето „централно“ значение. За дискретна случайна променлива математическото очакване се изчислява като сумата от продуктите на стойностите $x_1,\dots ,\ x_n$ и вероятностите $p_1,\dots ,\ p_n$, съответстващи на тези стойности, т.е. : $M\left(X\right)=\sum ^n_(i=1)(p_ix_i)$. В англоезичната литература се използва друга нотация $E\left(X\right)$.

Свойства на математическото очакване$M\ляво(X\дясно)$:

  1. $M\left(X\right)$ се съдържа между най-малкото и най-високи стойностислучайна променлива $X$.
  2. Математическото очакване на константа е равно на самата константа, т.е. $M\ляво(C\дясно)=C$.
  3. Постоянният фактор може да бъде изваден от знака на математическото очакване: $M\left(CX\right)=CM\left(X\right)$.
  4. Математическото очакване на сумата от случайни променливи е равно на сумата от техните математически очаквания: $M\left(X+Y\right)=M\left(X\right)+M\left(Y\right)$.
  5. Математическото очакване на произведението на независими случайни променливи е равно на произведението на техните математически очаквания: $M\left(XY\right)=M\left(X\right)M\left(Y\right)$.

Пример 3 . Нека намерим математическото очакване на случайната променлива $X$ от пример $2$.

$$M\left(X\right)=\sum^n_(i=1)(p_ix_i)=1\cdot ((1)\over (6))+2\cdot ((1)\over (6) )+3\cdot ((1)\над (6))+4\cdot ((1)\над (6))+5\cdot ((1)\над (6))+6\cdot ((1 )\над (6))=3,5.$$

Можем да забележим, че $M\left(X\right)$ се намира между най-малката ($1$) и най-голямата ($6$) стойности на случайната променлива $X$.

Пример 4 . Известно е, че математическото очакване на случайната променлива $X$ е равно на $M\left(X\right)=2$. Намерете математическото очакване на случайната променлива $3X+5$.

Използвайки горните свойства, получаваме $M\left(3X+5\right)=M\left(3X\right)+M\left(5\right)=3M\left(X\right)+5=3\ cdot 2 +5=$11.

Пример 5 . Известно е, че математическото очакване на случайната променлива $X$ е равно на $M\left(X\right)=4$. Намерете математическото очакване на случайната променлива $2X-9$.

Използвайки горните свойства, получаваме $M\left(2X-9\right)=M\left(2X\right)-M\left(9\right)=2M\left(X\right)-9=2\ cdot 4 -9=-1$.

3. Дисперсия на дискретна случайна променлива.

Възможните стойности на случайни променливи с еднакви математически очаквания могат да се разпръснат по различен начин около техните средни стойности. Например в две студентски групи средната оценка на изпита по теория на вероятностите се оказа 4, но в едната всички се оказаха добри студенти, а в другата имаше само тройници и отличници. Следователно има нужда от числена характеристика на случайна променлива, която да показва разпространението на стойностите на случайната променлива около нейното математическо очакване. Тази характеристика е дисперсия.

Дисперсия на дискретна случайна променлива$X$ е равно на:

$$D\left(X\right)=\sum^n_(i=1)(p_i(\left(x_i-M\left(X\right)\right))^2).\ $$

В англоезичната литература се използва обозначението $V\left(X\right),\ Var\left(X\right)$. Много често дисперсията $D\left(X\right)$ се изчислява по формулата $D\left(X\right)=\sum^n_(i=1)(p_ix^2_i)-(\left(M\ ляво(X \дясно)\дясно))^2$.

Дисперсионни свойства$D\ляво(X\дясно)$:

  1. Дисперсията винаги е по-голяма или равна на нула, т.е. $D\наляво(X\надясно)\ge 0$.
  2. Дисперсията на константата е нула, т.е. $D\ляво(C\дясно)=0$.
  3. Константният фактор може да бъде изваден от знака на дисперсията, при условие че е повдигнат на квадрат, т.е. $D\ляво(CX\дясно)=C^2D\ляво(X\дясно)$.
  4. Дисперсията на сумата от независими случайни променливи е равна на сумата от техните дисперсии, т.е. $D\ляво(X+Y\дясно)=D\ляво(X\дясно)+D\ляво(Y\дясно)$.
  5. Дисперсията на разликата между независими случайни променливи е равна на сумата от техните дисперсии, т.е. $D\ляво(X-Y\дясно)=D\ляво(X\дясно)+D\ляво(Y\дясно)$.

Пример 6 . Нека изчислим дисперсията на случайната променлива $X$ от пример $2$.

$$D\left(X\right)=\sum^n_(i=1)(p_i(\left(x_i-M\left(X\right)\right))^2)=((1)\над (6))\cdot (\left(1-3.5\right))^2+(((1)\over (6))\cdot (\left(2-3.5\right))^2+ \dots +( (1)\над (6))\cdot (\left(6-3.5\right))^2=((35)\над (12))\приблизително 2,92.$$

Пример 7 . Известно е, че дисперсията на случайната променлива $X$ е равна на $D\left(X\right)=2$. Намерете дисперсията на случайната променлива $4X+1$.

Използвайки горните свойства, намираме $D\left(4X+1\right)=D\left(4X\right)+D\left(1\right)=4^2D\left(X\right)+0= 16D\ ляво(X\дясно)=16\cdot 2=32$.

Пример 8 . Известно е, че дисперсията на случайната променлива $X$ е равна на $D\left(X\right)=3$. Намерете дисперсията на случайната променлива $3-2X$.

Използвайки горните свойства, намираме $D\left(3-2X\right)=D\left(3\right)+D\left(2X\right)=0+2^2D\left(X\right)= 4D\ ляво(X\дясно)=4\cdot 3=12$.

4. Функция на разпределение на дискретна случайна величина.

Методът за представяне на дискретна случайна променлива под формата на серия на разпределение не е единственият и най-важното е, че не е универсален, тъй като непрекъсната случайна променлива не може да бъде определена с помощта на серия на разпределение. Има и друг начин за представяне на случайна променлива - функцията на разпределение.

Разпределителна функцияслучайна променлива $X$ се нарича функция $F\left(x\right)$, която определя вероятността случайната променлива $X$ да приеме стойност, по-малка от някаква фиксирана стойност $x$, т.е. $F\ ляво(x\дясно)=P\ляво(X< x\right)$

Свойства на функцията на разпределение:

  1. $0\le F\left(x\right)\le 1$.
  2. Вероятността случайната променлива $X$ да приеме стойности от интервала $\left(\alpha ;\ \beta \right)$ е равна на разликата между стойностите на функцията на разпределение в краищата на този интервал: $P\left(\alpha< X < \beta \right)=F\left(\beta \right)-F\left(\alpha \right)$
  3. $F\left(x\right)$ - ненамаляващ.
  4. $(\mathop(lim)_(x\to -\infty ) F\left(x\right)=0\ ),\ (\mathop(lim)_(x\to +\infty ) F\left(x \right)=1\ )$.

Пример 9 . Нека намерим функцията на разпределение $F\left(x\right)$ за закона за разпределение на дискретната случайна променлива $X$ от пример $2$.

$\begin(масив)(|c|c|)
\hline
1 & 2 & 3 & 4 & 5 & 6 \\
\hline
1/6 & 1/6 & 1/6 & 1/6 & 1/6 & 1/6 \\
\hline
\край (масив)$

Ако $x\le 1$, тогава очевидно $F\left(x\right)=0$ (включително за $x=1$ $F\left(1\right)=P\left(X< 1\right)=0$).

Ако $1< x\le 2$, то $F\left(x\right)=P\left(X=1\right)=1/6$.

Ако $2< x\le 3$, то $F\left(x\right)=P\left(X=1\right)+P\left(X=2\right)=1/6+1/6=1/3$.

Ако $3< x\le 4$, то $F\left(x\right)=P\left(X=1\right)+P\left(X=2\right)+P\left(X=3\right)=1/6+1/6+1/6=1/2$.

Ако $4< x\le 5$, то $F\left(X\right)=P\left(X=1\right)+P\left(X=2\right)+P\left(X=3\right)+P\left(X=4\right)=1/6+1/6+1/6+1/6=2/3$.

Ако $5< x\le 6$, то $F\left(x\right)=P\left(X=1\right)+P\left(X=2\right)+P\left(X=3\right)+P\left(X=4\right)+P\left(X=5\right)=1/6+1/6+1/6+1/6+1/6=5/6$.

Ако $x > 6$, тогава $F\left(x\right)=P\left(X=1\right)+P\left(X=2\right)+P\left(X=3\right) +P\left(X=4\right)+P\left(X=5\right)+P\left(X=6\right)=1/6+1/6+1/6+1/6+ 1/6+1/6=1$.

Така че $F(x)=\left\(\begin(matrix)
0,\ при\ x\le 1,\\
1/6, при \ 1< x\le 2,\\
1/3,\ на\ 2< x\le 3,\\
1/2, при \ 3< x\le 4,\\
2/3,\ в\ 4< x\le 5,\\
5/6,\ в\ 4< x\le 5,\\
1,\ за\ x > 6.
\end(матрица)\right.$

Нормалният закон за разпределение най-често се среща в практиката. Основната характеристика, която го отличава от другите закони, е, че той е ограничаващ закон, към който други закони на разпределение се приближават при много общи типични условия (вижте Глава 6).

Определение. Непрекъсната случайна променлива X иманормален закон за разпределение (закон на Гаус)с параметри a иа 2, ако неговата плътност на вероятността има формата

Терминът „нормално“ не е напълно подходящ. Много признаци се подчиняват на нормалния закон, например височината на човек, обхватът на снаряда и т.н. Но ако някоя характеристика се подчинява на закон за разпределение, различен от нормалния, това изобщо не означава, че явлението, свързано с тази характеристика, е „ненормално“.

Кривата на нормалното разпределение се нарича нормално, или Гаус, крив.На фиг. 4.6, А, 6 нормалната крива fd, (x) с параметри yio 2 са дадени, т.е. аз [а] a 2) и графиката на функцията на разпределение на случайната променлива х, който има нормален закон. Нека обърнем внимание на факта, че нормалната крива е симетрична спрямо правата х = а,има максимум в точката х= А,

равен , т.е.

И две инфлексни точки x = a±

с ордината

Може да се отбележи, че в израза за нормална законова плътност параметрите са обозначени с буквите Аи st 2, който използваме за означаване на математическото очакване M(X) и дисперсия OH).Това съвпадение не е случайно. Нека разгледаме теорема, която установява вероятностния теоретичен смисъл на параметрите на нормалния закон.

Теорема. Математическото очакване на случайна променлива X, разпределена по нормален закон, е равно на параметъра a на този закон,тези.

А неговата дисперсия - към параметъра a 2, т.е.

Очакване на случайна променлива Х:

Нека променим променливата, като поставим

Тогава границите на интеграция не се променят

и следователно

(първият интеграл е равен на нула като интеграл от странна функциявърху интервал, симетричен спрямо началото, и вторият интеграл - интеграл на Ойлер - Поасон).

Дисперсия на случайна променлива Х:

Нека направим същата промяна на променлива x = a + o^2 t,както при изчисляването на предишния интеграл. Тогава

Прилагайки метода на интегриране по части, получаваме

Нека да разберем как ще се промени нормалната крива, когато параметрите се променят Аи с 2 (или а). Ако a = const, и параметърът се променя a (a x a 3), т.е. центъра на симетрия на разпределението, тогава нормалната крива ще се измести по абсцисната ос, без да променя формата си (фиг. 4.7).

Ако а = const и параметърът a 2 (или a) се променя, след това ординатата се променя

максимум на кривата С нарастване на a ординатата на максимума

кривата намалява, но тъй като площта под всяка крива на разпределение трябва да остане равна на единица, кривата става по-плоска, простирайки се по оста x; при намаляване су,напротив, нормалната крива се простира нагоре, като същевременно се компресира отстрани. На фиг. Фигура 4.8 показва нормални криви с параметри a 1 (o 2 и a 3, където o, А(известен още като математическо очакване) характеризира позицията на центъра, а параметър a 2 (известен още като дисперсия) характеризира формата на нормалната крива.

Нормален закон на разпределение на случайна променлива хс параметри А= 0, st 2 = 1, т.е. X ~ N( 0; 1), наречена стандартенили нормализирана съответната нормална крива е стандартенили нормализиран.

Трудността за директно намиране на функцията на разпределение на случайна променлива, разпределена по нормалния закон съгласно формула (3.23), и вероятността тя да попадне на определен интервал съгласно формула (3.22) е свързана с факта, че интегралът на функция (4.26) е „несъбираема“ в елементарни функции. Следователно те се изразяват чрез функцията

- функция (интеграл на вероятността) Лаплас,за които са съставени таблиците. Нека си припомним, че вече се сблъскахме с функцията на Лаплас, когато разглеждахме интегралната теорема на Моавр-Лаплас (вижте раздел 2.3). Там бяха обсъдени и неговите свойства. Геометрично, функцията на Лаплас Ф(.с) представлява площта под стандартната нормална крива на отсечката [-Х; х] (фиг. 4.9) 1 .

Ориз. 4.10

Ориз. 4.9

Теорема. Функцията на разпределение на случайна променлива X, разпределена по нормалния закон, се изразява чрез функцията на ЛапласФ(х) по формулата

Съгласно формула (3.23) функцията на разпределение е:

Нека направим промяна на променлива, задаване на х-> -оо? -» -00, следователно

1 Наред с вероятностния интеграл на формата (4.29), представящ функцията Ф(х), неговите изрази се използват в литературата и под формата на други таблични функции:

представляващи площите йод на стандартната нормална крива, съответно на интервалите (0; x], (-oo; x], [-x>/2; Chl/2 .

Първи интеграл

(поради четността на интегранта и факта, че интегралът на Ойлер - Поасон е равен на [Да се).

Вторият интеграл, като се вземе предвид формула (4.29), е

Геометрично, функцията на разпределение представлява площта под нормалната крива на интервала (-co, x) (фиг. 4.10). Както виждаме, той се състои от две части: първата, на интервала (-oo, А),равно на 1/2, т.е. половината от цялата площ под нормалната крива, а втората - на интервала (i, x),

равна на

Нека разгледаме свойствата на случайна променлива, разпределена по нормален закон.

1. Вероятността за попадение на случайна променлива X, разпределена по нормален закон, е V интервал[x 1(x 2], равна на

Като се има предвид, че съгласно свойството (3.20), вероятността P(x,

където и Г 2 се определят по формула (4.33) (фиг. 4.11). ?

2. Вероятността отклонението на случайна величина X, разпределена по нормален закон, от математическото очакване a да не надвишава стойността A > 0 ( по абсолютна стойност) е равно на

и също свойството странност на функцията на Лаплас, получаваме

Където? =D/o (фиг. 4.12). ?

На фиг. 4.11 и 4.12 са дадени геометрична интерпретациясвойства на нормалния закон.

Коментирайте. Обсъдени в гл. 2 приблизителната интегрална формула на Moivre - Laplace (2.10) следва от свойството (4.32) на нормално разпределена случайна променлива при x ( = a, x 2 = b ) a = pr И Така

като биномен закон за разпределение на случайна променлива X = t с параметри П И R, за които е получена тази формула, с n -> OS клони към нормалния закон (виж Глава 6).

Подобни са следствията (2.13), (2.14) и (2.16) от интегралната формула на Моавр-Лаплас за числото X = t настъпване на събитие в П независимо тестване и неговата честота т/н следват от свойствата (4.32) и (4.34) на нормалния закон.

Нека изчислим вероятностите, използвайки формула (4.34) P(X-a д) при различни стойности на D (използваме таблица II от приложенията). Получаваме

Ето откъде идва „правилото на трите сигми“.

Ако случайна променлива X има нормален закон на разпределение с параметри aи 2, т.е. M(a;а 2), тогава е почти сигурно, че стойностите му се намират в интервала(а - За, А+ За).

Нарушаване на „правилото на трите сигми”, т.е. отклонение на нормално разпределена случайна променлива хповече от 3 (но абсолютна стойност), е почти невъзможно събитие, тъй като вероятността му е много ниска:

Имайте предвид, че отклонението D в, при което , Наречен

вероятно отклонение.За нормалния закон D в « 0.675a, т.е. на интервал (А - 0,675a, А+ 0,675a) представлява половината от общата площ под нормалната крива.

Нека намерим коефициента на асиметрия и ексцеса на случайна променлива Х,разпределени по нормален закон.

Очевидно, поради симетрията на нормалната крива спрямо вертикалната линия х = а,преминавайки през разпределителния център a = M(X), коефициент на асиметрия нормална дистрибуция L = 0.

Ексцес на нормално разпределена случайна променлива хнамираме с помощта на формула (3.37), т.е.

където взехме предвид, че централният момент от 4-ти ред, намерен по формула (3.30), като се вземе предвид дефиницията (4.26), т.е.

(пропускаме изчисляването на интеграла).

По този начин, ексцесът на нормално разпределение е нулаи стръмността на други разпределения се определя по отношение на нормалното (вече споменахме това в параграф 3.7).

O Пример 4.9. Ако приемем, че височината на мъжете от определена възрастова група е нормално разпределена случайна променлива хс параметри А= 173 и a 2 =36:

  • 1) Намерете: а) израза на плътността на вероятността и функцията на разпределение на случайната променлива Х;б) дяловете на костюмите 4-ти ръст (176-182 см) и 3-ти ръст (170-176 см), които трябва да бъдат осигурени в общия обем на продукцията за дадена възрастова група; в) квантил x 07и 10% точка на случайната променлива Х.
  • 2) Формулирайте „правилото на трите сигми“ за случайна променлива X. Решение. 1, а) С помощта на формули (4.26) и (4.30) записваме

1, б) Делът на костюмите с 4-та височина (176-182 см) в общия обем на производството ще се определи по формула (4.32) като вероятност


(фиг. 4.14), тъй като съгласно формули (4.33)

Делът на костюмите с 3-та височина (170-176 см) може да се определи подобно на формулата (4.32), но е по-лесно да се направи това с помощта на формула (4.34), като се има предвид, че този интервал е симетричен по отношение на математическото очакване А = M(X) = 173, т.е. неравенство 170 X X -173|

(виж Фиг. 4.14;.

1, в) Квантил x 07(вижте параграф 3.7) случайна променлива хнамираме от уравнение (3.29), като вземем предвид формула (4.30):

където

Според таблицата Намираме 11 приложения аз- 0,524 и

Това означава, че 70% от мъжете в тази възрастова група са високи до 176 см.

  • Точката от 10% е его квантилът x 09 = 181 cm (разположен по подобен начин), т.е. 10% от мъжете са високи поне 181 см.
  • 2) Почти сигурно е, че ръстът на мъжете в тази възрастова група е в границите на А- Z = 173 - 3 6 = 155 до а + Zet = 173 + 3 - 6 = = 191 (cm), т.е. 155

    Поради характеристиките на нормалния закон за разпределение, отбелязани в началото на раздела (и в глава 6), той заема централно място в теорията и практиката на вероятностните статистически методи. Голямото теоретично значение на нормалния закон е, че с негова помощ се получават редица важни разпределения, които са разгледани по-долу.

    • Стрелките на фиг. 4.11-4.13 са отбелязани условните площи и съответните фигури под нормалната крива.
    • Стойностите на функцията на Лаплас Ф(х) се определят от таблицата. II приложения.

В много задачи, свързани с нормално разпределени случайни променливи, е необходимо да се определи вероятността на случайна величина, подчинена на нормален закон с параметри, попадаща на отсечката от до . За изчисляване на тази вероятност използваме общата формула

където е функцията на разпределение на количеството.

Нека намерим функцията на разпределение на случайна променлива, разпределена по нормален закон с параметри. Плътността на разпределение на стойността е равна на:

. (6.3.2)

От тук намираме функцията на разпределение

. (6.3.3)

Нека направим промяна на променлива в интеграла (6.3.3)

и нека го представим в тази форма:

(6.3.4)

Интегралът (6.3.4) не може да бъде изразен чрез елементарни функции, но може да се изчисли чрез специална функция, изразяваща определен интегралот израза или (т.нар. вероятностен интеграл), за който са съставени таблиците. Има много разновидности на такива функции, например:

;

и т.н. Коя от тези функции да използвате е въпрос на вкус. Ние ще изберем като такава функция

. (6.3.5)

Лесно се вижда, че тази функция не е нищо повече от функция на разпределение за нормално разпределена случайна променлива с параметри.

Нека се съгласим да наричаме функцията функция на нормалното разпределение. Приложението (Таблица 1) съдържа таблици със стойностите на функциите.

Нека изразим функцията на разпределение (6.3.3) на величината с параметри и чрез функцията на нормалното разпределение. очевидно,

. (6.3.6)

Сега нека намерим вероятността случайна променлива да попадне в участъка от до . Съгласно формула (6.3.1)

По този начин изразихме вероятността случайна променлива, разпределена по нормален закон с всякакви параметри, да попадне в секция чрез стандартната функция на разпределение, съответстваща на най-простия нормален закон с параметри 0,1. Имайте предвид, че аргументите на функцията във формула (6.3.7) имат много просто значение: има разстоянието от десния край на сечението до центъра на разсейване, изразено в стандартни отклонения; - същото разстояние за левия край на сечението, като това разстояние се счита за положително, ако краят е разположен вдясно от центъра на дисперсията, и отрицателно, ако е отляво.

Като всяка функция на разпределение, функцията има следните свойства:

3. - ненамаляваща функция.

Освен това от симетрията на нормалното разпределение с параметри спрямо началото следва, че

Използвайки това свойство, строго погледнато, би било възможно да се ограничат таблиците на функциите само до стойности на положителни аргументи, но за да се избегне ненужна операция (изваждане от едно), Таблица 1 на допълнение предоставя стойности както за положителни, така и за отрицателни аргументи.

На практика често се сблъскваме с проблема за изчисляване на вероятността нормално разпределена случайна променлива да попадне в област, която е симетрична по отношение на центъра на разсейване. Нека разгледаме такъв участък от дължина (фиг. 6.3.1). Нека изчислим вероятността за попадение в тази област, използвайки формула (6.3.7):

Като вземем предвид свойството (6.3.8) на функцията и даваме на лявата страна на формула (6.3.9) по-компактна форма, получаваме формула за вероятността случайна променлива, разпределена според нормалния закон, да попадне в площ, симетрична по отношение на центъра на разсейване:

. (6.3.10)

Нека решим следната задача. Нека начертаем последователни сегменти на дължина от центъра на дисперсията (фиг. 6.3.2) и изчислим вероятността случайна променлива да попадне във всеки от тях. Тъй като нормалната крива е симетрична, достатъчно е да се начертаят такива сегменти само в една посока.

Използвайки формула (6.3.7), намираме:

(6.3.11)

Както се вижда от тези данни, вероятностите за попадение на всеки от следващите сегменти (пети, шести и т.н.) с точност 0,001 са равни на нула.

Закръглявайки вероятностите за попадане в сегменти до 0,01 (до 1%), получаваме три числа, които са лесни за запомняне:

0,34; 0,14; 0,02.

Сумата от тези три стойности е 0,5. Това означава, че за нормално разпределена случайна променлива цялата дисперсия (с точност до части от процента) се вписва в областта .

Това позволява, като се знае стандартното отклонение и математическото очакване на случайна променлива, грубо да се посочи обхватът на нейните практически възможни стойности. Този метод за оценка на диапазона от възможни стойности на случайна променлива е известен в математическата статистика като „правилото на трите сигми“. Правилото на трите сигми също предполага приблизителен метод за определяне на стандартното отклонение на случайна променлива: вземете максималното практически възможно отклонение от средната стойност и го разделете на три. Разбира се този груб приемможе да се препоръча само ако няма други, по-точни начини за определяне.

Пример 1. Случайна величина, разпределена по нормален закон, представлява грешка при измерване на определено разстояние. При измерване се допуска системна грешка в посока на надценяване с 1,2 (m); Стандартното отклонение на грешката на измерване е 0,8 (m). Намерете вероятността отклонението на измерената стойност от истинската стойност да не надвишава 1,6 (m) по абсолютна стойност.

Решение. Грешката на измерване е случайна величина, подчинена на нормалния закон с параметри и . Трябва да намерим вероятността това количество да попадне на участъка от до . Съгласно формула (6.3.7) имаме:

Използвайки функционалните таблици (Приложение, Таблица 1), намираме:

; ,

Пример 2. Намерете същата вероятност като в предишния пример, но при условие, че няма систематична грешка.

Решение. Използвайки формула (6.3.10), приемайки , намираме:

.

Пример 3. Стреля се по мишена, която прилича на ивица (автомагистрала) с ширина 20 m в посока, перпендикулярна на магистралата. Насочването се извършва по централната линия на магистралата. Стандартното отклонение в посоката на стрелба е равно на м. Има систематична грешка в посоката на стрелба: подлетът е 3 м. Намерете вероятността за попадение в магистрала с един изстрел.

1.2.4. Случайни величини и техните разпределения

Разпределения на случайни величини и функции на разпределение. Разпределението на числова случайна променлива е функция, която еднозначно определя вероятността случайната променлива да приеме дадена стойност или да принадлежи към даден интервал.

Първо, ако случайната променлива вземе крайно числостойности. Тогава разпределението е дадено от функцията P(X = x),присвояване на всяка възможна стойност хслучайна величина хвероятността, че X = x.

Второто е, ако случайната променлива приема безкрайно много стойности. Това е възможно само когато вероятностното пространство, върху което е дефинирана случайната променлива, се състои от безкраен бройелементарни събития. Тогава разпределението се дава от набор от вероятности P(a < х за всички двойки числа а, бтакова, че а . Разпределението може да се уточни с помощта на т.нар. функция на разпределение F(x) = P(X определящи за всички реални хвероятността случайната променлива хприема стойности по-малки от х. Това е ясно

P(a < х

Тази връзка показва, че както разпределението може да се изчисли от функцията на разпределението, така и, обратно, функцията на разпределението може да се изчисли от разпределението.

Използва се във вероятностната статистически методипри вземането на решения и други приложни изследвания функциите на разпределение са или дискретни, или непрекъснати, или комбинации от тях.

Дискретните функции на разпределение съответстват на дискретни случайни променливи, които приемат краен брой стойности или стойности от набор, чиито елементи могат да бъдат номерирани с естествени числа (такива набори се наричат ​​изброими в математиката). Тяхната графика изглежда като стъпаловидна стълба (фиг. 1).

Пример 1.Номер хдефектните елементи в партида приемат стойност 0 с вероятност 0,3, стойност 1 с вероятност 0,4, стойност 2 с вероятност 0,2 и стойност 3 с вероятност 0,1. Графика на функцията на разпределение на случайна променлива хпоказано на фиг. 1.

Фиг. 1. Графика на функцията на разпределение на броя на дефектните продукти.

Непрекъснатите функции на разпределение нямат скокове. Те нарастват монотонно с увеличаване на аргумента - от 0 при до 1 при . Случайни променливи, които имат непрекъснати функции на разпределение, се наричат ​​непрекъснати.

Непрекъснати функции на разпределение, използвани във вероятностните статистически методи вземане на решение, имат производни. Първа производна f(x)разпределителни функции F(x)се нарича плътност на вероятността,

Използвайки плътността на вероятността, можете да определите функцията на разпределение:

За всяка функция на разпределение

Изброените свойства на функциите на разпределение се използват постоянно във вероятностните и статистическите методи за вземане на решения. По-специално, последното равенство предполага специфична форма на константи във формулите за вероятностни плътности, разгледани по-долу.

Пример 2.Често се използва следната функция на разпределение:

(1)

Където аИ b– някои числа, а . Нека намерим плътността на вероятността на тази функция на разпределение:

(в точки х = аИ x = bпроизводна на функция F(x)не съществува).

Случайна променлива с функция на разпределение (1) се нарича „равномерно разпределена на интервала [ а; b]».

Смесени функции на разпределение възникват, по-специално, когато наблюденията спрат в някакъв момент. Например, когато се анализират статистически данни, получени от използването на планове за тестване на надеждността, които предвиждат прекратяване на тестването след определен период. Или при анализиране на данни за технически продукти, изискващи гаранционен ремонт.

Пример 3.Нека например експлоатационният живот на електрическа крушка е случайна величина с функция на разпределение F(t),и тестът се провежда, докато електрическата крушка се повреди, ако това се случи след по-малко от 100 часа от началото на теста, или докато t 0= 100 часа. Позволявам G(t)– функция на разпределение на времето на работа на електрическата крушка в добро състояние по време на това изпитване. Тогава

функция G(t)има скок в точка t 0, тъй като съответната случайна променлива приема стойността t 0с вероятност 1- F(t 0)> 0.

Характеристики на случайните величини.При вероятностно-статистическите методи за вземане на решения се използват редица характеристики на случайни променливи, изразени чрез функции на разпределение и плътности на вероятността.

При описване на диференциацията на доходите, при намиране на доверителни граници за параметрите на разпределението на случайни променливи и в много други случаи се използва понятието като „квантил на реда“. Р“, където 0< стр < 1 (обозначается x p). Квантил на поръчката Р– стойността на случайна променлива, за която функцията на разпределение приема стойност Рили има „скок“ от по-малка стойност Рна по-голяма стойност Р(фиг. 2). Може да се случи, че това условие е изпълнено за всички стойности на x, принадлежащи на този интервал (т.е. функцията на разпределение е постоянна на този интервал и е равна на Р). Тогава всяка такава стойност се нарича „квантил от ред“ Р" За функциите на непрекъснато разпределение по правило има един квантил x pпоръчка Р(фиг. 2) и

F(x p) = p. (2)

Фиг.2. Дефиниция на квантил x pпоръчка Р.

Пример 4.Нека намерим квантила x pпоръчка Рза разпределителната функция F(x)от (1).

На 0< стр < 1 квантиль x pсе намира от уравнението

тези. x p = a + p(b – a) = a( 1- p) +bp. При стр= 0 всякакви х < ае квантил от ред стр= 0. Квантил на поръчката стр= 1 е всяко число х > b.

За дискретни разпределения, като правило, няма x p, удовлетворяващ уравнение (2). По-точно, ако разпределението на случайна променлива е дадено в таблица 1, където х 1< x 2 < … < x k , тогава равенство (2), разглеждано като уравнение по отношение на x p, има решения само за кстойности стр, а именно

p = p 1,

p = p 1 + p 2,

p = p 1 + p 2 + p 3,

p = p 1 + p 2 + …+ p m, 3 < м < к,

стр = стр 1 + стр 2 + … + p k.

Маса 1.

Разпределение на дискретна случайна величина

За изброените квероятностни стойности стррешение x pуравнение (2) не е уникално, а именно,

F(x) = p 1 + p 2 + … + p m

за всички хтакова, че x m< x < x m+1.Тези. x p –всяко число от интервала (x m; x m+1].За всички останали Рот интервала (0;1), невключен в списъка (3), има „скок“ от стойност по-малка Рна по-голяма стойност Р. А именно, ако

p 1 + p 2 + … + p m

Че x p = x m+1.

Разглежданото свойство на дискретни разпределения създава значителни трудности при таблично изготвяне и използване на такива разпределения, тъй като е невъзможно да се поддържат точно типичните числени стойности на характеристиките на разпределението. По-специално, това е вярно за критичните стойности и нивата на значимост на непараметричните статистически тестове (вижте по-долу), тъй като разпределенията на статистиките на тези тестове са дискретни.

Квантилният ред е от голямо значение в статистиката Р= ½. Нарича се медиана (случайна променлива хили неговата разпределителна функция F(x))и е обозначен Аз (X).В геометрията има понятието "медиана" - права линия, минаваща през върха на триъгълник и разделяща противоположната му страна наполовина. В математическата статистика медианата дели наполовина не страната на триъгълника, а разпределението на случайна променлива: равенство F(x 0,5)= 0,5 означава, че вероятността да стигнете наляво х 0,5и вероятността да стигнете надясно х 0,5(или директно към х 0,5) са равни помежду си и са равни на ½, т.е.

П(х < х 0,5) = П(х > х 0,5) = ½.

Медианата показва "центъра" на разпределението. От гледна точка на една от съвременните концепции - теорията за устойчивите статистически процедури - медианата е по-добра характеристика на случайна величина от математическото очакване. Когато се обработват резултатите от измерването по порядъчна скала (вижте главата за теорията на измерването), медианата може да се използва, но математическото очакване не може.

Характеристика на случайна променлива като режим има ясно значение - стойността (или стойностите) на случайна променлива, съответстващи на локалния максимум на плътността на вероятността за непрекъсната случайна променлива или локалния максимум на вероятността за дискретна случайна променлива .

Ако х 0– режим на случайна величина с плътност f(x),тогава, както е известно от диференциалното смятане, .

Една случайна променлива може да има много режими. И така, за равномерно разпределение (1) всяка точка хтакова, че а< x < b , е мода. Това обаче е изключение. Повечето случайни променливи, използвани във вероятностните статистически методи за вземане на решения и други приложни изследвания, имат един режим. Случайни величини, плътности, разпределения, които имат един режим, се наричат ​​унимодални.

Математическото очакване за дискретни случайни променливи с краен брой стойности е разгледано в главата „Събития и вероятности“. За непрекъсната случайна променлива хочаквана стойност M(X)удовлетворява равенството

което е аналог на формула (5) от твърдение 2 на глава “Събития и вероятности”.

Пример 5.Очакване за равномерно разпределена случайна променлива хравно на

За случайните променливи, разгледани в тази глава, всички онези свойства на математическите очаквания и дисперсии, които бяха разгледани по-рано за дискретни случайни променливи с краен брой стойности, са верни. Ние обаче не предоставяме доказателства за тези свойства, тъй като те изискват задълбочаване в математическите тънкости, което не е необходимо за разбиране и квалифицирано прилагане на вероятностно-статистически методи за вземане на решения.

Коментирайте.В този учебник съзнателно се избягват математическите тънкости, свързани по-специално с концепциите за измерими множества и измерими функции, алгебра на събитията и др. Тези, които желаят да овладеят тези понятия, трябва да се обърнат към специализирана литература, по-специално към енциклопедията.

Всяка от трите характеристики – математическо очакване, медиана, мода – описва „центъра“ на вероятностното разпределение. Понятието „център“ може да се дефинира по различни начини – оттук и три различни характеристики. Въпреки това, за един важен клас разпределения - симетрични унимодални - и трите характеристики съвпадат.

Плътност на разпространение f(x)– плътност на симетрично разпределение, ако има число х 0такова, че

. (3)

Равенство (3) означава, че графиката на функцията y = f(x)симетричен спрямо вертикална линия, минаваща през центъра на симетрия х = х 0 . От (3) следва, че симетричната функция на разпределение удовлетворява съотношението

(4)

За симетрично разпределение с един режим математическото очакване, медианата и модата съвпадат и са равни х 0.

Най-важният случай е симетрия около 0, т.е. х 0= 0. Тогава (3) и (4) стават равенства

(6)

съответно. Горните отношения показват, че няма нужда да се представят в таблица симетрични разпределения за всички х, достатъчно е да има маси на х > х 0.

Нека отбележим още едно свойство на симетричните разпределения, което постоянно се използва във вероятностно-статистическите методи за вземане на решения и други приложни изследвания. За непрекъсната функция на разпределение

P(|X| < a) = P(-a < х < а) = F(a) – F(-a),

Където Е– функция на разпределение на случайна величина х. Ако функцията на разпределение Ее симетричен около 0, т.е. тогава за него е валидна формула (6).

P(|X| < a) = 2F(a) – 1.

Често се използва и друга формулировка на въпросното твърдение: ако

.

Ако и са квантили от ред и съответно (виж (2)) на функция на разпределение, симетрична около 0, тогава от (6) следва, че

От характеристиките на позицията - математическо очакване, медиана, мода - да преминем към характеристиките на разпространението на случайната променлива х: дисперсия, стандартно отклонение и коефициент на вариация v. Дефиницията и свойствата на дисперсията за дискретни случайни променливи бяха обсъдени в предишната глава. За непрекъснати случайни променливи

Стандартното отклонение е неотрицателната стойност на корен квадратен от дисперсията:

Коефициентът на вариация е отношението на стандартното отклонение към математическото очакване:

Коефициентът на вариация се прилага, когато M(X)> 0. Той измерва разпространението в относителни единици, докато стандартното отклонение е в абсолютни единици.

Пример 6.За равномерно разпределена случайна променлива хНека намерим дисперсията, стандартното отклонение и коефициента на вариация. Разликата е:

Промяната на променливата прави възможно записването:

Където ° С = (bа)/ 2. Следователно стандартното отклонение е равно на и коефициентът на вариация е:

За всяка случайна променлива хопределете още три величини - центрирани Y, нормализиран Vи дадено U. Центрирана случайна променлива Yе разликата между дадена случайна променлива хи неговото математическо очакване M(X),тези. Y = X – M(X).Очакване на центрирана случайна променлива Yе равно на 0, а дисперсията е дисперсията на дадена случайна променлива: М(Y) = 0, д(Y) = д(х). Разпределителна функция F Y(х) центрирана случайна променлива Yсвързани с разпределителната функция Е(х) оригинална случайна променлива хсъотношение:

F Y(х) = Е(х + М(х)).

Плътностите на тези случайни променливи удовлетворяват равенството

f Y(х) = f(х + М(х)).

Нормализирана случайна променлива Vе отношението на дадена случайна променлива хдо неговото стандартно отклонение, т.е. . Очакване и дисперсия на нормализирана случайна променлива Vизразени чрез характеристики хТака:

,

Където v– коефициент на вариация на първоначалната случайна променлива х. За разпределителната функция F V(х) и плътност е V(х) нормализирана случайна променлива Vние имаме:

Където Е(х) – функция на разпределение на оригиналната случайна променлива х, А f(х) – неговата плътност на вероятността.

Намалена случайна променлива Uе центрирана и нормализирана случайна променлива:

.

За дадената случайна променлива

Нормализирани, центрирани и редуцирани случайни променливи постоянно се използват както в теоретични изследвания, така и в алгоритми, софтуерни продукти, нормативна, техническа и инструктивна документация. По-специално, защото равенствата правят възможно опростяването на обосновката на методите, формулирането на теореми и формули за изчисление.

Използват се трансформации на случайни величини и по-общи такива. Така че, ако Y = aX + b, Където аИ b– тогава малко числа

Пример 7.Ако тогава Yе редуцирана случайна променлива и формули (8) се трансформират във формули (7).

С всяка случайна променлива хможете да свържете много случайни променливи Y, дадено по формулата Y = aX + bпри различни а> 0 и b. Този набор се нарича семейство с изместване на мащаба, генерирани от случайната променлива х. Функции на разпределение F Y(х) съставляват семейство от разпределения с изместване на мащаба, генерирани от функцията на разпределение Е(х). Вместо Y = aX + bчесто използвайте запис

Номер ссе нарича параметър на смяна, а числото д- мащабен параметър. Формула (9) показва това х– резултатът от измерването на определена величина – влиза в U– резултатът от измерването на същото количество, ако началото на измерването се премести към точката си след това използвайте новата мерна единица, in дпъти по-голям от стария.

За фамилията мащабно изместване (9) разпределението на X се нарича стандартно. Във вероятностните статистически методи за вземане на решения и други приложни изследвания се използват стандартното нормално разпределение, стандартното разпределение на Weibull-Gnedenko, стандартното гама разпределение и др. (виж по-долу).

Използват се и други трансформации на случайни променливи. Например за положителна случайна променлива хобмислят Y= дневник х, където lg хдесетичен логаритъмчисла х. Верига от равенства

F Y (x) = P( lg х< x) = P(X < 10x) = F( 10х)

свързва разпределителните функции хИ Y.

При обработката на данни се използват следните характеристики на случайна променлива хкато моменти на ред р, т.е. математически очаквания на случайна променлива Xq, р= 1, 2, ... Следователно самото математическо очакване е момент от ред 1. За дискретна случайна променлива моментът от ред рможе да се изчисли като

За непрекъсната случайна променлива

Моменти на ред рнаричани още начални моменти на ред р, за разлика от свързани характеристики - централни моменти на ред р, дадено от формулата

И така, дисперсията е централен момент от ред 2.

Нормално разпределение и централна гранична теорема.При вероятностно-статистическите методи за вземане на решения често говорим за нормално разпределение. Понякога се опитват да го използват за моделиране на разпределението на първоначалните данни (тези опити не винаги са оправдани - вижте по-долу). По-важното е, че много методи за обработка на данни се основават на факта, че изчислените стойности имат разпределения, близки до нормалните.

Позволявам х 1 , х 2 ,…, Xn М(X i) = ми вариации д(X i) = , аз = 1, 2,…, н,... Както следва от резултатите от предишната глава,

Помислете за намалената случайна променлива U nза сумата , а именно

Както следва от формули (7), М(U n) = 0, д(U n) = 1.

(за еднакво разпределени термини). Позволявам х 1 , х 2 ,…, Xn, … – независими еднакво разпределени случайни променливи с математически очаквания М(X i) = ми вариации д(X i) = , аз = 1, 2,…, н,... Тогава за всяко x има ограничение

Където F(x)– функция на стандартно нормално разпределение.

Повече за функцията F(x) –по-долу (прочетете „fi от x“, защото Е- Гръцки Главна буква"фи")

Централната гранична теорема (CLT) получава името си, защото е централният, най-често използван математически резултат от теорията на вероятностите и математическата статистика. Историята на CLT отнема около 200 години - от 1730 г., когато английският математик A. Moivre (1667-1754) публикува първия резултат, свързан с CLT (вижте по-долу за теоремата на Moivre-Laplace), до двадесетте и тридесетте години на н. двадесети век, когато Фин Дж. Линдеберг, французинът Пол Леви (1886-1971), югославян В. Фелер (1906-1970), руснакът А.Я. Хинчин (1894-1959) и други учени получават необходимите и достатъчни условия за валидността на класическата централна гранична теорема.

Развитието на разглежданата тема не спря дотук - те изучаваха случайни променливи, които нямат дисперсия, т.е. тези, за които

(акад. Б. В. Гнеденко и др.), ситуация, когато се сумират случайни променливи (по-точно случайни елементи) с по-сложен характер от числата (акад. Ю. В. Прохоров, А. А. Боровков и техните сътрудници) и др.

Разпределителна функция F(x)се дава от равенството

,

където е плътността на стандартното нормално разпределение, което има доста сложен израз:

.

Тук =3,1415925... е число, известно в геометрията, равно на отношението на обиколката към диаметъра, д = 2.718281828... - основата на естествените логаритми (за да запомните това число, имайте предвид, че 1828 е годината на раждане на писателя Л.Н. Толстой). Както е известно от математически анализ,

При обработката на резултатите от наблюдението функцията на нормалното разпределение не се изчислява по дадените формули, а се намира с помощта на специални таблици или компютърни програми. Най-добрите „Таблици на математическата статистика“ на руски език са съставени от членове-кореспонденти на Академията на науките на СССР Л.Н. Болшев и Н. В. Смирнов.

Формата на плътността на стандартното нормално разпределение следва от математическата теория, която не можем да разгледаме тук, както и доказателството на CLT.

За илюстрация предоставяме малки таблици на функцията на разпределение F(x)(Таблица 2) и неговите квантили (Таблица 3). функция F(x)симетричен около 0, което е отразено в таблица 2-3.

Таблица 2.

Стандартна функция за нормално разпределение.

Ако случайната променлива хима разпределителна функция F(x),Че M(X) = 0, д(х) = 1. Това твърдение е доказано в теорията на вероятностите въз основа на формата на плътността на вероятностите. Това е в съответствие с подобно твърдение за характеристиките на намалената случайна променлива U n, което е съвсем естествено, тъй като CLT гласи, че при неограничено увеличаване на броя на термините функцията на разпределение U nклони към стандартната нормална функция на разпределение F(x),и за всякакви х.

Таблица 3.

Квантили на стандартното нормално разпределение.

Квантил на поръчката Р

Квантил на поръчката Р

Нека въведем концепцията за семейство от нормални разпределения. По дефиниция нормалното разпределение е разпределението на случайна променлива х, за които разпределението на редуцираната случайна променлива е F(x).Както следва от общи свойствасемейства от разпределения с мащабно изместване (вижте по-горе), нормалното разпределение е разпределението на случайна променлива

Където х– случайна величина с разпределение F(X),и м = М(Y), = д(Y). Нормално разпределение с параметри на смяна ми мащабът обикновено се посочва н(м, ) (понякога се използва нотацията н(м, ) ).

Както следва от (8), плътността на вероятността на нормалното разпределение н(м, ) Има

Нормалните разпределения образуват семейство с изместване на мащаба. В този случай параметърът на мащаба е д= 1/ и параметъра за смяна ° С = - м/ .

За централните моменти от трети и четвърти ред на нормалното разпределение са валидни следните равенства:

Тези равенства формират основата на класическите методи за проверка, че наблюденията следват нормално разпределение. В наши дни обикновено се препоръчва да се тества нормалността с помощта на критерия УШапиро - Вилка. Проблемът с тестването за нормалност е разгледан по-долу.

Ако случайни променливи X 1И X 2имат разпределителни функции н(м 1 , 1) И н(м 2 , 2) съответно тогава X 1+ X 2има разпределение Следователно, ако случайни променливи х 1 , х 2 ,…, Xn н(м, ) , тогава тяхното средно аритметично

има разпределение н(м, ) . Тези свойства на нормалното разпределение се използват постоянно в различни вероятностни и статистически методи за вземане на решения, по-специално в статистическото регулиране на технологичните процеси и в статистическия приемен контрол въз основа на количествени критерии.

Нормалното разпределение дефинира три разпределения, които сега често се използват в статистическа обработкаданни.

Разпределение (хи - квадрат) – разпределение на случайна променлива

къде са случайните променливи х 1 , х 2 ,…, Xnнезависими и имат еднакво разпределение н(0,1). В този случай броят на термините, т.е. н, се нарича „брой степени на свобода“ на разпределението хи-квадрат.

Разпределение T t на Стюдънт е разпределението на случайна променлива

къде са случайните променливи UИ хнезависим, Uима стандартно нормално разпределение н(0,1) и х– чи разпределение – квадрат c нстепени на свобода. При което нсе нарича „брой степени на свобода“ на разпределението на Стюдънт. Това разпределение е въведено през 1908 г. от английския статистик У. Госет, който работи във фабрика за бира. Използвани са вероятностни статистически методи, за да се направят икономически и технически решенияв тази фабрика, поради което нейното ръководство забранява на В. Госет да публикува научни статии под собственото си име. По този начин бяха защитени търговски тайни и „ноу-хау“ под формата на вероятностни и статистически методи, разработени от V. Gosset. Той обаче имаше възможност да публикува под псевдонима „Студент“. Историята на Госет-Студент показва, че още сто години мениджърите на Великобритания са били наясно с великия икономическа ефективноствероятностни и статистически методи за вземане на решения.

Разпределението на Фишер е разпределението на случайна променлива

къде са случайните променливи X 1И X 2са независими и имат хи-квадрат разпределение с броя на степените на свобода к 1 И к 2 съответно. В същото време двойката (к 1 , к 2 ) – двойка „степени на свобода“ от разпределението на Фишер, а именно, к 1 е броят на степените на свобода на числителя, и к 2 – брой степени на свобода на знаменателя. Разпределението на случайната променлива F е кръстено на великия английски статистик Р. Фишер (1890-1962), който активно го използва в трудовете си.

Изрази за хи-квадрат, функциите на разпределение на Студент и Фишер, техните плътности и характеристики, както и таблици могат да бъдат намерени в специализираната литература (вижте например).

Както вече беше отбелязано, нормалните разпределения сега често се използват във вероятностни модели в различни приложни области. Каква е причината това двупараметрично семейство от разпределения да е толкова широко разпространено? Това се изяснява от следната теорема.

Централна гранична теорема(за различно разпределени термини). Позволявам х 1 , х 2 ,…, Xn,… - независими случайни променливи с математически очаквания М(х 1 ), M(х 2 ),…, M(х n), ... и вариации д(х 1 ), д(х 2 ),…, д(х n), ... съответно. Позволявам

След това, ако са верни определени условия, които гарантират малкия принос на който и да е от термините в U n,

за всеки х.

Тук няма да формулираме въпросните условия. Те могат да бъдат намерени в специализирана литература (вижте например). „Изясняването на условията, при които работи CPT, е заслуга на изключителните руски учени А. А. Марков (1857-1922) и по-специално на А. М. Ляпунов (1857-1918).“

Централната гранична теорема показва, че в случай, когато резултатът от измерване (наблюдение) се формира под въздействието на много причини, всяка от които има само малък принос, и общият резултат се определя адитивно, т.е. чрез добавяне, тогава разпределението на резултата от измерването (наблюдението) е близко до нормалното.

Понякога се смята, че за да бъде разпределението нормално, е достатъчно резултатът от измерването (наблюдението) хсе формира под влияние на много причини, всяка от които има малко влияние. Това е грешно. Важното е как действат тези причини. Ако е добавка, тогава хима приблизително нормално разпределение. Ако мултипликативно(т.е. действията на отделните причини се умножават и не се добавят), след това разпределението хблизки не до нормалното, а до т.нар. логаритмично нормална, т.е. Не х, а log X има приблизително нормално разпределение. Ако няма причина да се смята, че работи един от тези два механизма за формиране на крайния резултат (или някакъв друг добре дефиниран механизъм), тогава относно разпределението хнищо определено не може да се каже.

От горното следва, че в конкретен приложен проблем нормалността на резултатите от измерванията (наблюденията) като правило не може да се установи от общи съображения; трябва да се провери с помощта на статистически критерии. Или използвайте непараметрични статистически методи, които не се основават на предположения за принадлежността на функциите на разпределение на резултатите от измерване (наблюдения) към едно или друго параметрично семейство.

Непрекъснати разпределения, използвани във вероятностните и статистически методи за вземане на решения.В допълнение към фамилията нормални разпределения с мащабно изместване, широко се използват редица други фамилии разпределения - логнормални, експоненциални, Weibull-Gnedenko, гама разпределения. Нека да разгледаме тези семейства.

Случайна стойност хима логнормално разпределение, ако случайната променлива Y= дневник хима нормално разпределение. Тогава З= дневник х = 2,3026…Yсъщо има нормално разпределение н(а 1 ,σ 1), където ln х - натурален логаритъм х. Плътността на логнормалното разпределение е:

От централната гранична теорема следва, че произведението х = х 1 х 2 Xnнезависими положителни случайни променливи X i, аз = 1, 2,…, н, на свобода н може да се апроксимира чрез логнормално разпределение. По-специално, мултипликативният модел на формиране на заплатите или доходите води до препоръката за сближаване на разпределенията на заплатите и доходите логаритмично нормални закони. За Русия тази препоръка се оказа оправдана - статистическите данни го потвърждават.

Има и други вероятностни модели, които водят до логнормалния закон. Класически пример за такъв модел е даден от А. Н. Колмогоров, който от физически базирана система от постулати стига до извода, че размерите на частиците при раздробяване на парчета руда, въглища и др. в топковите мелници имат логнормално разпределение.

Нека да преминем към друго семейство разпределения, широко използвани в различни вероятностно-статистически методи за вземане на решения и други приложни изследвания - семейството на експоненциалните разпределения. Нека започнем с вероятностен модел, който води до такива разпределения. За да направите това, помислете за „потока от събития“, т.е. поредица от събития, случващи се едно след друго в определени моменти от време. Примерите включват: поток на повикване в телефонна централа; поток от повреди на оборудването в технологичната верига; поток от повреди на продукта по време на тестването на продукта; поток от клиентски заявки към банковия клон; поток от купувачи, кандидатстващи за стоки и услуги и др. В теорията на потоците от събития е валидна теорема, подобна на централната гранична теорема, но в нея ние говорим зане за сумирането на случайни променливи, а за сумирането на потоци от събития. Разглеждаме общия поток, съставен от голямо числонезависими потоци, нито един от които няма доминиращо влияние върху общия поток. Например потокът от повиквания, влизащ в телефонна централа, е съставен от голям брой независими потоци от повиквания, произхождащи от отделни абонати. Доказано е, че в случаите, когато характеристиките на потоците не зависят от времето, общият поток се описва напълно с едно число - интензивността на потока. За общия поток вземете предвид случайната променлива х- продължителността на интервала от време между последователни събития. Разпределителната му функция има формата

(10)

Това разпределение се нарича експоненциално разпределение, защото формула (10) включва експоненциалната функция дх. Стойността 1/λ е мащабен параметър. Понякога се въвежда и параметър за смяна с, разпределението на случайна променлива се нарича експоненциално X + s, където разпределението хсе дава с формула (10).

Експоненциалните разпределения са частен случай на т.нар. Разпределения на Уейбул - Гнеденко. Те са кръстени на имената на инженера V. Weibull, който въвежда тези разпределения в практиката на анализиране на резултатите от тестовете за умора, и математика B. V. Gnedenko (1912-1995), който получава такива разпределения като граници при изследване на максимума на резултатите от теста. Позволявам х- случайна променлива, характеризираща продължителността на работа на продукта, сложна система, елемент (т.е. ресурс, време на работа до пределно състояние и др.), продължителност на работа на предприятие или живот на живо същество и др. Интензивността на повредата играе важна роля

(11)

Където Е(х) И f(х) - функция на разпределение и плътност на случайна величина х.

Нека опишем типично поведениепроцент на неуспех. Целият интервал от време може да бъде разделен на три периода. На първия от тях функцията λ(x)има високи стойности и ясна тенденция към намаляване (най-често намалява монотонно). Това може да се обясни с наличието в партидата на въпросните продуктови единици с явни и скрити дефекти, които водят до относително бърза повреда на тези продуктови единици. Първият период се нарича „период на взлом“ (или „взлом“). Това е, което обикновено покрива гаранционният период.

След това идва период на нормална работа, характеризиращ се с приблизително постоянен и относително нисък процент на отказ. Характерът на отказите през този период е внезапен (аварии, грешки на оперативния персонал и др.) и не зависи от продължителността на работа на продуктовата единица.

И накрая, последният период на експлоатация е периодът на стареене и износване. Характерът на повредите през този период е необратим физико-механичен и химически промениматериали, водещи до прогресивно влошаване на качеството на продуктовата единица и нейния окончателен отказ.

Всеки период има свой собствен вид функция λ(x). Нека разгледаме класа на мощностните зависимости

λ(x) = λ 0bx b -1 , (12)

Където λ 0 > 0 и b> 0 - някои числови параметри. Стойности b < 1, b= 0 и b> 1 съответстват на вида на степента на повреда през периодите съответно на разработка, нормална работа и стареене.

Връзка (11) при дадена честота на отказ λ(x)- диференциално уравнение за функция Е(х). От теорията на диференциалните уравнения следва, че

(13)

Замествайки (12) в (13), получаваме това

(14)

Разпределението, дадено с формула (14), се нарича разпределение на Weibull - Gnedenko. Тъй като

то от формула (14) следва, че количеството А, дадено с формула (15), е мащабен параметър. Понякога се въвежда и параметър за смяна, т.е. Функциите на разпределение на Вейбул-Гнеденко се наричат Е(х - ° С), Където Е(х) се дава с формула (14) за някои λ 0 и b.

Плътността на разпределение на Уейбул-Гнеденко има формата

(16)

Където а> 0 - параметър на мащаба, b> 0 - параметър на формата, с- параметър за смяна. В този случай параметърът Аот формула (16) се свързва с параметъра λ 0 от формула (14) чрез връзката, посочена във формула (15).

Експоненциалното разпределение е много специален случай на разпределението на Weibull-Gnedenko, съответстващо на стойността на параметъра на формата b = 1.

Разпределението на Weibull-Gnedenko се използва и при конструирането на вероятностни модели на ситуации, в които поведението на даден обект се определя от „най-слабото звено“. Има аналогия с верига, чиято безопасност се определя от връзката, която има най-малка здравина. С други думи, нека х 1 , х 2 ,…, Xn- независими еднакво разпределени случайни променливи,

X (1)=мин( X 1, X 2,…, X n), X(n)=макс( X 1, X 2,…, X n).

В число приложни проблемииграят голяма роля х(1) И х(н) , по-специално, когато се изучават максималните възможни стойности ("записи") на определени стойности, например застрахователни плащания или загуби поради търговски рискове, когато се изучават границите на еластичност и издръжливост на стоманата, редица характеристики на надеждност и др. . Показано е, че за големи n разпределенията х(1) И х(н) , като правило, са добре описани от разпределенията на Weibull-Gnedenko. Фундаментален принос в изследването на разпределенията х(1) И х(н) принос от съветския математик Б. В. Гнеденко. Трудовете на V. Weibull, E. Gumbel, V.B. са посветени на използването на получените резултати в икономиката, управлението, технологиите и други области. Невзорова, Е.М. Кудлаев и много други специалисти.

Нека преминем към семейството на гама разпределенията. Те намират широко приложение в икономиката и управлението, теорията и практиката на надеждността и изпитването, в различни области на техниката, метеорологията и др. По-специално, в много ситуации гама-разпределението зависи от такива величини като общия експлоатационен живот на продукта, дължината на веригата от проводящи прахови частици, времето, през което продуктът достига граничното състояние по време на корозия, времето за работа до к-ти отказ, к= 1, 2, … и т.н. Продължителността на живота на пациентите с хронични заболявания и времето за постигане на определен ефект по време на лечението в някои случаи имат гама разпределение. Това разпределение е най-адекватно за описание на търсенето в икономически и математически модели на управление на запасите (логистика).

Плътността на гама разпределение има формата

(17)

Плътността на вероятността във формула (17) се определя от три параметъра а, b, ° С, Където а>0, b>0. При което ае параметър на формата, b- параметър на мащаба и с- параметър за смяна. Фактор 1/Γ(а)се нормализира, беше въведено в

Тук Γ(a)- една от специалните функции, използвани в математиката, така наречената "гама функция", след която е кръстено разпределението, дадено с формула (17),

На фиксирана Аформула (17) определя семейство от разпределения с изместване на мащаба, генерирано от разпределение с плътност

(18)

Разпределение от формата (18) се нарича стандартно гама разпределение. Получава се от формула (17) при b= 1 и с= 0.

Специален случай на гама разпределения за А= 1 са експоненциални разпределения (с λ = 1/b). С естествени АИ с=0 гама разпределенията се наричат ​​разпределения на Ерланг. От трудовете на датския учен К. А. Ерланг (1878-1929), служител на Копенхагенската телефонна компания, който учи през 1908-1922 г. функционирането на телефонните мрежи започва развитието на теорията за масовото обслужване. Тази теория се занимава с вероятностно и статистическо моделиране на системи, в които се обслужва поток от заявки, за да се вземат оптимални решения. Разпределенията Erlang се използват в същите области на приложение, в които се използват експоненциалните разпределения. Това се основава на следния математически факт: сумата от k независими случайни променливи, експоненциално разпределени със същите параметри λ и с, има гама разпределение с параметър на формата а =к, мащабен параметър b= 1/λ и параметър на отместване kc. При с= 0 получаваме разпределението на Ерланг.

Ако случайната променлива хима гама разпределение с параметър на формата Атакова, че д = 2 а- цяло число, b= 1 и с= 0, след това 2 хима разпределение хи-квадрат с дстепени на свобода.

Случайна стойност хс разпределението gvmma има следните характеристики:

Очаквана стойност M(X) =аб + ° С,

Дисперсия д(х) = σ 2 = аб 2 ,

Коефициентът на вариация

Асиметрия

Излишък

Нормалното разпределение е краен случай на гама разпределението. По-точно, нека Z е случайна променлива със стандартно гама разпределение, дадено от формулата(18). Тогава

за всяко реално число х, Където F(x)- стандартна нормална функция на разпределение н(0,1).

В приложните изследвания се използват и други параметрични семейства от разпределения, от които най-известни са системата от криви на Пиърсън, сериите на Еджуърт и Шарлие. Те не се разглеждат тук.

Отделен разпределения, използвани във вероятностните и статистически методи за вземане на решения.Най-често се използват три семейства дискретни разпределения – биномиално, хипергеометрично и Поасоново, както и някои други семейства – геометрично, отрицателно биномно, многочленно, отрицателно хипергеометрично и др.

Както вече беше споменато, биномното разпределение се среща в независими опити, във всяко от които с вероятност Рсе появява събитие А. Ако общ бройтестове ндаден, след това броят на тестовете Y, в който се появи събитието А, има биномиално разпределение. За биномно разпределение вероятността да бъде прието като случайна променлива е Yстойности гсе определя по формулата

Брой комбинации от нелементи от г, познат от комбинаториката. За всички г, с изключение на 0, 1, 2, …, н, ние имаме П(Y= г)= 0. Биномиално разпределение с фиксиран размер на извадката нсе определя от параметъра стр, т.е. биномиалните разпределения образуват еднопараметърно семейство. Те се използват при анализа на данни от извадкови проучвания, по-специално при изследване на потребителските предпочитания, селективен контрол на качеството на продуктите според едноетапни планове за контрол, при тестване на популации от индивиди в демографията, социологията, медицината, биологията и др. .

Ако Y 1 И Y 2 - независими биномни случайни променливи с един и същи параметър стр 0 , определени от проби с об н 1 И н 2 съответно тогава Y 1 + Y 2 - биномна случайна променлива с разпределение (19). Р = стр 0 И н = н 1 + н 2 . Тази забележка разширява приложимостта на биномното разпределение, като позволява резултатите от няколко групи тестове да бъдат комбинирани, когато има причина да се смята, че един и същ параметър съответства на всички тези групи.

Характеристиките на биномното разпределение бяха изчислени по-рано:

М(Y) = н.п., д(Y) = н.п.( 1- стр).

В раздела "Събития и вероятности" законът за големите числа е доказан за биномна случайна променлива:

за всеки . Използвайки централната гранична теорема, законът за големите числа може да бъде прецизиран, като се посочи колко Y/ нсе различава от Р.

Теорема на Моавр-Лаплас.За всякакви числа a и b, а< b, ние имаме

Където Е(х) е функция на стандартно нормално разпределение с математическо очакване 0 и дисперсия 1.

За да го докажете, достатъчно е да използвате представянето Yпод формата на сума от независими случайни променливи, съответстващи на резултатите от отделните тестове, формули за М(Y) И д(Y) и централната гранична теорема.

Тази теорема е за случая Р= ½ е доказано от английския математик А. Моавър (1667-1754) през 1730 г. В горната формулировка е доказано през 1810 г. от френския математик Пиер Симон Лаплас (1749 - 1827).

Хипергеометричното разпределение възниква по време на селективно управление на краен набор от обекти с обем N според алтернативен критерий. Всеки контролиран обект се класифицира като притежаващ атрибута А, или като нямащи тази характеристика. Хипергеометричното разпределение има случайна променлива Y, равно на числотообекти, които имат характеристиката Ав произволна извадка от обем н, Където н< н. Например число Yдефектни единици продукт в произволна проба от обем нот партидния обем нима хипергеометрично разпределение ако н< н. Друг пример е лотарията. Нека знакът Абилетът е знак за „да си победител“. Нека общият брой на билетите н, и някакво лице придоби нот тях. Тогава броят на печелившите билети за този човек има хипергеометрично разпределение.

За хипергеометрично разпределение вероятността случайна променлива Y да приеме стойността y има формата

(20)

Където д– броя на обектите, които имат атрибута А, в разглеждания набор от обем н. При което гприема стойности от max(0, н - (н - д)) до min( н, д), други неща гвероятността във формула (20) е равна на 0. Така хипергеометричното разпределение се определя от три параметъра - обем население н, брой обекти дв него, притежаващи въпросната характеристика Аи размер на извадката н.

Обикновено произволно вземане на проби нот общия обем не извадка, получена в резултат на случаен подбор, при който някой от наборите от нобектите имат еднаква вероятност да бъдат избрани. Методите за произволен подбор на проби от респонденти (интервюирани) или единици стоки на парче са разгледани в инструктивните, методическите и нормативните документи. Един от методите за избор е следният: обектите се избират един от друг и на всяка стъпка всеки от останалите обекти в набора има еднакъв шанс да бъде избран. В литературата термините „случайна извадка“ и „случайна извадка без връщане“ също се използват за вида на разглежданите проби.

Тъй като обемите на населението (партида) ни проби нобикновено са известни, тогава параметърът на хипергеометричното разпределение, който трябва да се оцени, е д. В статистическите методи за управление на качеството на продуктите д– обикновено броят на дефектните единици в партида. Характеристиката на разпределението също представлява интерес д/ н– ниво на дефекти.

За хипергеометрично разпределение

Последният фактор в израза за дисперсия е близък до 1 ако н>10 н. Ако направите замяна стр = д/ н, тогава изразите за математическото очакване и дисперсията на хипергеометричното разпределение ще се превърнат в изрази за математическото очакване и дисперсията на биномното разпределение. Това не е случайно. Може да се покаже, че

при н>10 н, Където стр = д/ н. Ограничаващото съотношение е валидно

и тази ограничаваща връзка може да се използва, когато н>10 н.

Третото широко използвано дискретно разпределение е разпределението на Поасон. Случайната променлива Y има разпределение на Поасон, ако

,

където λ е параметърът на разпределението на Поасон и П(Y= г)= 0 за всички останали г(за y=0 се означава 0! =1). За разпределението на Поасон

М(Y) = λ, д(Y) = λ.

Това разпределение е кръстено на френския математик С. Д. Поасон (1781-1840), който за първи път го получава през 1837 г. Разпределението на Поасон е граничният случай на биномиалното разпределение, когато вероятността Ризпълнението на събитието е малко, но броят на тестовете нстрахотно и н.п.= λ. По-точно граничното отношение е валидно

Следователно разпределението на Поасон (в старата терминология „закон за разпределение“) често се нарича също „закон за редките събития“.

Разпределението на Поасон произхожда от теорията на потока на събитията (виж по-горе). Доказано е, че за най-простия поток с постоянен интензитет Λ, броят на събитията (повиквания), настъпили през времето T, има Поасоново разпределение с параметър λ = Λ T. Следователно вероятността през времето Tняма да се случи събитие, равно на д - Λ T, т.е. функцията на разпределение на дължината на интервала между събитията е експоненциална.

Разпределението на Поасон се използва при анализиране на резултатите от примерни маркетингови проучвания на потребителите, изчисляване на оперативните характеристики на плановете за контрол на статистическото приемане в случай на малки стойности на нивото на приемане на дефекти, за да се опише броят на повреди на статистически контролиран технологичен процес за единица време, броят на „изискванията за обслужване“, получени за единица време в системата за масово обслужване, статистически модели на злополуки и редки заболявания и др.

Описание на други параметрични семейства на дискретни разпределения и техните възможности практическа употребасе разглеждат в литературата.


В някои случаи, например, когато се изучават цени, обеми на продукцията или общо време между повреди при проблеми с надеждността, функциите на разпределението са постоянни за определени интервали, в които стойностите на изследваните случайни променливи не могат да попаднат.

Предишен