Дисперсионни характеристики. Вариационна серия и нейните числени характеристики: позиции, дисперсия, форми Сравнителни характеристики на методите на смилане: високоскоростни; мощност; комбиниран; интегрална; укрепване

    ЕФЕКТИВНА ПОВЪРХНОСТ НА РАЗСЕЙВАНЕ (ПЛОЩ)- характеристика на отразяващата способност на целта, изразена чрез съотношението на електрическата мощност. маг. енергия, отразена от целта по посока на приемника, спрямо повърхностната плътност на енергийния поток, падаща върху целта. Зависи от...... Енциклопедия на стратегическите ракетни сили

    Квантова механика ... Уикипедия

    - (EPR) характеристика на отразяващата способност на цел, облъчена от електромагнитни вълни. Стойността на EPR се определя като съотношението на потока (мощността) на електромагнитната енергия, отразена от целта по посока на радиоелектронното оборудване (RES) към... ... Морски речник

    лента на разсейване- Статистически характеристики на експерименталните данни, отразяващи тяхното отклонение от средната стойност. Теми: металургията като цяло EN desperal band ...

    Ръководство за технически преводач - (модулационна трансферна функция), функция, с помощта на разреза се оценяват свойствата на "остротата" на оптичните лещи за изображения. системи и отд. елементи на такива системи. Ch.k.x. е така нареченото преобразуване на Фурие. функция на разсейване на линията, описваща природата на „разпръскването“... ...

    Физическа енциклопедия

    лента на разсейванеФункция за предаване на модулация, функция, която оценява свойствата на „остротата“ на оптичните системи за изображения и отделните елементи на такива системи (вижте например Острота на фотографско изображение). Ch.k.x. има Фурие...... - статистическа характеристика на експерименталните данни, отразяваща тяхното отклонение от средната стойност. Вижте също: Плъзгаща лента Релефна лента Лента за втвърдяване...

    Енциклопедичен речник по металургияРАЗСЕЙВАЩА ЛЕНТА - статистическа характеристика на експерименталните данни, отразяваща тяхното отклонение от средната стойност...

    Металургичен речник Характеристики на разсейването на стойности на случайни променливи. M. t. h е свързано с квадратичното отклонение σ по формулата Този метод за измерване на разсейването се обяснява с факта, че в случай на нормално ...

    Велика съветска енциклопедияВАРИАЦИОННА СТАТИСТИКА - ВАРИАЦИОННА СТАТИСТИКА, термин, който обединява група от техники за статистически анализ, използвани предимно в природните науки. През втората половина на 19в. Quetelet, „Anthro pometrie ou mesure des differentes facultes de 1... ...

    Очакване- (Средна популация) Математическото очакване е вероятностното разпределение на случайна променлива, дефиниция, математическо очакване на дискретни и непрекъснати случайни променливи, извадка, условно очакване, изчисление,... ... Енциклопедия на инвеститора

За математически и статистически анализ на резултатите от пробите, познаването само на характеристиките на позицията не е достатъчно. Същата средна стойност може да характеризира напълно различни проби.

Затова освен тях статистиката също отчита характеристики на разсейване (вариации, или флуктуации ) резултати.

1. Диапазон на вариация

Определение. В обхват вариацията е разликата между най-големите и най-малките резултати от пробата, означена с Ри се определя

Р=Xмакс - Xмин.

Информационната стойност на този показател е малка, въпреки че с малки размери на извадката е лесно да се оцени разликата между най-добрите и най-лошите резултати на спортистите.

2. Дисперсия

Определение. Дисперсия се нарича среден квадрат на отклонението на характерните стойности от средната аритметична стойност.

За негрупирани данни дисперсията се определя по формулата

Къде X аз– стойност на атрибута, - средно аритметично.

За данни, групирани в интервали, дисперсията се определя по формулата

,

Къде X аз– средна стойност аз интервал на групиране, п аз– интервални честоти.

За да се опростят изчисленията и да се избегнат грешки в изчисленията при закръгляване на резултатите (особено при увеличаване на размера на извадката), се използват и други формули за определяне на дисперсията. Ако средната аритметична стойност вече е изчислена, тогава се използва следната формула за негрупирани данни:

 2 =
,

за групирани данни:

.

Тези формули се получават от предишните чрез разкриване на квадрата на разликата под знака на сумата.

В случаите, когато средноаритметичното и дисперсията се изчисляват едновременно, се използват формулите:

за негрупирани данни:

 2 =
,

за групирани данни:

.

3. Среден квадрат(стандартен)отклонение

Определение. Среден квадрат (стандартен ) отклонение характеризира степента на отклонение на резултатите от средната стойност в абсолютни единици, тъй като, за разлика от дисперсията, има същите мерни единици като резултатите от измерването. С други думи, стандартното отклонение показва плътността на разпределението на резултатите в група около средната стойност или хомогенността на групата.

За негрупирани данни стандартното отклонение може да се определи с помощта на формулите

 =
,

 =
или =
.

За данни, групирани в интервали, стандартното отклонение се определя по формулите:

,

или
.

4. Грешка на средната аритметична стойност (средна грешка)

Средна аритметична грешка характеризира флуктуацията на средната стойност и се изчислява по формулата:

.

Както може да се види от формулата, с увеличаване на размера на извадката грешката на средната стойност намалява пропорционално на корен квадратен от размера на извадката.

5. Коефициент на вариация

Коефициент на вариация се определя като съотношението на стандартното отклонение към средната аритметична стойност, изразено като процент:

.

Смята се, че ако коефициентът на вариация не надвишава 10%, тогава извадката може да се счита за хомогенна, тоест получена от една генерална популация.

За извадка е възможно да се определят редица числени характеристики, които са подобни на основните числени характеристики на случайни променливи в теорията на вероятностите (математическо очакване, дисперсия, стандартно отклонение, мода, медиана) и са в някакъв смисъл (който ще бъде ясно по-късно) тяхната приблизителна стойност.

Нека е дадено статистическото разпределение на обема на извадката пза честоти и относителни честоти:

х аз

х 1

х 2

х к

п аз

п 1

п 2

п к


х аз

х 1

х 2

х к

w аз

w 1

w 2

w к

Примерна средна стойностСредната аритметична стойност на всички опции се нарича:

Ако въведем фактор под знака за сума, получаваме формула за средната стойност на извадката по отношение на относителните честоти:

.

Имайте предвид, че в случай на интервална серия средната стойност на извадката се изчислява по същите формули, ако са числата X 1 , … , X квземете средните точки на интервалите: , … ,.

Дисперсия на извадкатае средната аритметична стойност на квадратните отклонения на стойностите на извадката от тяхната средна стойност на извадката:

Като отново въведем фактор под знака за сумата, получаваме формула за дисперсия на извадката по отношение на относителните честоти:

Простите трансформации водят до по-удобна формула за изчисляване на дисперсията на извадката

,

където е извадковата средна стойност на квадрата на изследваната случайна променлива, т.е.

Ако извадката е представена от интервална статистическа серия, тогава формулите за дисперсията на извадката остават същите, където, както обикновено, като числа X 1 , … , X квземат се средните точки на интервалите: , … ,.

Примерно стандартно отклонениенаречен квадратен корен от дисперсията на извадката

.

Обхватът на вариацията Ре разликата между максималните и минималните стойности в пробата. Ако опциите в извадката са класирани (поставени във възходящ ред), тогава

.

Коефициент на вариацияопределена по формулата

.

Мода М Овариационна серия е вариантът, който има най-висока честота (или относителна честота).

Медиана М дна вариационна серия е числото, което е нейната среда. За дискретна серия с нечетно число опцията за медиана е равна на нейната средна опция. Ако броят на варианта е четен, тогава Медина е равна на средната (т.е. половината от сумата) на двата средни варианта.

Основните статистически характеристики на серия от измервания (вариационни серии) включват характеристики на позицията (средни характеристики или централна тенденция на извадката); характеристики на дисперсията (вариация или колебание) и характеристики на формата на разпределението.

ДО характеристики на позициятавключват средната аритметична (средна), мода и медиана.

Към характеристиките на разсейване(вариации или флуктуации) включват: диапазон на вариация, дисперсия, средно квадратно (стандартно) отклонение, грешка на средната аритметична стойност (средна грешка), коефициент на вариация и др.

Към характеристиките на форматавключват коефициент на изкривяване, мярка на изкривяване и ексцес.

51. Оценка на параметрите на генералната съвкупност. Точкова и интервална оценка. Доверителен интервал. Ниво на значимост

Оценка на параметрите на населението

Има точкови и интервални оценки на общите параметри.

Спот едно число. Такива оценки включват напр.

За да могат статистическите оценки да дадат „добри“ приближения на оценените параметри, те трябва да бъдат:

    неразместен;

    ефективен;

    заможен.

Една оценка се нарича безпристрастна, ако математическото очакване на нейното извадково разпределение съвпада със стойността на общия параметър.

Точкова оценкасе нарича ефективен, ако има най-малката дисперсия на извадковото разпределение в сравнение с други подобни оценки, т.е. показва най-малката случайна вариация.

Точковата оценка се нарича последователна, ако с увеличаване на размера на извадката се стреми към стойността на общия параметър.

например,Средната стойност на извадката е последователна, безпристрастна оценка на общата средна стойност. За извадка от нормална популация тази оценка също е ефективна.

При малък размер на извадката точковата оценка може да се различава значително от оценения параметър, т.е. водят до сериозни грешки. Поради тази причина, ако размерът на извадката е малък, трябва да използвате интервални оценки.

Интервалнаречена оценка, която се определя две числакраища на интервала доверителен интервал.

Интервалните оценки ни позволяват да установим точността и надеждността на оценките.

За да се оцени общ параметър с помощта на доверителен интервал, са необходими три стойности:

Например доверителният интервал за общата средна стойност се намира по формулата: на ниво на значимост .

Доверителен интервал- термин, използван в математическата статистика за интервална оценка на статистическите параметри, която е по-предпочитана за малък размер на извадката от точковата оценка.

Ниво на значимост - това е вероятността да сме сметнали разликите за значителни, но те всъщност са случайни.

Когато посочим, че разликите са значими при ниво на значимост от 5%, или когато r< 0,05 , тогава имаме предвид, че вероятността те да са ненадеждни е 0,05.

Когато посочим, че разликите са значими на ниво на значимост от 1%, или когато r< 0,01 , тогава имаме предвид, че вероятността те да са ненадеждни е 0,01.

Ако преведем всичко това на по-формализиран език, тогава нивото на значимост е вероятността за отхвърляне на нулевата хипотеза, докато е вярна.

Грешката при отхвърляне на нулевата хипотеза, когато е вярна, се нарича грешка тип 1. (Вижте таблица 1)

Таблица 1. Нулеви и алтернативни хипотези и възможни условия за тестване.

Вероятността за такава грешка обикновено се означава като α. По същество би трябвало да посочим в скоби не p < 0,05 или p < 0,01 и α < 0,05 или α < 0,01.

Ако вероятността за грешка е α , тогава вероятността за правилно решение: 1-α. Колкото по-малко е α, толкова по-голяма е вероятността за правилно решение.

Исторически, в психологията е общоприето, че най-ниското ниво на статистическа значимост е нивото от 5% (p≤0,05): достатъчно е нивото от 1% (p≤0,01), а най-високото е нивото от 0,1% (p≤0,001) , следователно таблиците с критични стойности обикновено съдържат стойностите на критериите, съответстващи на нивата на статистическа значимост p≤0.05 и p≤0.01, понякога - p≤0.001. За някои критерии таблиците показват точното ниво на значимост на техните различни емпирични стойности. Например, за φ*=1,56 p=O,06.

Въпреки това, докато нивото на статистическа значимост не достигне p=0,05, все още нямаме право да отхвърлим нулевата хипотеза. Ще се придържаме към следното правило за отхвърляне на хипотезата за липса на разлики (Ho) и приемане на хипотезата за статистическа значимост на разликите (H 1).

Без значение колко важни са средните характеристики, също толкова важна характеристика на масив от числени данни е поведението на останалите членове на масива по отношение на средната стойност, колко се различават от средната, колко членове на масива се различават значително от средното. По време на обучението по стрелба се говори за точността на резултатите; в статистиката се изучават характеристиките на дисперсията (разпръскването).

Разликата между всяка стойност на x и средната стойност на x се нарича отклонение и се изчислява като разликата x, - x. В този случай отклонението може да приеме както положителни стойности, ако числото е по-голямо от средното, така и отрицателни стойности, ако числото е по-малко от средното. Въпреки това, в статистиката често е важно да можете да оперирате с едно число, което характеризира „точността“ на всички числови елементи на масив от данни. Всяко сумиране на всички отклонения на членовете на масива ще доведе до нула, тъй като положителните и отрицателните отклонения ще се компенсират взаимно. За да се избегне нулирането, за характеризиране на разсейването се използват квадратните разлики или по-точно средноаритметичното на квадратните отклонения. Тази характеристика на разсейване се нарича дисперсия на извадката.

Колкото по-голяма е дисперсията, толкова по-голямо е разсейването на стойностите на случайната променлива. За изчисляване на дисперсията се използва приблизителна стойност на средната стойност на извадката x с марж от една цифра по отношение на всички членове на масива от данни. В противен случай при сумиране на голям брой приблизителни стойности ще се натрупа значителна грешка. Във връзка с размерността на числените стойности трябва да се отбележи един недостатък на такъв индикатор за дисперсия като дисперсия на пробата: единицата за измерване на дисперсията г е квадратът на единицата за измерване на стойностите X, чиято характеристика е дисперсията. За да се отърве от този недостатък, статистиката въведе такава характеристика на разсейване като извадково стандартно отклонение , което се обозначава със символа А (да се чете „сигма“) и се изчислява по формулата

Обикновено повече от половината от членовете на масива от данни се различават от средното с по-малко от стандартното отклонение, т.е. принадлежат към сегмента [X - А; x + a]. В противен случай те казват: средната стойност, като се вземе предвид разпространението на данните, е равна на x ± a.

Въвеждането на друга характеристика на разсейване е свързано с размерността на членовете на масива от данни. Всички числени характеристики в статистиката се въвеждат с цел сравняване на резултатите от изследване на различни числови масиви, характеризиращи различни случайни величини. Въпреки това, сравняването на стандартни отклонения от различни средни стойности на различни набори от данни не е показателно, особено ако размерите на тези величини също са различни. Например, ако се сравняват дължината и теглото на всякакви предмети или разпръскването при производството на микро- и макропродукти. Във връзка с горните разсъждения се въвежда относителна характеристика на разсейване, която се нарича коефициент на вариацияи се изчислява по формулата

За изчисляване на числените характеристики на разсейването на стойностите на случайни променливи е удобно да се използва таблица (Таблица 6.9).

Таблица 6.9

Изчисляване на числови характеристики на разсейването на стойности на случайни променливи

Xj- X

(Xj-X)2/

Средната стойност на извадката е в процес на попълване на тази таблица. X,който ще се използва в две форми в бъдеще. Като последна средна характеристика (например в третата колона на таблицата) средната проба Xтрябва да се закръгли до цифрата, съответстваща на най-малката цифра от който и да е член на числовия масив от данни x gТози показател обаче се използва в таблицата за по-нататъшни изчисления и в тази ситуация, а именно при изчисляване в четвъртата колона на таблицата, средната стойност на извадката Xтрябва да се закръгли с разлика от една цифра спрямо най-малката цифра на който и да е член на числовия масив от данни X ( .

Резултатът от изчисленията с помощта на таблица като таблица. 6.9 ще получи стойността на дисперсията на извадката и за записване на отговора е необходимо въз основа на стойността на дисперсията на извадката да се изчисли стойността на стандартното отклонение a.

Отговорът показва: а) средния резултат, като се вземе предвид разпространението на данните във формуляра x±o; б) характеристика на стабилност на данните V.Отговорът трябва да оцени качеството на коефициента на вариация: добро или лошо.

Приемливият коефициент на вариация като индикатор за хомогенност или стабилност на резултатите в спортните изследвания се счита за 10-15%. Коефициент на вариация V= 20% във всяко изследване се смята за много голяма цифра. Ако размерът на извадката п> 25 тогава V> 32% е много лош показател.

Например, за дискретна вариационна серия 1; 5; 4; 4; 5; 3; 3; 1; 1; 1; 1; 1; 1; 3; 3; 5; 3; 5; 4; 4; 3; 3; 3; 3; 3 маси 6.9 се попълва, както следва (Таблица 6.10).

Таблица 6.10

Пример за изчисляване на числените характеристики на разсейването на стойностите

*1

фи

1

Л п 25 = 2,92 = 2,9

D_S_47.6_ п 25

отговор: а) средната характеристика, като се вземе предвид разпространението на данните, е равна на X± a = = 3 ± 1,4; б) стабилността на получените измервания е на ниско ниво, тъй като коефициентът на вариация V = 48% > 32%.

Аналог на масата 6.9 може също да се използва за изчисляване на характеристиките на разсейване на серия от интервални вариации. В същото време опциите x gще бъдат заменени от представители на пропуските xvи опция за абсолютни честоти е (-до абсолютни честоти на интервали fv

Въз основа на горното може да се направи следното: заключения.

Заключенията на математическата статистика са правдоподобни, ако се обработва информация за масови явления.

Обикновено се изследва извадка от генералната съвкупност от обекти, която трябва да е представителна.

Експерименталните данни, получени в резултат на изследване на всяко свойство на примерни обекти, представляват стойността на случайна променлива, тъй като изследователят не може да предвиди предварително кое число ще съответства на конкретен обект.

За да изберете един или друг алгоритъм за описание и първоначална обработка на експериментални данни, е важно да можете да определите вида на случайната променлива: дискретна, непрекъсната или смесена.

Дискретните случайни променливи се описват с дискретна вариационна серия и нейната графична форма - честотен полигон.

Смесените и непрекъснати случайни променливи се описват с интервална вариационна серия и нейната графична форма - хистограма.

При сравняване на няколко извадки според генерираното ниво на дадено свойство се използват средните числени характеристики и числените характеристики на разсейването на случайна променлива спрямо средната.

При изчисляване на средната характеристика е важно правилно да изберете вида на средната характеристика, която е подходяща за нейната област на приложение. Структурните средни стойности, режим и медиана, характеризират структурата на местоположението на варианта в подреден масив от експериментални данни. Количествената средна стойност дава възможност да се прецени средният размер на опцията (извадкова средна стойност).

За изчисляване на числените характеристики на разсейването - извадкова дисперсия, стандартно отклонение и коефициент на вариация - е ефективен табличният метод.

Математическа статистика е дял от математиката, който изучава приблизителни методи за намиране на закони на разпределение и числени характеристики въз основа на експериментални резултати.

Население – това е множеството от всички възможни стойности на наблюдения (обекти), хомогенни по отношение на някакъв атрибут, които могат да бъдат направени.

пробатова е колекция от произволно избрани наблюдения (обекти) за директно изследване от общата популация.

Статистическо разпределение е набор от варианти x i и съответните им честоти n i.

Честотна хистограмае стъпаловидна фигура, състояща се от съседни правоъгълници, построени на една и съща права линия, чиито основи са еднакви и равни на ширината на класа, а височината е равна или на честотата на попадане в интервала n i, или на относителната честота n i / н. Може да се определи ширината на интервала i по формулата на Sturges:

I=(x max -x min)/(1+3,32lgn),

Където x max – максимум; x min е минималната стойност на опцията и тяхната разлика се извиква диапазон на вариация; n – размер на извадката.

Честотен полигон – начупена линия, чиито отсечки свързват точки с координати x i, n i.

5. Характеристики на позицията (мода, медиана, средна стойност на извадката) и дисперсия (дисперсия на извадката и стандартно отклонение на извадката).

Мода (М О ) Това са варианти на такова значение, че предходните и следващите значения имат по-ниска честота на срещане.

За унимодалните разпределения режимът е най-често срещаният вариант в дадена популация.

За да определите режима на интервалните серии, използвайте формулата:

М 0 =x отдолу +i*((n 2 1 )/(2n 2 1 +n 3 )),

където x по-ниско е долната граница на модалния клас, т.е. клас с най-висока честота на поява n 2; n 2 – честота на модалния клас; n 1 – честота на класа, предхождащ модалния; n 3 – честота на класа до модала; i е ширината на класовия интервал.

Медиана (М д )- това е стойността на атрибута. По отношение на което серията за разпределение е разделена на 2 равни по обем части.

Примерна средна стойност – това е средноаритметичната стойност на вариант на статистическия ред

Дисперсия на извадката– средно аритметично на квадратните отклонения от тяхната средна стойност:

Стандартно отклонениее корен квадратен от дисперсията на извадката:

С V =√(С V 2 )

6. Оценка на параметрите на генералната съвкупност въз основа на нейната извадка (точка и интервал). Доверителен интервал и доверителна вероятност.

Наричат ​​се числени стойности, характеризиращи съвкупността параметри.

Статистическата оценка може да се извърши по два начина:

1)точкова оценка– оценка, която се дава за определена точка;

2)интервална оценка– въз основа на извадковите данни се оценява интервалът, в който се намира истинската стойност с дадена вероятност.

Точкова оценкае резултат, който се определя от едно число. И този брой се определя чрез вземане на проби.

Точковата оценка се нарича заможен, ако с увеличаване на размера на извадката характеристиката на извадката клони към съответната характеристика на генералната съвкупност.

Точковата оценка се нарича ефективен, ако има най-малката вариация на разпределението на извадката в сравнение с други подобни оценки.

Точковата оценка се нарича безпристрастен, ако неговото математическо очакване е равно на параметъра за оценка за всеки размер на извадката.

Безпристрастна оценка на общата средна стойност(математическо очакване) е средната стойност на извадката в:

V = аз п аз ,

където x i – опции за вземане на проби; n i – честота на поява на вариант x i; n – размер на извадката.

Интервална оценкае числов интервал, който се определя от две числа - границите на интервала, съдържащ неизвестен параметър от генералната съвкупност.

Доверителен интервал– това е интервал, в който с една или друга предварително зададена вероятност се намира неизвестен параметър от съвкупността.

Вероятност за довериестртова е такава вероятност, че събитието с вероятност (1-p) може да се счита за невъзможно. α=1-р е нивото на значимост. Обикновено вероятности, близки до 1, се използват като доверителни вероятности, тогава събитието, че интервалът покрива характеристиката, ще бъде практически надеждно. Това са p≥0.95, p≥0.99, p≥0.999.

За малък размер на извадката (n<30) нормально распределенного количественного признака х доверительный интервал может иметь вид:

V - мt≤≤ V + мt (р≥0,95),

къде е общата авария; c – извадково средно; t е нормализираният показател на разпределението на Стюдънт с (n-1) степени на свобода, който се определя от вероятността общият параметър да попадне в даден интервал; m е грешката на средната стойност на извадката.

"