На каква наука се основава математическата статистика? Съвременна идея за математическа статистика

Математическа статистикае съвременен клон на математическата наука, който се занимава със статистическо описание на резултатите от експерименти и наблюдения, както и строителство математически моделисъдържащи понятия вероятности.Теоретичната основа на математическата статистика е теория на вероятностите.

В структурата на математическата статистика традиционно има два основни раздела: Описателна статистикаи статистически изводи (Фигура 1.1).

Ориз. 1.1. Основни клонове на математическата статистика

Описателна статистикасе използва за:

o обобщаване на показателите на една променлива (статистика на произволна извадка);

o идентифициране на връзки между две или повече променливи (корелационен и регресионен анализ).

Описателната статистика дава възможност за получаване на нова информация, бързо разбиране и изчерпателна оценка, т.е. научна функцияописания на обекти на изследване, което оправдава името му. Методите на описателната статистика са предназначени да трансформират набор от индивидуални емпирични данни в система от форми и числа, които са визуални за възприемане: честотни разпределения; индикатори за тенденции, променливост, връзки. Тези методи изчисляват произволна извадкова статистика, която служи като основа за правене на статистически заключения.

Статистически изводидават възможност:

o оценяване на точността, надеждността и ефективността на извадкова статистика, намиране на грешки, които възникват в процеса статистически изследвания(статистическа оценка)

o обобщете параметрите на генералната съвкупност, получени на базата на извадкова статистика (тестване на статистически хипотези).

основната цел научно изследване- това е придобиването на нови знания за голям клас от явления, лица или събития, които обикновено се наричат ​​генерална съвкупност.

Население - това е пълен набор от изследователски обекти, проба- негова част, която е оформена по определен научно обоснован начин 2.

Терминът "генерална съвкупност" се използва, когато говорим за голямо, но ограничено множество от изследвани обекти. Например за общия брой на кандидатите в Украйна през 2009 г. или за общия брой на децата предучилищна възрастград Ровно. Генералните популации могат да достигнат значителни обеми, да бъдат крайни и безкрайни. На практика, като правило, имаме работа с крайни колекции. И ако съотношението на размера на популацията към размера на извадката е повече от 100, тогава, според Глас и Стенли, методите за оценка за крайни и безкрайни популации дават по същество едни и същи резултати. Генералната съвкупност може също да се нарече пълен набор от стойности на някакъв атрибут. Членството на извадката в популацията е основната основа за оценка на характеристиките на популацията въз основа на характеристиките на извадката.

Основен идеяматематическата статистика се основава на убеждението, че пълното изследване на всички обекти в общата съвкупност в повечето научни проблеми е или практически невъзможно, или икономически непрактично, тъй като изисква много време и значителни материални разходи. Следователно в математическата статистика се използва селективен подходчийто принцип е показан на диаграмата на фиг. 1.2.

Например, според технологията на формиране, пробите се разграничават: произволни (прости и систематични), стратифицирани, групирани (виж Раздел 4).

Ориз. 1.2. Схема на приложение на методите на математическата статистика Според селективен подходИзползването на математически и статистически методи може да се извърши в следната последователност (виж фиг. 1.2):

o с общо население,свойствата на които подлежат на изследване, определени методи за вземане на проби- типичен, но ограничен брой обекти, към които се прилагат методи на изследване;

o в резултат на методи на наблюдение, експериментални действия и измервания върху образци на обекти се получават емпирични данни;

o обработката на емпирични данни с помощта на методи на дескриптивна статистика дава примерни показатели, които се наричат ​​статистици - точно както е името на дисциплината, между другото;

o прилагане на методи за статистически изводи към статистик,вземете параметри, които характеризират свойствата общо население.

Пример 1.1.За да се оцени стабилността на нивото на знания (променлива Х)беше тествана рандомизирана извадка от 3 студенти н.Тестовете съдържаха m задачи, всяка от които се оценяваше по точкова система: „изпълнено” - 1, „неизпълнено” - 0. Средните текущи постижения на учениците останаха Х

3 произволна проба(от англ. Random - произволен) е представителна извадка, която се формира по стратегия за случайно тестване.

на нивото от предходни години / ч? Последователност на решението:

o откриете смислена хипотеза като: „ако текущи резултатитестовете няма да се различават от предишните, тогава нивото на знанията на учениците може да се счита за непроменено и учебен процес- стабилен";

o формулиране на адекватна статистическа хипотеза, например нулева хипотеза H 0че „текущият GPA на X не е статистически различен от средния/ч за предходните години“, т.е. H 0: X = /r, срещу съответната алтернативна хипотеза X Ф^;

o изгражданеемпирични разпределения на изследваната променлива X;

o определи(ако е необходимо) корелации, например между променлива хи други показатели, изград регресионни линии;

o проверка на съответствието на емпиричното разпределение с нормалния закон;

o оценява стойността на точковите индикатори и доверителния интервал на параметрите, например средната стойност;

o дефиниране на критерий за проверка на статистиката хипотези;

o извършва статистическа проверка на хипотези въз основа на избрани критерии;

o формулиране на решение относно статистическата нулева хипотеза при определено ниво на значимост;

o преминете от решението да приемете или отхвърлите статистическата нулева хипотеза към тълкуването на заключенията по отношение на съществената хипотеза;

o формулирайте смислени заключения.

И така, ако обобщим горните процедури, прилагането на статистически методи се състои от три основни блока:

Преходът от обект на реалността към абстрактна математико-статистическа схема, т.е. изграждането на вероятностен модел на явление, процес, свойство;

Извършване на изчислителни действия с помощта на реални математически средства в рамките на вероятностен модел въз основа на резултатите от измервания, наблюдения, експерименти и формулиране на статистически заключения;

Интерпретиране на статистически изводи за реалната ситуация и вземане на подходящи решения.

Статистическите методи за обработка и интерпретация на данни се основават на теорията на вероятностите. Теорията на вероятностите е в основата на методите на математическата статистика. Без употреба фундаментални понятияи законите на теорията на вероятностите е невъзможно да се обобщят заключенията на математическата статистика и следователно да се оправдае използването им за научни и практически цели.

По този начин задачата на описателната статистика е да трансформира набор от извадкови данни в система от индикатори - статистика - честотни разпределения, мерки за централна тенденция и променливост, коефициенти на връзка и други подобни. Статистиката обаче по същество е характеристика на конкретна извадка. Разбира се, възможно е да се изчислят извадкови разпределения, извадкови средни стойности, дисперсии и т.н., но такъв „анализ на данни“ има ограничена научна и образователна стойност. „Механичното“ прехвърляне на каквито и да било заключения, направени въз основа на такива показатели, към други популации не е правилно.

За да може да се прехвърлят примерни показатели или други, или към по-често срещани популации, е необходимо да има математически обосновка провизииотносно съответствието и способността на характеристиките на извадката с характеристиките на тези общи, така наречени генерални съвкупности. Такива разпоредби се основават на теоретични подходии схеми, свързани с вероятностни модели на реалността, например, на аксиоматичния подход, в закона големи числаи т.н. Само с тяхна помощ е възможно да се прехвърлят свойства, установени от анализа на ограничена емпирична информация, към други или към общи популации. По този начин конструкцията, законите на действие и използването на вероятностни модели са предмет на математическа област, наречена „теория на вероятностите“ и се превръщат в същността на статистическите методи.

По този начин в математическата статистика се използват две паралелни линии от индикатори: първата линия, която е от значение за практиката (това са примерни показатели), и втората, основана на теория (това са показатели на вероятностния модел). Например, емпиричните честоти, които се определят върху извадка, съответстват на понятията за теоретична вероятност; проба средна (практика) съответства очаквана стойност(теория) и др. Освен това в проучванията характеристиките на извадката като правило са първични. Те се изчисляват на базата на наблюдения, измервания, експерименти, след което се подлагат на статистическа оценка на възможностите и ефективността, проверка на статистически хипотези в съответствие с целите на изследването и в крайна сметка се приемат с известна вероятност за показатели за свойствата на изследваните популации.

Въпрос. Задача.

1. Опишете основните раздели на математическата статистика.

2. Каква е основната идея на математическата статистика?

3. Опишете връзката между генералната съвкупност и извадката.

4. Обяснете схемата за прилагане на методите на математическата статистика.

5. Дайте списък на основните задачи на математическата статистика.

6. Кои са основните блокове на приложението на статистическите методи? Опишете ги.

7. Разширете връзката между математическата статистика и теорията на вероятностите.

Всяко изследване в областта на случайните явления винаги има своите корени в експеримента, в експерименталните данни. Извикват се числени данни, които се събират при изучаване на всеки атрибут на някакъв обект статистически. Статистическите данни са изходният материал на изследването. За да имат научна или практическа стойност, те трябва да бъдат обработени с помощта на методите на математическата статистика.

Математическа статистикае научна дисциплина, предмет на която е разработването на методи за записване, описание и анализ на статистически експериментални данни, получени в резултат на наблюдения на масови случайни явления.

Основните задачи на математическата статистика са:

    определение на закона за разпределение случайна величинаили системи от случайни променливи;

    проверка на правдоподобността на хипотези;

    определяне на неизвестни параметри на разпределение.

Всички методи на математическата статистика се основават на теорията на вероятностите. Въпреки това, поради спецификата на решаваните проблеми, математическата статистика се отделя от теорията на вероятностите в самостоятелна област. Ако в теорията на вероятностите модел на явление се счита за даден и се изчислява възможният реален ход на това явление (фиг. 1), то в математическата статистика се избира подходящ теоретичен вероятностен модел въз основа на статистически данни (фиг. 2).

Фиг. 1. Общ проблем на теорията на вероятностите

Фиг.2. Общ проблем на математическата статистика

Като научна дисциплина математическата статистика се развива заедно с теорията на вероятностите. Математическият апарат на тази наука е изграден през втората половина на 19 век.

2. Генерална съвкупност и извадка.

За изучаване на статистически методи се въвеждат понятията генерални и извадкови съвкупности. Като цяло под общо населениесе разбира като случайна променлива X с функция на разпределение
. Извадкова популация или размер на извадката n за дадена случайна променлива X е набор
независими наблюдения на това количество, където се нарича примерна стойност или реализация на случайна променлива X. По този начин, могат да се разглеждат като числа (ако експериментът е проведен и пробата е взета) и като случайни променливи (преди провеждането на експеримента), тъй като те се променят от проба на проба.

Пример 1. За да се определи връзката между дебелината на ствола на дървото и неговата височина, бяха избрани 200 дървета. IN в такъв случайразмер на извадката n=200.

Пример 2.В резултат на рязане на плочи от дървесни частици на циркулярен трион бяха получени 15 стойности на специфична работа на рязане. В този случай n=15.

д
За да преценим уверено от извадковите данни за характеристиката на генералната съвкупност, която ни интересува, обектите на извадката трябва да я представят правилно, т.е. извадката трябва да бъде Представител(Представител). Представителността на извадката обикновено се постига чрез случаен подбор на обекти: всеки обект в генералната съвкупност има еднаква вероятност да бъде включен в извадката като всички останали.

Фиг.3. Доказване на представителност на извадката

Как се използват теорията на вероятностите и математическата статистика? Тези дисциплини са в основата на вероятностните и статистическите методи вземане на решение. За да използвате техния математически апарат, имате нужда от проблеми вземане на решениеизразени чрез вероятностно-статистически модели. Приложение на конкретен вероятностно-статистически метод вземане на решениесе състои от три етапа:

  • преход от икономическа, управленска, технологична реалност към абстрактна математико-статистическа схема, т.е. изграждане на вероятностен модел на система за управление, технологичен процес, процедури за вземане на решения, по-специално въз основа на резултатите от статистическия контрол и др.;
  • извършване на изчисления и получаване на заключения с помощта на чисто математически средства в рамките на вероятностен модел;
  • тълкуване на математически и статистически заключения във връзка с реална ситуация и вземане на подходящо решение (например относно съответствието или несъответствието на качеството на продукта с установените изисквания, необходимостта от коригиране на технологичния процес и т.н.), по-специално, заключения (за съотношението на дефектните единици продукт в партида, за конкретна форма на закони за разпределение контролирани параметритехнологичен процес и др.).

Математическата статистика използва концепциите, методите и резултатите от теорията на вероятностите. Нека разгледаме основните въпроси на конструирането на вероятностни модели вземане на решениев икономически, управленски, технологични и други ситуации. За активно и правилно използване на регулаторни, технически и инструктивни документи по вероятностни статистически методи вземане на решениенеобходими са предварителни познания. По този начин е необходимо да се знае при какви условия трябва да се използва определен документ, каква първоначална информация е необходима за неговия избор и прилагане, какви решения трябва да се вземат въз основа на резултатите от обработката на данни и др.

Примери за приложение на теорията на вероятностите и математическата статистика. Нека разгледаме няколко примера, при които вероятностно-статистическите модели са добър инструмент за решаване на управленски, производствени, икономически и национални икономически проблеми. Така например в романа на A.N. В „Ходене през мъките“ (том 1) на Толстой се казва: „цехът произвежда двадесет и три процента от дефектите, вие се придържайте към тази цифра“, каза Струков на Иван Илич.

Възниква въпросът как да разбираме тези думи в разговора на ръководителите на фабрики, тъй като една единица продукция не може да бъде 23% дефектна. Тя може да бъде както добра, така и дефектна. Вероятно Струков е имал предвид, че една голяма по обем партида съдържа приблизително 23% дефектни единици продукция. Тогава възниква въпросът какво означава „приблизително“? Ако от 100 проверени бройки продукция 30 се окажат дефектни, или от 1000-300, или от 100 000-30 000 и т.н., Струков ли трябва да бъде обвинен в лъжа?

Или друг пример. Монетата, използвана като лот, трябва да бъде „симетрична“, т.е. при хвърлянето му средно в половината от случаите трябва да изпадне герб, а в половината случаи - хеш (опашки, номер). Но какво означава „средно“? Ако провеждате много серии от 10 хвърляния във всяка серия, тогава често ще срещнете серии, в които монетата пада като герб 4 пъти. За симетрична монета това ще се случи в 20,5% от пусканията. И ако след 100 000 хвърляния има 40 000 герба, може ли монетата да се счита за симетрична? Процедура вземане на решениесе основава на теорията на вероятностите и математическата статистика.

Въпросният пример може да не изглежда достатъчно сериозен. Обаче не е така. Тегленето на жребий се използва широко при организиране на промишлени технически и икономически експерименти, например при обработка на резултатите от измерването на показателя за качество (момент на триене) на лагерите в зависимост от различни технологични фактори (влиянието на консервационната среда, методи за подготовка на лагерите преди измерване , влиянието на натоварването на лагера по време на процеса на измерване и др.). Да кажем, че е необходимо да се сравни качеството на лагерите в зависимост от резултатите от тяхното съхранение в различни консервационни масла, т.е. в масла от състав и. При планирането на подобен експеримент възниква въпросът кои лагери да се поставят в маслото на състава и кои – в маслото на състава, но така, че да се избегне субективизма и да се гарантира обективността на взетото решение.

Отговорът на този въпрос може да бъде получен чрез теглене на жребий. Подобен пример може да се даде с контрола на качеството на всеки продукт. За да се реши дали контролираната партида продукти отговаря на установените изисквания, се прави проба. Въз основа на резултатите от пробния контрол се прави заключение за цялата партида. В този случай е много важно да се избегне субективизма при формирането на извадка, т.е. необходимо е всяка единица продукт в контролираната партида да има еднаква вероятност да бъде избрана за извадката. В производствени условия изборът на продуктови единици за извадката обикновено се извършва не чрез партида, а чрез специални таблици със случайни числа или с помощта на компютърни сензори за произволни числа.

Подобни проблеми за осигуряване на обективност на сравнението възникват при сравняване на различни схеми организация на производството, възнаграждения, по време на търгове и конкурси, подбор на кандидати за вакантни позиции и др. Навсякъде имаме нужда от жребий или подобни процедури. Нека обясним с примера за идентифициране на най-силния и втория най-силен отбор при организиране на турнир според олимпийската система (губещият се елиминира). Нека по-силният отбор винаги побеждава по-слабия. Ясно е, че най-силният отбор със сигурност ще стане шампион. Вторият по сила отбор ще стигне до финала само ако няма мачове с бъдещия шампион преди финала. Ако се планира такава игра, вторият по сила отбор няма да стигне до финала. Този, който планира турнира, може или да „нокаутира“ втория най-силен отбор от турнира предсрочно, като го противопостави на лидера в първата среща, или да му осигури второ място, осигурявайки срещи с по-слаби отбори чак до финала. . За да се избегне субективизъм, се провежда жребий. За турнир с 8 отбора вероятността първите два отбора да се срещнат на финала е 4/7. Съответно, с вероятност от 3/7, вторият най-силен отбор ще напусне турнира рано.

Всяко измерване на продуктови единици (с дебеломер, микрометър, амперметър и т.н.) съдържа грешки. За да се установи дали има систематични грешки, е необходимо да се направят многократни измервания на единица продукт, чиито характеристики са известни (например стандартна проба). Трябва да се помни, че в допълнение към систематичната грешка има и случайна грешка.

Ето защо възниква въпросът как да разберем от резултатите от измерването дали има системна грешка. Ако отбележим само дали грешката, получена при следващото измерване, е положителна или отрицателна, тогава тази задача може да бъде намалена до предишната. Наистина, нека сравним измерване с хвърляне на монета, положителна грешка със загуба на герб и отрицателна грешка с мрежа (нулева грешка с достатъчен брой деления на скалата почти никога не се случва). Тогава проверката за липса на систематична грешка е еквивалентна на проверка на симетрията на монетата.

Целта на тези разсъждения е да се намали проблемът за проверка на липсата на систематична грешка до проблема за проверка на симетрията на монета. Горното разсъждение води до така наречения "критерий за знак" в математическата статистика.

При статистическото регулиране на технологичните процеси, въз основа на методите на математическата статистика, се разработват правила и планове за статистически контрол на процесите, насочени към своевременно откриване на проблеми в технологичните процеси, предприемане на мерки за коригирането им и предотвратяване на освобождаването на продукти, които не отговарят на изискванията. отговарят на установените изисквания. Тези мерки са насочени към намаляване на производствените разходи и загубите от доставката на нискокачествени единици. По време на статистическия приемен контрол, базиран на методите на математическата статистика, се разработват планове за контрол на качеството чрез анализиране на проби от продуктови партиди. Трудността се състои в възможността за правилно изграждане на вероятностни статистически модели вземане на решение, въз основа на които може да се отговори на горните въпроси. В математическата статистика за тази цел са разработени вероятностни модели и методи за проверка на хипотези, по-специално хипотези, че делът на дефектните единици продукция е равен на определено число, например (помнете думите на Струков от романа на А. Н. Толстой).

Цели на оценката. В редица управленски, производствени, икономически и народностопански ситуации възникват проблеми от различен тип - проблеми за оценка на характеристиките и параметрите на вероятностните разпределения.

Нека разгледаме един пример. Нека пристигне партида от N електрически лампи за проверка. Проба от n електрически лампи беше избрана на случаен принцип от тази партида. Възникват редица естествени въпроси. Как да се определи от резултатите от изпитването на примерни елементи среден сроксрок на експлоатация на електрически лампи и с каква точност може да се оцени тази характеристика? Как ще се промени точността, ако вземем по-голяма проба? При какъв брой часове може да се гарантира, че поне 90% от електрическите лампи ще издържат повече от часове?

Да приемем, че при тестване на пробен обем от електрически лампи, електрическите лампи се оказаха дефектни. Тогава възникват следните въпроси. Какви граници могат да се определят за броя на дефектните електрически лампи в една партида, за нивото на дефектност и др.?

Или при статистически анализ на точността и стабилността на технологичните процеси е необходимо да се оцени такава качествени показатели, като средна стойност контролиран параметъри степента на неговото разсейване в разглеждания процес. Според теорията на вероятностите е препоръчително да се използва нейното математическо очакване като средна стойност на случайна променлива и дисперсия, стандартно отклонение или коефициентът на вариация. Това повдига въпроса: как да се оценят тези статистически характеристики от извадкови данни и с каква точност може да се направи това? Могат да се дадат много подобни примери. Тук беше важно да се покаже как теорията на вероятностите и математическата статистика могат да се използват в управлението на производството при вземане на решения в областта на статистическото управление на качеството на продукта.

Какво е "математическа статистика"? Под математическа статистикаразбирайте „отрасъла на математиката, посветен на математически методисъбиране, систематизиране, обработка и интерпретация на статистически данни, както и използването им за научни или практически изводи. Правилата и процедурите на математическата статистика се основават на теорията на вероятностите, което дава възможност да се оцени точността и надеждността на изводите, получени във всеки проблем въз основа на наличния статистически материал" [[2.2], стр. 326]. В този случай , статистическите данни се отнасят до информация за броя на обектите във всяка повече или по-малко обширна колекция, притежаваща определени характеристики.

Въз основа на типа проблеми, които се решават, математическата статистика обикновено се разделя на три раздела: описание на данните, оценка и тестване на хипотези.

Въз основа на вида на обработваните статистически данни, математическата статистика е разделена на четири области:

  • едномерна статистика (статистика на случайни променливи), при която резултатът от наблюдение се описва с реално число;
  • многовариантен статистически анализ, при който резултатът от наблюдението на даден обект се описва с няколко числа (вектор);
  • статистика на случайни процеси и времеви редове, където резултатът от наблюдението е функция;
  • статистика на обекти с нечислово естество, в които резултатът от наблюдение е с нечислово естество, например, е набор ( геометрична фигура), по поръчка или получени в резултат на измерване по качествен критерий.

Исторически, някои области на статистиката на обекти с нечислов характер (по-специално проблеми с оценката на дела на дефектите и тестването на хипотези за това) и едномерната статистика бяха първите, които се появиха. За тях математическият апарат е по-опростен, така че техният пример обикновено се използва за демонстриране на основните идеи на математическата статистика.

Само тези методи за обработка на данни, т.е. математическата статистика е базирана на доказателства, които се основават на вероятностни модели на съответни реални явления и процеси. Това е заза модели на потребителско поведение, възникване на риск, функциониране технологично оборудване, получаване на резултатите от експеримента, хода на заболяването и др. Вероятностен модел истински феноментрябва да се считат за конструирани, ако разглежданите количества и връзките между тях са изразени от гледна точка на теорията на вероятностите. Съответствие с вероятностния модел на реалността, т.е. неговата адекватност е обоснована, по-специално, с помощта на статистически методи за проверка на хипотези.

Невероятностните методи за обработка на данни са проучвателни, те могат да се използват само при предварителен анализ на данни, тъй като не позволяват да се оцени точността и надеждността на заключенията, получени въз основа на ограничен статистически материал.

Вероятностни и статистически методиприложими навсякъде, където е възможно да се изгради и обоснове вероятностен модел на явление или процес. Използването им е задължително, когато изводите, направени от данните за извадката, се прехвърлят към цялата популация (например от извадка към цяла партида продукти).

В специфични области на приложение те се използват като вероятностни статистически методишироко приложение и специфични. Например, в раздела за управление на производството, посветен на статистическите методи за управление на качеството на продуктите, се използва приложна математическа статистика (включително проектиране на експерименти). С неговите методи се извършва Статистически анализточност и стабилност на технологичните процеси и статистическа оценка на качеството. Специфичните методи включват статистически приемателен контрол на качеството на продукта, статистическо регулиране на технологичните процеси, оценка и контрол на надеждността и др.

Приложните вероятностни и статистически дисциплини като теория на надеждността и теория на опашките са широко използвани. Съдържанието на първия от тях е ясно от името, вторият се занимава с изследване на системи като телефонна централа, която приема обаждания в произволни моменти - изискванията на абонатите, набиращи номера на своите телефонни апарати. Продължителността на обслужване на тези изисквания, т.е. продължителността на разговорите също се моделира чрез случайни променливи. Голям принос за развитието на тези дисциплини направи член-кореспондентът на Академията на науките на СССР А.Я. Хинчин (1894-1959), академик на Академията на науките на Украинската ССР Б.В. Гнеденко (1912-1995) и други местни учени.

Накратко за историята на математическата статистика. Математическата статистика като наука започва с трудовете на известния немски математик Карл Фридрих Гаус (1777-1855), който, базирайки се на теорията на вероятностите, изследва и обосновава метод на най-малките квадрати, създаден от него през 1795 г. и използван за обработка на астрономически данни (с цел изясняване на орбитата на малката планета Церера). Едно от най-популярните вероятностни разпределения, нормалното, често е кръстено на него, а в теорията на случайните процеси основният обект на изследване са процесите на Гаус.

IN края на XIX V. - началото на 20 век има голям принос в математическата статистика Английски изследователи, най-вече К. Пиърсън (1857-1936) и Р.А. Фишер (1890-1962). По-специално, Пиърсън разработи теста хи-квадрат за тестване на статистически хипотези, а Фишър - дисперсионен анализ, теория на експерименталния дизайн, метод на максимална вероятност за оценка на параметрите.

През 30-те години на ХХ век. Полякът Йежи Нойман (1894-1977) и англичанинът Е. Пиърсън развиват обща теориятестване на статистически хипотези, а съветските математици академик А.Н. Колмогоров (1903-1987) и член-кореспондент на Академията на науките на СССР Н.В. Смирнов (1900-1966) полага основите на непараметричната статистика. През четиридесетте години на ХХ век. Румънецът А. Валд (1902-1950) изгражда теорията на последователния статистически анализ.

В днешно време математическата статистика се развива бързо. Така през последните 40 години могат да се разграничат четири фундаментално нови области на изследване [[2.16]]:

  • разработване и внедряване на математически методи за планиране на експерименти;
  • развитие на статистиката на обекти с нечислов характер като самостоятелно направление в приложната математическа статистика;
  • разработване на статистически методи, които са устойчиви на малки отклонения от използвания вероятностен модел;
  • широко разпространено развитие на работата по създаването на компютърни програмни пакети, предназначени за статистически анализ на данни.

Вероятностно-статистически методи и оптимизация. Идеята за оптимизация прониква в съвременната приложна математическа статистика и др статистически методи. А именно методи за планиране на експерименти, статистически приемлив контрол, статистическо регулиране на технологичните процеси и др. От друга страна, формулировките за оптимизация в теорията вземане на решение, например приложната теория за оптимизиране на качеството на продукта и стандартните изисквания, осигуряват широкото използване на вероятностни статистически методи, предимно приложна математическа статистика.

В управлението на производството, по-специално, когато се оптимизира качеството на продукта и стандартните изисквания, е особено важно да се прилага статистически методиНа начална фазажизнен цикъл на продукта, т.е. на етапа на изследователска подготовка на експериментални дизайнерски разработки (разработване на обещаващи изисквания към продукта, предварителен дизайн, технически спецификации за разработване на експериментален дизайн). Това се дължи на ограничената налична информация в началния етап от жизнения цикъл на продукта и необходимостта от прогнозиране на техническите възможности и икономическата ситуация за в бъдеще. Статистически методитрябва да се използва на всички етапи от решаването на оптимизационен проблем - при мащабиране на променливи, разработване на математически модели на функциониране на продукти и системи, провеждане на технически и икономически експерименти и др.

При оптимизационни проблеми, включително оптимизиране на качеството на продукта и стандартните изисквания, се използват всички области на статистиката. А именно статистика на случайни променливи, многомерна Статистически анализ, статистика на случайни процеси и времеви редове, статистика на обекти с нечислов характер. Препоръчително е да изберете статистически метод за анализ на конкретни данни в съответствие с препоръките [

Математическата статистика се разбира като „клон на математиката, посветен на математическите методи за събиране, систематизиране, обработка и интерпретиране на статистически данни, както и използването им за научни или практически заключения. Правилата и процедурите на математическата статистика се основават на теорията на вероятностите, което ни позволява да оценим точността и надеждността на заключенията, получени във всеки проблем въз основа на наличния статистически материал. В този случай статистическите данни се отнасят до информация за броя на обектите във всяка повече или по-малко обширна колекция, която има определени характеристики.

Въз основа на типа проблеми, които се решават, математическата статистика обикновено се разделя на три раздела: описание на данните, оценка и тестване на хипотези.

Въз основа на вида на обработваните статистически данни, математическата статистика е разделена на четири области:

— едномерна статистика (статистика на случайни променливи), при която резултатът от наблюдение се описва с реално число;

— многовариантен статистически анализ, при който резултатът от наблюдението на даден обект се описва с няколко числа (вектор);

— статистика на случайни процеси и времеви редове, където резултатът от наблюдението е функция;

- статистика на обекти с нечислово естество, при което резултатът от наблюдение е от нечислово естество, например, това е набор (геометрична фигура), подреждане или получен в резултат на измерване въз основа на качествен критерий.

Исторически, някои области на статистиката на обекти с нечислов характер (по-специално проблеми с оценката на дела на дефектите и тестването на хипотези за това) и едномерната статистика бяха първите, които се появиха. За тях математическият апарат е по-опростен, така че техният пример обикновено се използва за демонстриране на основните идеи на математическата статистика.

Само тези методи за обработка на данни, т.е. математическата статистика е базирана на доказателства, които се основават на вероятностни модели на съответни реални явления и процеси. Става дума за модели на потребителско поведение, възникване на рискове, функциониране на технологичното оборудване, получаване на експериментални резултати, протичане на заболяване и др. Вероятностният модел на реално явление трябва да се счита за изграден, ако разглежданите величини и връзките между тях са изразени от гледна точка на теорията на вероятностите.

Съответствие с вероятностния модел на реалността, т.е. неговата адекватност е обоснована, по-специално, с помощта на статистически методи за проверка на хипотези.

Невероятностните методи за обработка на данни са проучвателни, те могат да се използват само при предварителен анализ на данни, тъй като не позволяват да се оцени точността и надеждността на заключенията, получени въз основа на ограничен статистически материал.

Вероятностните и статистическите методи са приложими навсякъде, където е възможно да се конструира и обоснове вероятностен модел на явление или процес. Използването им е задължително, когато изводите, направени от данните за извадката, се прехвърлят към цялата популация (например от извадка към цяла партида продукти).

В конкретни области на приложение се използват както вероятностни и статистически методи с общо приложение, така и специфични. Например, в раздела за управление на производството, посветен на статистическите методи за управление на качеството на продуктите, се използва приложна математическа статистика (включително проектиране на експерименти). С неговите методи се извършват статистически анализи на точността и стабилността на технологичните процеси и статистическа оценка на качеството. Специфичните методи включват методи за статистическо приемане на качеството на продукта, статистическо регулиране на технологичните процеси, оценка и контрол на надеждността и др.

Приложните вероятностни и статистически дисциплини като теория на надеждността и теория на опашките са широко използвани. Съдържанието на първия от тях е ясно от името, вторият се занимава с изследване на системи като телефонна централа, която приема обаждания в произволни моменти - изискванията на абонатите, набиращи номера на своите телефонни апарати. Продължителността на обслужване на тези изисквания, т.е. продължителността на разговорите също се моделира чрез случайни променливи. Голям принос за развитието на тези дисциплини направи член-кореспондентът на Академията на науките на СССР А.Я. Хинчин (1894-1959), академик на Академията на науките на Украинската ССР Б. В. Гнеденко (1912-1995) и други местни учени.


Съдържание.

1. Въведение:
- Как се използват теорията на вероятностите и математическата статистика? - страница 2
- Какво е "математическа статистика"? - страница 3
2) Примери за приложение на теорията на вероятностите и математическата статистика:
- Вземане на проби. - страница 4
- Задачи за оценка. – стр. 6
- Вероятностно-статистически методи и оптимизация. – страница 7
3) Заключение.

Въведение.

Как се използват теорията на вероятностите и математическата статистика? Тези дисциплини са в основата на вероятностните и статистически методи за вземане на решения. За да се използва техният математически апарат, е необходимо да се изразят проблемите за вземане на решения по отношение на вероятностно-статистически модели. Прилагането на конкретен вероятностно-статистически метод за вземане на решение се състои от три етапа:
- преход от икономическа, управленска, технологична реалност към абстрактна математико-статистическа схема, т.е. изграждане на вероятностен модел на система за управление, технологичен процес, процедура за вземане на решения, по-специално въз основа на резултатите от статистически контрол и др.
- извършване на изчисления и получаване на заключения с помощта на чисто математически средства в рамките на вероятностен модел;
- тълкуване на математически и статистически заключения във връзка с реалната ситуация и вземане на подходящо решение (например относно съответствието или несъответствието на качеството на продукта с установените изисквания, необходимостта от коригиране на технологичния процес и т.н.), по-специално , заключения (за дела на дефектните единици продукт в партида, за специфичния тип закони на разпределение на контролираните параметри на технологичния процес и др.).

Математическата статистика използва концепциите, методите и резултатите от теорията на вероятностите. Нека разгледаме основните въпроси на конструирането на вероятностни модели за вземане на решения в икономически, управленски, технологични и други ситуации. За активното и правилно използване на нормативни, технически и инструктивни документи за вероятностни и статистически методи за вземане на решения са необходими предварителни познания. По този начин е необходимо да се знае при какви условия трябва да се използва определен документ, каква първоначална информация е необходима за неговия избор и прилагане, какви решения трябва да се вземат въз основа на резултатите от обработката на данни и др.

Какво е "математическа статистика"? Математическата статистика се разбира като „клон на математиката, посветен на математическите методи за събиране, систематизиране, обработка и интерпретиране на статистически данни, както и използването им за научни или практически заключения. Правилата и процедурите на математическата статистика се основават на теорията на вероятностите, което ни позволява да оценим точността и надеждността на заключенията, получени във всеки проблем въз основа на наличния статистически материал. В този случай статистическите данни се отнасят до информация за броя на обектите във всяка повече или по-малко обширна колекция, която има определени характеристики.

Въз основа на типа проблеми, които се решават, математическата статистика обикновено се разделя на три раздела: описание на данните, оценка и тестване на хипотези.

Въз основа на вида на обработваните статистически данни, математическата статистика е разделена на четири области:

Едномерна статистика (статистика на случайни променливи), при която резултатът от наблюдение се описва с реално число;

Многовариантен статистически анализ, при който резултатът от наблюдението на даден обект се описва с няколко числа (вектор);

Статистика на случайни процеси и времеви редове, където резултатът от наблюдението е функция;

Статистика на обекти от нечислово естество, при което резултатът от наблюдение е от нечислово естество, например, това е набор (геометрична фигура), подреждане или получен в резултат на измерване, базирано на по качествен критерий.

Примери за приложение на теорията на вероятностите и математическата статистика.
Нека разгледаме няколко примера, при които вероятностните статистически модели са добър инструмент за решаване на управленски, производствени, икономически и национални икономически проблеми. Така например монета, която се използва като лот, трябва да бъде „симетрична“, т.е. при хвърлянето му средно в половината от случаите трябва да се появи герб, а в половината от случаите - хеш (опашки, номер). Но какво означава „средно“? Ако провеждате много серии от 10 хвърляния във всяка серия, тогава често ще срещнете серии, в които монетата пада като герб 4 пъти. За симетрична монета това ще се случи в 20,5% от пусканията. И ако след 100 000 хвърляния има 40 000 герба, може ли монетата да се счита за симетрична? Процедурата за вземане на решение се основава на теорията на вероятностите и математическата статистика.

Въпросният пример може да не изглежда достатъчно сериозен. Обаче не е така. Тегленето на жребий се използва широко при организиране на промишлени технически и икономически експерименти, например при обработка на резултатите от измерването на показателя за качество (момент на триене) на лагерите в зависимост от различни технологични фактори (влиянието на консервационната среда, методи за подготовка на лагерите преди измерване , влиянието на натоварването на лагера по време на процеса на измерване и др.). Да кажем, че е необходимо да се сравни качеството на лагерите в зависимост от резултатите от тяхното съхранение в различни консервационни масла, т.е. в масла от състав А и Б. При планирането на такъв експеримент възниква въпросът кои лагери трябва да бъдат поставени в масло от състав А и кои трябва да бъдат поставени в масло от състав В, но по такъв начин, че да се избегне субективизъм и гарантира обективността на взетото решение.

проба
Отговорът на този въпрос може да бъде получен чрез теглене на жребий. Подобен пример може да се даде с контрола на качеството на всеки продукт. За да се реши дали контролираната партида от продукти отговаря или не отговаря на установените изисквания, от нея се избира проба. Въз основа на резултатите от пробния контрол се прави заключение за цялата партида. В този случай е много важно да се избегне субективизъм при формирането на проба, тоест е необходимо всяка единица продукт в контролираната партида да има еднаква вероятност да бъде избрана за пробата. В производствени условия изборът на продуктови единици за извадката обикновено се извършва не чрез партида, а чрез специални таблици със случайни числа или с помощта на компютърни сензори за произволни числа.
Подобни проблеми за осигуряване на обективност на сравнението възникват при сравняване на различни схеми за организация на производството, възнаграждения, по време на търгове и конкурси, избор на кандидати за свободни позиции и др. Навсякъде имаме нужда от жребий или подобни процедури. Нека обясним с примера за идентифициране на най-силния и втория най-силен отбор при организиране на турнир по олимпийската система (губещият се елиминира). Нека по-силният отбор винаги побеждава по-слабия. Ясно е, че най-силният отбор със сигурност ще стане шампион. Вторият по сила отбор ще стигне до финала само ако няма мачове с бъдещия шампион преди финала. Ако се планира такава игра, вторият по сила отбор няма да стигне до финала. Този, който планира турнира, може или да „нокаутира“ втория по сила отбор от турнира предсрочно, като го противопостави на лидера в първата среща, или да му осигури второ място, като осигури срещи с по-слаби отбори чак до финал. За да се избегне субективизъм, се провежда жребий. За турнир с 8 отбора вероятността първите два отбора да се срещнат на финала е 4/7. Съответно, с вероятност от 3/7, вторият най-силен отбор ще напусне турнира рано.
Всяко измерване на продуктови единици (с дебеломер, микрометър, амперметър и т.н.) съдържа грешки. За да се установи дали има систематични грешки, е необходимо да се направят многократни измервания на единица продукт, чиито характеристики са известни (например стандартна проба). Трябва да се помни, че в допълнение към систематичната грешка има и случайна грешка.

Ето защо възниква въпросът как да разберем от резултатите от измерването дали има системна грешка. Ако отбележим само дали грешката, получена при следващото измерване, е положителна или отрицателна, тогава тази задача може да бъде намалена до предишната. Наистина, нека сравним измерване с хвърляне на монета, положителна грешка със загуба на герб, отрицателна грешка с мрежа (нулева грешка с достатъчен брой деления на скалата почти никога не се случва). Тогава проверката за липса на систематична грешка е еквивалентна на проверка на симетрията на монетата.

Целта на тези разсъждения е да се намали проблемът за проверка на липсата на систематична грешка до проблема за проверка на симетрията на монета. Горното разсъждение води до така наречения "критерий за знак" в математическата статистика.
„Тест за знак“ е статистически критерий, който ви позволява да тествате нулевата хипотеза, че извадката се подчинява на биномно разпределение с параметър p=1/2. Тестът за знаци може да се използва като непараметричен статистически тест за тестване на хипотезата, че медианата е равна на дадена стойност (по-специално нула) и че няма отклонение (липса на ефект от лечението) в две свързани проби. Той също така ви позволява да тествате хипотезата за симетрия на разпределението, но има по-мощни критерии за това - тестът на Wilcoxon с една проба и неговите модификации.

При статистическото регулиране на технологичните процеси, въз основа на методите на математическата статистика, се разработват правила и планове за статистически контрол на процесите, насочени към своевременно откриване на проблеми в технологичните процеси и предприемане на мерки за тяхното коригиране и предотвратяване на освобождаването на продукти, които не отговарят на изискванията. отговарят на установените изисквания. Тези мерки са насочени към намаляване на производствените разходи и загубите от доставката на нискокачествени единици. По време на статистическия приемен контрол, базиран на методите на математическата статистика, се разработват планове за контрол на качеството чрез анализиране на проби от продуктови партиди. Трудността се състои в възможността за правилно изграждане на вероятностно-статистически модели за вземане на решения, въз основа на които да се отговори на поставените по-горе въпроси. За тази цел в математическата статистика са разработени вероятностни модели и методи за тестване на хипотези, по-специално хипотези, че делът на дефектните единици продукция е равен на определено число p0, например p0 = 0,23.

Задачи за оценка.
В редица управленски, производствени, икономически и народностопански ситуации възникват проблеми от различен тип - проблеми за оценка на характеристиките и параметрите на вероятностните разпределения.

Нека разгледаме един пример. Нека пристигне партида от N електрически лампи за проверка. Проба от n електрически лампи беше избрана на случаен принцип от тази партида. Възникват редица естествени въпроси. Как да се определи средният експлоатационен живот на електрическите лампи въз основа на резултатите от изпитването на пробни елементи и с каква точност може да се оцени тази характеристика? Как ще се промени точността, ако вземем по-голяма проба? При какъв брой часове T може да се гарантира, че поне 90% от електрическите лампи ще издържат T или повече часа?

Да приемем, че при тестване на образец от n електрически лампи, X електрически лампи се оказаха дефектни. Тогава възникват следните въпроси. Какви ограничения могат да бъдат определени за броя D на дефектните електрически лампи в партида, за нивото на дефектност D/N и т.н.?

Или при статистически анализ на точността и стабилността на технологичните процеси е необходимо да се оценят такива показатели за качество като средната стойност на контролирания параметър и степента на неговото разсейване в разглеждания процес. Според теорията на вероятностите е препоръчително да се използва нейното математическо очакване като средна стойност на случайна променлива, а дисперсията, стандартното отклонение или коефициентът на вариация като статистическа характеристика на спреда. Това повдига въпроса: как да се оценят тези статистически характеристики от извадкови данни и с каква точност може да се направи това? Могат да се дадат много подобни примери. Тук беше важно да се покаже как теорията на вероятностите и математическата статистика могат да се използват в управлението на производството при вземане на решения в областта на статистическото управление на качеството на продукта.

Вероятностно-статистически методи и оптимизация. Идеята за оптимизация прониква в съвременната приложна математическа статистика и други статистически методи. А именно методи за планиране на експерименти, статистически приемлив контрол, статистическо регулиране на технологични процеси и др. От друга страна, оптимизационните формулировки в теорията за вземане на решения, например приложната теория за оптимизиране на качеството на продукта и стандартните изисквания, осигуряват широко използване на вероятностни статистически методи, предимно приложна математическа статистика.

В управлението на производството, по-специално, когато се оптимизира качеството на продукта и стандартните изисквания, е особено важно да се прилагат статистически методи в началния етап от жизнения цикъл на продукта, т.е. на етапа на изследователска подготовка на експериментални дизайнерски разработки (разработване на обещаващи изисквания към продукта, предварителен дизайн, технически спецификации за разработване на експериментален дизайн). Това се дължи на ограничената налична информация в началния етап от жизнения цикъл на продукта и необходимостта от прогнозиране на техническите възможности и икономическата ситуация за в бъдеще. Статистическите методи трябва да се използват на всички етапи от решаването на задача за оптимизация - при мащабиране на променливи, разработване на математически модели на функциониране на продукти и системи, провеждане на технически и икономически експерименти и др.

При оптимизационни проблеми, включително оптимизиране на качеството на продукта и стандартните изисквания, се използват всички области на статистиката. А именно статистика на случайни променливи, многомерен статистически анализ, статистика на случайни процеси и времеви редове, статистика на обекти с нечислов характер. Препоръчително е да изберете статистически метод за анализ на конкретни данни според препоръките.

Заключение.
IN
и т.н.................