Математическа статика. Учебник: Математическа статистика


Съдържание.

1. Въведение:
- Как се използват теорията на вероятностите и математическата статистика? - страница 2
- Какво е "математическа статистика"? - страница 3
2) Примери за приложение на теорията на вероятностите и математическата статистика:
- Вземане на проби. - страница 4
- Задачи за оценка. – стр. 6
- Вероятностно-статистически методи и оптимизация. – страница 7
3) Заключение.

Въведение.

Как се използват теорията на вероятностите и математическата статистика? Тези дисциплини са в основата на вероятностните и статистически методи за вземане на решения. За да се използва техният математически апарат, е необходимо да се изразят проблемите за вземане на решения по отношение на вероятностно-статистически модели. Прилагането на конкретен вероятностно-статистически метод за вземане на решение се състои от три етапа:
- преход от икономическа, управленска, технологична реалност към абстрактна математико-статистическа схема, т.е. изграждане на вероятностен модел на система за управление, технологичен процес, процедура за вземане на решения, по-специално въз основа на резултатите от статистически контрол и др.
- извършване на изчисления и получаване на заключения с помощта на чисто математически средства в рамките на вероятностен модел;
- тълкуване на математически и статистически заключения във връзка с реалната ситуация и вземане на подходящо решение (например относно съответствието или несъответствието на качеството на продукта с установените изисквания, необходимостта от коригиране на технологичния процес и т.н.), по-специално , заключения (за дела на дефектните единици продукт в партида, за специфичния тип закони на разпределение на контролираните параметри на технологичния процес и др.).

Математическата статистика използва концепциите, методите и резултатите от теорията на вероятностите. Нека разгледаме основните въпроси на конструирането на вероятностни модели за вземане на решения в икономически, управленски, технологични и други ситуации. За активното и правилно използване на нормативни, технически и инструктивни документи за вероятностни и статистически методи за вземане на решения са необходими предварителни познания. По този начин е необходимо да се знае при какви условия трябва да се използва определен документ, каква първоначална информация е необходима за неговия избор и прилагане, какви решения трябва да се вземат въз основа на резултатите от обработката на данни и др.

Какво е "математическа статистика"? Математическата статистика се разбира като „клон на математиката, посветен на математическите методи за събиране, систематизиране, обработка и интерпретиране на статистически данни, както и използването им за научни или практически заключения. Правилата и процедурите на математическата статистика се основават на теорията на вероятностите, което ни позволява да оценим точността и надеждността на заключенията, получени във всеки проблем въз основа на наличния статистически материал. В този случай статистическите данни се отнасят до информация за броя на обектите във всяка повече или по-малко обширна колекция, която има определени характеристики.

Въз основа на типа проблеми, които се решават, математическата статистика обикновено се разделя на три раздела: описание на данните, оценка и тестване на хипотези.

Въз основа на вида на обработваните статистически данни, математическата статистика е разделена на четири области:

Едномерна статистика (статистика на случайни променливи), при която резултатът от наблюдение се описва с реално число;

Многовариантен статистически анализ, при който резултатът от наблюдението на даден обект се описва с няколко числа (вектор);

Статистика на случайни процеси и времеви редове, където резултатът от наблюдението е функция;

Статистика на обекти от нечислово естество, при което резултатът от наблюдение е от нечислово естество, например, това е набор (геометрична фигура), подреждане или получен в резултат на измерване, базирано на по качествен критерий.

Примери за приложение на теорията на вероятностите и математическата статистика.
Нека разгледаме няколко примера, при които вероятностните статистически модели са добър инструмент за решаване на управленски, производствени, икономически и национални икономически проблеми. Така например монета, която се използва като лот, трябва да бъде „симетрична“, т.е. при хвърлянето му средно в половината от случаите трябва да се появи герб, а в половината от случаите - хеш (опашки, номер). Но какво означава „средно“? Ако провеждате много серии от 10 хвърляния във всяка серия, тогава често ще срещнете серии, в които монетата пада като герб 4 пъти. За симетрична монета това ще се случи в 20,5% от пусканията. И ако след 100 000 хвърляния има 40 000 герба, може ли монетата да се счита за симетрична? Процедурата за вземане на решение се основава на теорията на вероятностите и математическата статистика.

Въпросният пример може да не изглежда достатъчно сериозен. Обаче не е така. Тегленето на жребий се използва широко при организиране на промишлени технически и икономически експерименти, например при обработка на резултатите от измерването на показателя за качество (момент на триене) на лагерите в зависимост от различни технологични фактори (влиянието на консервационната среда, методи за подготовка на лагерите преди измерване , влиянието на натоварването на лагера по време на процеса на измерване и др.). Да кажем, че е необходимо да се сравни качеството на лагерите в зависимост от резултатите от тяхното съхранение в различни консервационни масла, т.е. в масла от състав А и Б. При планирането на такъв експеримент възниква въпросът кои лагери трябва да бъдат поставени в масло от състав А и кои трябва да бъдат поставени в масло от състав В, но по такъв начин, че да се избегне субективизъм и гарантира обективността на взетото решение.

проба
Отговорът на този въпрос може да бъде получен чрез теглене на жребий. Подобен пример може да се даде с контрола на качеството на всеки продукт. За да се реши дали контролираната партида от продукти отговаря или не отговаря на установените изисквания, от нея се избира проба. Въз основа на резултатите от пробния контрол се прави заключение за цялата партида. В този случай е много важно да се избегне субективизъм при формирането на проба, тоест е необходимо всяка единица продукт в контролираната партида да има еднаква вероятност да бъде избрана за пробата. В производствени условия изборът на продуктови единици за извадката обикновено се извършва не чрез партида, а чрез специални таблици със случайни числа или с помощта на компютърни сензори за произволни числа.
Подобни проблеми за осигуряване на обективност на сравнението възникват при сравняване на различни схеми за организация на производството, възнаграждения, по време на търгове и конкурси, избор на кандидати за свободни позиции и др. Навсякъде имаме нужда от жребий или подобни процедури. Нека обясним с примера за идентифициране на най-силния и втория най-силен отбор при организиране на турнир по олимпийската система (губещият се елиминира). Нека по-силният отбор винаги побеждава по-слабия. Ясно е, че най-силният отбор със сигурност ще стане шампион. Вторият по сила отбор ще стигне до финала само ако няма мачове с бъдещия шампион преди финала. Ако се планира такава игра, вторият по сила отбор няма да стигне до финала. Този, който планира турнира, може или да „нокаутира“ втория по сила отбор от турнира предсрочно, като го противопостави на лидера в първата среща, или да му осигури второ място, като осигури срещи с по-слаби отбори чак до финал. За да се избегне субективизъм, се провежда жребий. За турнир с 8 отбора вероятността първите два отбора да се срещнат на финала е 4/7. Съответно, с вероятност от 3/7, вторият най-силен отбор ще напусне турнира рано.
Всяко измерване на продуктови единици (с дебеломер, микрометър, амперметър и т.н.) съдържа грешки. За да се установи дали има систематични грешки, е необходимо да се направят многократни измервания на единица продукт, чиито характеристики са известни (например стандартна проба). Трябва да се помни, че в допълнение към систематичната грешка има и случайна грешка.

Ето защо възниква въпросът как да разберем от резултатите от измерването дали има системна грешка. Ако отбележим само дали грешката, получена при следващото измерване, е положителна или отрицателна, тогава тази задача може да бъде намалена до предишната. Наистина, нека сравним измерване с хвърляне на монета, положителна грешка със загуба на герб, отрицателна грешка с мрежа (нулева грешка с достатъчен брой деления на скалата почти никога не се случва). Тогава проверката за липса на систематична грешка е еквивалентна на проверка на симетрията на монетата.

Целта на тези разсъждения е да се намали проблемът за проверка на липсата на систематична грешка до проблема за проверка на симетрията на монета. Горното разсъждение води до така наречения "критерий за знак" в математическата статистика.
„Тест за знак“ е статистически критерий, който ви позволява да тествате нулевата хипотеза, че извадката се подчинява на биномно разпределение с параметър p=1/2. Тестът за знаци може да се използва като непараметричен статистически тест за тестване на хипотезата, че медианата е равна на дадена стойност (по-специално нула) и че няма отклонение (липса на ефект от лечението) в две свързани проби. Той също така ви позволява да тествате хипотезата за симетрия на разпределението, но има по-мощни критерии за това - тестът на Wilcoxon с една проба и неговите модификации.

При статистическото регулиране на технологичните процеси, въз основа на методите на математическата статистика, се разработват правила и планове за статистически контрол на процесите, насочени към своевременно откриване на проблеми в технологичните процеси и предприемане на мерки за тяхното коригиране и предотвратяване на освобождаването на продукти, които не отговарят на изискванията. отговарят на установените изисквания. Тези мерки са насочени към намаляване на производствените разходи и загубите от доставката на нискокачествени единици. По време на статистическия приемен контрол, базиран на методите на математическата статистика, се разработват планове за контрол на качеството чрез анализиране на проби от продуктови партиди. Трудността се състои в възможността за правилно изграждане на вероятностно-статистически модели за вземане на решения, въз основа на които да се отговори на поставените по-горе въпроси. За тази цел в математическата статистика са разработени вероятностни модели и методи за тестване на хипотези, по-специално хипотези, че делът на дефектните единици продукция е равен на определено число p0, например p0 = 0,23.

Задачи за оценка.
В редица управленски, производствени, икономически и народностопански ситуации възникват проблеми от различен тип - проблеми за оценка на характеристиките и параметрите на вероятностните разпределения.

Нека разгледаме един пример. Нека пристигне партида от N електрически лампи за проверка. Проба от n електрически лампи беше избрана на случаен принцип от тази партида. Възникват редица естествени въпроси. Как да се определи средният експлоатационен живот на електрическите лампи въз основа на резултатите от изпитването на пробни елементи и с каква точност може да се оцени тази характеристика? Как ще се промени точността, ако вземем по-голяма проба? При какъв брой часове T може да се гарантира, че поне 90% от електрическите лампи ще издържат T или повече часа?

Да приемем, че при тестване на образец от n електрически лампи, X електрически лампи се оказаха дефектни. Тогава възникват следните въпроси. Какви ограничения могат да бъдат определени за броя D на дефектните електрически лампи в партида, за нивото на дефектност D/N и т.н.?

Или при статистически анализ на точността и стабилността на технологичните процеси е необходимо да се оценят такива показатели за качество като средната стойност на контролирания параметър и степента на неговото разсейване в разглеждания процес. Според теорията на вероятностите е препоръчително да се използва нейното математическо очакване като средна стойност на случайна променлива, а дисперсията, стандартното отклонение или коефициентът на вариация като статистическа характеристика на спреда. Това повдига въпроса: как да се оценят тези статистически характеристики от извадкови данни и с каква точност може да се направи това? Могат да се дадат много подобни примери. Тук беше важно да се покаже как теорията на вероятностите и математическата статистика могат да се използват в управлението на производството при вземане на решения в областта на статистическото управление на качеството на продукта.

Вероятностно-статистически методи и оптимизация. Идеята за оптимизация прониква в съвременната приложна математическа статистика и други статистически методи. А именно методи за планиране на експерименти, статистически приемлив контрол, статистическо регулиране на технологични процеси и др. От друга страна, оптимизационните формулировки в теорията за вземане на решения, например приложната теория за оптимизиране на качеството на продукта и стандартните изисквания, осигуряват широко използване на вероятностни статистически методи, предимно приложна математическа статистика.

В управлението на производството, по-специално, когато се оптимизира качеството на продукта и стандартните изисквания, е особено важно да се прилагат статистически методи в началния етап от жизнения цикъл на продукта, т.е. на етапа на изследователска подготовка на експериментални дизайнерски разработки (разработване на обещаващи изисквания към продукта, предварителен дизайн, технически спецификации за разработване на експериментален дизайн). Това се дължи на ограничената налична информация в началния етап от жизнения цикъл на продукта и необходимостта от прогнозиране на техническите възможности и икономическата ситуация за в бъдеще. Статистическите методи трябва да се използват на всички етапи от решаването на задача за оптимизация - при мащабиране на променливи, разработване на математически модели на функциониране на продукти и системи, провеждане на технически и икономически експерименти и др.

При оптимизационни проблеми, включително оптимизиране на качеството на продукта и стандартните изисквания, се използват всички области на статистиката. А именно статистика на случайни променливи, многомерен статистически анализ, статистика на случайни процеси и времеви редове, статистика на обекти с нечислов характер. Препоръчително е да изберете статистически метод за анализ на конкретни данни според препоръките.

Заключение.
IN
и т.н.................

Как се използват теорията на вероятностите и математическата статистика? Тези дисциплини са в основата на вероятностните и статистическите методи вземане на решение. За да използвате техния математически апарат, имате нужда от проблеми вземане на решениеизразени чрез вероятностно-статистически модели. Приложение на конкретен вероятностно-статистически метод вземане на решениесе състои от три етапа:

  • преход от икономическа, управленска, технологична реалност към абстрактна математико-статистическа схема, т.е. изграждане на вероятностен модел на система за управление, технологичен процес, процедури за вземане на решения, по-специално въз основа на резултатите от статистическия контрол и др.;
  • извършване на изчисления и получаване на заключения с помощта на чисто математически средства в рамките на вероятностен модел;
  • тълкуване на математически и статистически заключения във връзка с реална ситуация и вземане на подходящо решение (например относно съответствието или несъответствието на качеството на продукта с установените изисквания, необходимостта от коригиране на технологичния процес и т.н.), по-специално, заключения (относно съотношението на дефектните единици продукт в партида, относно специфичната форма на законите за разпределение контролирани параметритехнологичен процес и др.).

Математическата статистика използва концепциите, методите и резултатите от теорията на вероятностите. Нека разгледаме основните въпроси на конструирането на вероятностни модели вземане на решениев икономически, управленски, технологични и други ситуации. За активно и правилно използване на нормативни, технически и инструктивни документи за вероятностни и статистически методи вземане на решениенеобходими са предварителни познания. По този начин е необходимо да се знае при какви условия трябва да се използва определен документ, каква първоначална информация е необходима за неговия избор и прилагане, какви решения трябва да се вземат въз основа на резултатите от обработката на данни и др.

Примери за приложение на теорията на вероятностите и математическата статистика. Нека разгледаме няколко примера, при които вероятностно-статистическите модели са добър инструмент за решаване на управленски, производствени, икономически и национални икономически проблеми. Така например в романа на A.N. В „Ходене през мъките“ (том 1) на Толстой се казва: „цехът произвежда двадесет и три процента от дефектите, вие се придържайте към тази цифра“, каза Струков на Иван Илич.

Възниква въпросът как да разбираме тези думи в разговора на ръководителите на фабрики, тъй като една единица продукция не може да бъде 23% дефектна. Тя може да бъде или добра, или дефектна. Вероятно Струков е имал предвид, че една голяма по обем партида съдържа приблизително 23% дефектни единици продукция. Тогава възниква въпросът какво означава „приблизително“? Ако от 100 проверени бройки продукция 30 се окажат дефектни, или от 1000-300, или от 100 000-30 000 и т.н., Струков ли трябва да бъде обвинен в лъжа?

Или друг пример. Монетата, използвана като лот, трябва да бъде „симетрична“, т.е. при хвърлянето му средно в половината от случаите трябва да изпадне герб, а в половината случаи - хеш (опашки, номер). Но какво означава „средно“? Ако провеждате много серии от 10 хвърляния във всяка серия, тогава често ще срещнете серии, в които монетата пада като герб 4 пъти. За симетрична монета това ще се случи в 20,5% от пусканията. И ако след 100 000 хвърляния има 40 000 герба, може ли монетата да се счита за симетрична? Процедура вземане на решениесе основава на теорията на вероятностите и математическата статистика.

Въпросният пример може да не изглежда достатъчно сериозен. Обаче не е така. Тегленето на жребий се използва широко при организиране на промишлени технически и икономически експерименти, например при обработка на резултатите от измерването на показателя за качество (момент на триене) на лагерите в зависимост от различни технологични фактори (влиянието на консервационната среда, методи за подготовка на лагерите преди измерване , влиянието на натоварването на лагера по време на процеса на измерване и др.). Да кажем, че е необходимо да се сравни качеството на лагерите в зависимост от резултатите от тяхното съхранение в различни консервационни масла, т.е. в масла от състав и. При планирането на подобен експеримент възниква въпросът кои лагери да се поставят в маслото на състава и кои – в маслото на състава, но така, че да се избегне субективизма и да се гарантира обективността на взетото решение.

Отговорът на този въпрос може да бъде получен чрез теглене на жребий. Подобен пример може да се даде с контрола на качеството на всеки продукт. За да се реши дали контролираната партида продукти отговаря на установените изисквания, се прави проба. Въз основа на резултатите от пробния контрол се прави заключение за цялата партида. В този случай е много важно да се избегне субективизма при формирането на извадка, т.е. необходимо е всяка единица продукт в контролираната партида да има еднаква вероятност да бъде избрана за извадката. В производствени условия изборът на продуктови единици за извадката обикновено се извършва не чрез партида, а чрез специални таблици със случайни числа или с помощта на компютърни сензори за произволни числа.

Подобни проблеми за осигуряване на обективност на сравнението възникват при сравняване на различни схеми организация на производството, възнаграждения, по време на търгове и конкурси, подбор на кандидати за вакантни позиции и др. Навсякъде имаме нужда от жребий или подобни процедури. Нека обясним с примера за идентифициране на най-силния и втория най-силен отбор при организиране на турнир според олимпийската система (губещият се елиминира). Нека по-силният отбор винаги побеждава по-слабия. Ясно е, че най-силният отбор със сигурност ще стане шампион. Вторият по сила отбор ще стигне до финала само ако няма мачове с бъдещия шампион преди финала. Ако се планира такава игра, вторият по сила отбор няма да стигне до финала. Този, който планира турнира, може или да „нокаутира“ втория най-силен отбор от турнира предсрочно, като го противопостави на лидера в първата среща, или да му осигури второ място, осигурявайки срещи с по-слаби отбори чак до финала. . За да се избегне субективизъм, се провежда жребий. За турнир с 8 отбора вероятността първите два отбора да се срещнат на финала е 4/7. Съответно, с вероятност от 3/7, вторият най-силен отбор ще напусне турнира рано.

Всяко измерване на продуктови единици (с дебеломер, микрометър, амперметър и т.н.) съдържа грешки. За да се установи дали има систематични грешки, е необходимо да се направят многократни измервания на единица продукт, чиито характеристики са известни (например стандартна проба). Трябва да се помни, че в допълнение към систематичната грешка има и случайна грешка.

Ето защо възниква въпросът как да разберем от резултатите от измерването дали има системна грешка. Ако отбележим само дали грешката, получена при следващото измерване, е положителна или отрицателна, тогава тази задача може да бъде намалена до предишната. Наистина, нека сравним измерване с хвърляне на монета, положителна грешка със загуба на герб и отрицателна грешка с мрежа (нулева грешка с достатъчен брой деления на скалата почти никога не се случва). Тогава проверката за липса на систематична грешка е еквивалентна на проверка на симетрията на монетата.

Целта на тези разсъждения е да се намали проблемът за проверка на липсата на систематична грешка до проблема за проверка на симетрията на монета. Горното разсъждение води до така наречения "критерий за знак" в математическата статистика.

При статистическото регулиране на технологичните процеси, въз основа на методите на математическата статистика, се разработват правила и планове за статистически контрол на процесите, насочени към своевременно откриване на проблеми в технологичните процеси, предприемане на мерки за коригирането им и предотвратяване на освобождаването на продукти, които не отговарят на изискванията. отговарят на установените изисквания. Тези мерки са насочени към намаляване на производствените разходи и загубите от доставката на нискокачествени единици. По време на статистическия приемен контрол, базиран на методите на математическата статистика, се разработват планове за контрол на качеството чрез анализиране на проби от продуктови партиди. Трудността се състои в възможността за правилно изграждане на вероятностни статистически модели вземане на решение, въз основа на които може да се отговори на горните въпроси. В математическата статистика за тази цел са разработени вероятностни модели и методи за проверка на хипотези, по-специално хипотези, че делът на дефектните единици продукция е равен на определено число, например (помнете думите на Струков от романа на А. Н. Толстой).

Цели на оценката. В редица управленски, производствени, икономически и народностопански ситуации възникват проблеми от различен тип - проблеми за оценка на характеристиките и параметрите на вероятностните разпределения.

Нека разгледаме един пример. Нека пристигне партида от N електрически лампи за проверка. Проба от n електрически лампи беше избрана на случаен принцип от тази партида. Възникват редица естествени въпроси. Как да се определи средният експлоатационен живот на електрическите лампи въз основа на резултатите от изпитването на пробни елементи и с каква точност може да се оцени тази характеристика? Как ще се промени точността, ако вземем по-голяма проба? При какъв брой часове може да се гарантира, че поне 90% от електрическите лампи ще издържат повече от часове?

Да приемем, че при тестване на пробен обем от електрически лампи, електрическите лампи се оказаха дефектни. Тогава възникват следните въпроси. Какви граници могат да се определят за броя на дефектните електрически лампи в една партида, за нивото на дефектност и др.?

Или при статистически анализ на точността и стабилността на технологичните процеси е необходимо да се оцени такава качествени показатели, като средна стойност контролиран параметъри степента на неговото разсейване в разглеждания процес. Според теорията на вероятностите е препоръчително да се използва нейното математическо очакване като средна стойност на случайна променлива и дисперсия, стандартно отклонение или коефициентът на вариация. Това повдига въпроса: как да се оценят тези статистически характеристики от извадкови данни и с каква точност може да се направи това? Могат да се дадат много подобни примери. Тук беше важно да се покаже как теорията на вероятностите и математическата статистика могат да се използват в управлението на производството при вземане на решения в областта на статистическото управление на качеството на продукта.

Какво е "математическа статистика"? Математическата статистика се разбира като "клон на математиката, посветен на математическите методи за събиране, систематизиране, обработка и тълкуване на статистически данни, както и използването им за научни или практически заключения. Правилата и процедурите на математическата статистика се основават на теорията на вероятностите, която ни позволява да оценим точността и надеждността на изводите, получени във всяка задача въз основа на наличния статистически материал" [[2.2], p. 326]. В този случай статистическите данни се отнасят до информация за броя на обектите във всяка повече или по-малко обширна колекция, която има определени характеристики.

Въз основа на типа проблеми, които се решават, математическата статистика обикновено се разделя на три раздела: описание на данните, оценка и тестване на хипотези.

Въз основа на вида на обработваните статистически данни, математическата статистика е разделена на четири области:

  • едномерна статистика (статистика на случайни променливи), при която резултатът от наблюдение се описва с реално число;
  • многовариантен статистически анализ, при който резултатът от наблюдението на даден обект се описва с няколко числа (вектор);
  • статистика на случайни процеси и времеви редове, където резултатът от наблюдението е функция;
  • статистика на обекти от нечислово естество, при което резултатът от наблюдение е от нечислово естество, например, това е набор (геометрична фигура), подреждане или получен в резултат на измерване, базирано на качествен критерий.

Исторически, някои области на статистиката на обекти с нечислов характер (по-специално проблеми с оценката на дела на дефектите и тестването на хипотези за това) и едномерната статистика бяха първите, които се появиха. За тях математическият апарат е по-опростен, така че техният пример обикновено се използва за демонстриране на основните идеи на математическата статистика.

Само тези методи за обработка на данни, т.е. математическата статистика е базирана на доказателства, които се основават на вероятностни модели на съответни реални явления и процеси. Става дума за модели на потребителско поведение, възникване на рискове, функциониране на технологичното оборудване, получаване на експериментални резултати, протичане на заболяване и др. Вероятностният модел на реално явление трябва да се счита за изграден, ако разглежданите величини и връзките между тях са изразени от гледна точка на теорията на вероятностите. Съответствие с вероятностния модел на реалността, т.е. неговата адекватност е обоснована, по-специално, с помощта на статистически методи за проверка на хипотези.

Невероятностните методи за обработка на данни са проучвателни, те могат да се използват само при предварителен анализ на данни, тъй като не позволяват да се оцени точността и надеждността на заключенията, получени въз основа на ограничен статистически материал.

Вероятностни и статистически методиприложими навсякъде, където е възможно да се изгради и обоснове вероятностен модел на явление или процес. Използването им е задължително, когато изводите, направени от данните за извадката, се прехвърлят към цялата популация (например от извадка към цяла партида продукти).

В специфични области на приложение те се използват като вероятностни статистически методишироко приложение и специфични. Например, в раздела за управление на производството, посветен на статистическите методи за управление на качеството на продуктите, се използва приложна математическа статистика (включително проектиране на експерименти). С неговите методи се извършва Статистически анализточност и стабилност на технологичните процеси и статистическа оценка на качеството. Специфичните методи включват статистически приемателен контрол на качеството на продукта, статистическо регулиране на технологичните процеси, оценка и контрол на надеждността и др.

Приложните вероятностни и статистически дисциплини като теория на надеждността и теория на опашките са широко използвани. Съдържанието на първия от тях е ясно от името, вторият се занимава с изследване на системи като телефонна централа, която приема обаждания в произволни моменти - изискванията на абонатите, набиращи номера на своите телефонни апарати. Продължителността на обслужване на тези изисквания, т.е. продължителността на разговорите също се моделира чрез случайни променливи. Голям принос за развитието на тези дисциплини направи член-кореспондентът на Академията на науките на СССР А.Я. Хинчин (1894-1959), академик на Академията на науките на Украинската ССР Б.В. Гнеденко (1912-1995) и други местни учени.

Накратко за историята на математическата статистика. Математическата статистика като наука започва с трудовете на известния немски математик Карл Фридрих Гаус (1777-1855), който, базирайки се на теорията на вероятностите, изследва и обосновава метод на най-малките квадрати, създаден от него през 1795 г. и използван за обработка на астрономически данни (с цел изясняване на орбитата на малката планета Церера). Едно от най-популярните вероятностни разпределения, нормалното, често е кръстено на него, а в теорията на случайните процеси основният обект на изследване са процесите на Гаус.

В края на 19в. - началото на 20 век Основен принос в математическата статистика са направени от английски изследователи, предимно К. Пиърсън (1857-1936) и Р.А. Фишер (1890-1962). По-специално, Пиърсън разработи теста хи-квадрат за тестване на статистически хипотези, а Фишър - дисперсионен анализ, теория на експерименталния дизайн, метод на максимална вероятност за оценка на параметрите.

През 30-те години на ХХ век. Полякът Йежи Нойман (1894-1977) и англичанинът Е. Пиърсън разработиха общата теория за проверка на статистически хипотези, а съветските математици академик А.Н. Колмогоров (1903-1987) и член-кореспондент на Академията на науките на СССР Н.В. Смирнов (1900-1966) полага основите на непараметричната статистика. През четиридесетте години на ХХ век. Румънецът А. Валд (1902-1950) изгражда теорията на последователния статистически анализ.

В днешно време математическата статистика се развива бързо. Така през последните 40 години могат да се разграничат четири фундаментално нови области на изследване [[2.16]]:

  • разработване и внедряване на математически методи за планиране на експерименти;
  • развитие на статистиката на обекти с нечислов характер като самостоятелно направление в приложната математическа статистика;
  • разработване на статистически методи, които са устойчиви на малки отклонения от използвания вероятностен модел;
  • широко разпространено развитие на работата по създаването на компютърни програмни пакети, предназначени за статистически анализ на данни.

Вероятностно-статистически методи и оптимизация. Идеята за оптимизация прониква в съвременната приложна математическа статистика и др статистически методи. А именно методи за планиране на експерименти, статистически приемлив контрол, статистическо регулиране на технологичните процеси и др. От друга страна, формулировките за оптимизация в теорията вземане на решение, например приложната теория за оптимизиране на качеството на продукта и стандартните изисквания, осигуряват широкото използване на вероятностни статистически методи, предимно приложна математическа статистика.

В управлението на производството, по-специално, когато се оптимизира качеството на продукта и стандартните изисквания, е особено важно да се прилага статистически методив началния етап от жизнения цикъл на продукта, т.е. на етапа на изследователска подготовка на експериментални дизайнерски разработки (разработване на обещаващи изисквания към продукта, предварителен дизайн, технически спецификации за разработване на експериментален дизайн). Това се дължи на ограничената налична информация в началния етап от жизнения цикъл на продукта и необходимостта от прогнозиране на техническите възможности и икономическата ситуация за в бъдеще. Статистически методитрябва да се използва на всички етапи от решаването на оптимизационен проблем - при мащабиране на променливи, разработване на математически модели на функциониране на продукти и системи, провеждане на технически и икономически експерименти и др.

При оптимизационни проблеми, включително оптимизиране на качеството на продукта и стандартните изисквания, се използват всички области на статистиката. А именно статистика на случайни променливи, многомерна Статистически анализ, статистика на случайни процеси и времеви редове, статистика на обекти с нечислов характер. Препоръчително е да изберете статистически метод за анализ на конкретни данни в съответствие с препоръките [

Въведение

2. Основни понятия на математическата статистика

2.1 Основни понятия на пробовземния метод

2.2 Разпределение на пробите

2.3 Емпирична функция на разпределение, хистограма

Заключение

Библиография

Въведение

Математическата статистика е наука за математическите методи за систематизиране и използване на статистически данни за научни и практически изводи. В много от своите раздели математическата статистика се основава на теория на вероятностите, която позволява да се оцени надеждността и точността на заключенията, направени въз основа на ограничен статистически материал (например да се оцени необходимия размер на извадката, за да се получат резултати с необходимата точност в извадково проучване).

Теорията на вероятностите разглежда случайни променливи с дадено разпределение или случайни експерименти, чиито свойства са напълно известни. Предмет на теорията на вероятностите са свойствата и връзките на тези величини (разпределения).

Но често експериментът е черна кутия, която дава само определени резултати, от които е необходимо да се направи заключение за свойствата на самия експеримент. Наблюдателят има набор от числени (или те могат да бъдат направени числени) резултати, получени чрез повтаряне на същия случаен експеримент при същите условия.

В този случай, например, възникват следните въпроси: Ако наблюдаваме една случайна променлива, как можем да направим най-точното заключение за нейното разпределение въз основа на набор от нейните стойности в няколко експеримента?

Пример за такава поредица от експерименти може да бъде социологическо проучване, набор от икономически показатели или накрая поредица от глави и опашки, когато една монета се хвърля хиляди пъти.

Всички горепосочени фактори определят уместности значението на темата за работа на настоящия етап, насочена към задълбочено и всеобхватно изучаване на основните понятия на математическата статистика.

В тази връзка целта на тази работа е да систематизира, натрупа и консолидира знанията за понятията на математическата статистика.

1. Предмет и методи на математическата статистика

Математическата статистика е наука за математическите методи за анализ на данни, получени по време на масови наблюдения (измервания, експерименти). В зависимост от математическата природа на конкретните резултати от наблюдение, математическата статистика се разделя на статистика на числата, многовариантен статистически анализ, анализ на функции (процеси) и времеви редове, статистика на обекти с нечислов характер. Значителна част от математическата статистика се основава на вероятностни модели. Има общи задачи за описание на данни, оценка и тестване на хипотези. Те също така разглеждат по-специфични задачи, свързани с провеждане на извадкови проучвания, възстановяване на зависимости, конструиране и използване на класификации (типологии) и др.

За да се опишат данни, се изграждат таблици, диаграми и други визуални представяния, например корелационни полета. Обикновено не се използват вероятностни модели. Някои методи за описание на данни разчитат на напреднала теория и на възможностите на съвременните компютри. Те включват по-специално клъстерен анализ, насочен към идентифициране на групи от обекти, които са подобни един на друг, и многоизмерно мащабиране, което ви позволява визуално да представяте обекти в равнина, като изкривявате разстоянията между тях в най-малка степен.

Методите за оценка и тестване на хипотези се основават на вероятностни модели за генериране на данни. Тези модели се делят на параметрични и непараметрични. При параметричните модели се приема, че изследваните обекти се описват чрез функции на разпределение в зависимост от малък брой (1-4) числени параметри. В непараметричните модели се приема, че функциите на разпределение са произволно непрекъснати. В математическата статистика, параметри и характеристики на разпределението (математическо очакване, медиана, дисперсия, квантили и т.н.), функции на плътност и разпределение, зависимости между променливи (на базата на линейни и непараметрични коефициенти на корелация, както и параметрични или непараметрични оценки на функции, изразяващи зависимости) се оценяват и т.н.. Те използват точкови и интервални оценки (даващи граници за истински стойности).

В математическата статистика има обща теория за проверка на хипотези и голям брой методи, посветени на проверка на конкретни хипотези. Те разглеждат хипотези за стойностите на параметрите и характеристиките, за проверка на хомогенността (т.е. за съвпадението на характеристиките или функциите на разпределение в две проби), за съгласието на емпиричната функция на разпределение с дадена функция на разпределение или с параметрична семейство от такива функции, за симетрията на разпределението и др.

От голямо значение е разделът на математическата статистика, свързан с провеждането на извадкови изследвания, със свойствата на различните извадкови схеми и изграждането на адекватни методи за оценка и проверка на хипотези.

Проблемите с възстановяването на зависимостта се изучават активно повече от 200 години, след разработването на метода на най-малките квадрати от К. Гаус през 1794 г. В момента най-подходящите методи за търсене на информативно подмножество от променливи и непараметрични методи.

Разработването на методи за приближаване на данни и намаляване на размерността на описанието започва преди повече от 100 години, когато К. Пиърсън създава метода на главните компоненти. По-късно бяха разработени факторен анализ и множество нелинейни обобщения.

Различни методи за конструиране (клъстерен анализ), анализиране и използване (дискриминантен анализ) на класификации (типологии) се наричат ​​още методи за разпознаване на образи (с и без учител), автоматична класификация и др.

Математическите методи в статистиката се основават или на използването на суми (въз основа на централната гранична теорема на теорията на вероятностите), или на индекси на разликата (разстояния, показатели), както в статистиката на обекти с нечислов характер. Обикновено само асимптотични резултати са строго обосновани. В наши дни компютрите играят голяма роля в математическата статистика. Те се използват както за изчисления, така и за симулация (по-специално в методите за умножение на проби и при изследване на пригодността на асимптотични резултати).

Основни понятия на математическата статистика

2.1 Основни понятия на пробовземния метод

Нека е случайна променлива, наблюдавана в случаен експеримент. Предполага се, че вероятностното пространство е дадено (и няма да ни интересува).

Ще приемем, че след като веднъж сме провели този експеримент при същите условия, сме получили числата , , , - стойностите на тази случайна променлива в първи, втори и т.н. експерименти. Случайната променлива има разпределение, което е частично или напълно непознато за нас.

Нека разгледаме по-подробно набор, наречен проба.

В серия от експерименти, които вече са проведени, извадката е набор от числа. Но ако тази серия от експерименти се повтори отново, тогава вместо този набор ще получим нов набор от числа. Вместо числото ще се появи друго число - една от стойностите на случайната променлива. Тоест (и, и и т.н.) е стойност на променлива, която може да приема същите стойности като случайна променлива и също толкова често (със същите вероятности). Следователно преди експеримента - случайна величина, еднакво разпределена с , а след експеримента - числото, което наблюдаваме в този първи експеримент, т.е. една от възможните стойности на случайна променлива.

Размерът на извадката е набор от независими и идентично разпределени случайни променливи („копия“), които, подобно на , имат разпределение.

Какво означава „направете изводи за разпределение от извадка“? Разпределението се характеризира с функция на разпределение, плътност или таблица, набор от числени характеристики - , , и др. Използвайки извадка, трябва да можете да изградите приближения за всички тези характеристики.

.2 Разпределение на пробите

Нека разгледаме прилагането на извадка върху един елементарен резултат - набор от числа , , . В подходящо вероятностно пространство въвеждаме случайна променлива, приемаща стойности, , с вероятности от (ако някоя от стойностите съвпада, добавяме вероятностите съответния брой пъти). Таблицата за разпределение на вероятностите и функцията за разпределение на случайна променлива изглеждат така:

Разпределението на дадено количество се нарича емпирично или извадково разпределение. Нека изчислим математическото очакване и дисперсията на количеството и въведем обозначение за тези количества:

Нека изчислим момента на поръчка по същия начин

В общия случай означаваме с количеството

Ако, когато конструираме всички характеристики, които сме въвели, считаме извадката , , набор от случайни променливи, тогава самите тези характеристики - , , , , - ще станат случайни променливи. Тези характеристики на извадковото разпределение се използват за оценка (приближаване) на съответните неизвестни характеристики на истинското разпределение.

Причината за използване на характеристиките на разпределението за оценка на характеристиките на истинското разпределение (или ) е близостта на тези разпределения като цяло.

Помислете например за хвърляне на обикновен зар. Позволявам - броят на изпуснатите точки по време на хвърлянето, . Да приемем, че един се появява в извадката веднъж, двама - веднъж и т.н. Тогава случайната променлива ще приеме стойностите 1 , , 6 с вероятности , съответно. Но тези пропорции се приближават с нарастване според закона на големите числа. Тоест разпределението на стойността в известен смисъл се доближава до истинското разпределение на броя точки, които се появяват при хвърляне на правилния зар.

Няма да поясняваме какво се има предвид под близостта на извадката и истинските разпределения. В следващите параграфи ще разгледаме по-подробно всяка от характеристиките, въведени по-горе, и ще разгледаме нейните свойства, включително нейното поведение при увеличаване на размера на извадката.

.3 Емпирична функция на разпределение, хистограма

Тъй като неизвестно разпределение може да бъде описано, например, чрез неговата функция на разпределение, ние ще изградим „оценка“ за тази функция въз основа на извадката.

Определение 1.

Емпирична функция на разпределение, конструирана от извадка от обем, се нарича произволна функция, за всяка равна на

Напомняне:Случайна функция

наречен индикатор за събитие. За всяко това е случайна променлива с разпределение на Бернули с параметър . Защо?

С други думи, за всяка стойност , равна на истинската вероятност случайната променлива да е по-малка от , се оценява чрез съотношението на елементите на извадката по-малко от .

Ако примерните елементи , , са подредени във възходящ ред (при всеки елементарен резултат), ще бъде получен нов набор от случайни променливи, наречен вариационна серия:

Елементът , , се нарича тити член на вариационната серия или статистика от ти порядък.

Пример 1.

проба:

Серия вариации:

Ориз. 1.Пример 1

Емпиричната функция на разпределение има скокове в извадкови точки, големината на скока в точка е равна на , където е броят на извадковите елементи, които съвпадат с .

Можете да конструирате емпирична функция на разпределение, като използвате вариационна серия:

Друга характеристика на разпределението е таблицата (за дискретни разпределения) или плътност (за абсолютно непрекъснати). Емпиричен или селективен аналог на таблица или плътност е така наречената хистограма.

Хистограмата се изгражда с помощта на групирани данни. Изчисленият диапазон от стойности на случайна променлива (или диапазон от примерни данни) е разделен, независимо от извадката, на определен брой интервали (не непременно идентични). Нека , , са интервали на линията, наречени интервали за групиране. Нека означим за с броя на примерните елементи, попадащи в интервала:

(1)

На всеки интервал се изгражда правоъгълник, чиято площ е пропорционална на . Общата площ на всички правоъгълници трябва да е равна на единица. Нека е дължината на интервала. Височината на правоъгълника отгоре е

Получената фигура се нарича хистограма.

Пример 2.

Има вариационна серия (вижте пример 1):

Ето десетичния логаритъм, следователно, т.е. когато извадката се удвои, броят на интервалите на групиране се увеличава с 1. Имайте предвид, че колкото повече интервали на групиране, толкова по-добре. Но ако вземем броя на интервалите, да речем, от порядъка на , тогава с нарастване хистограмата няма да се доближи до плътността.

Вярно е следното твърдение:

Ако плътността на разпределението на елементите на извадката е непрекъсната функция, тогава за такава, че , има точкова конвергенция във вероятността на хистограмата към плътността.

Така че изборът на логаритъм е разумен, но не е единственият възможен.

Заключение

Математическата (или теоретична) статистика се основава на методите и концепциите на теорията на вероятностите, но в известен смисъл решава обратни проблеми.

Ако наблюдаваме проявата на два (или повече) признака едновременно, т.е. имаме набор от стойности на няколко случайни променливи - какво можем да кажем за тяхната зависимост? Има ли я или я няма? И ако има, каква е тази зависимост?

Често е възможно да се направят някои предположения за разпределението, скрито в черната кутия, или за нейните свойства. В този случай, въз основа на експериментални данни, е необходимо да се потвърдят или опровергаят тези предположения („хипотези“). Трябва да се помни, че отговорът „да“ или „не“ може да бъде даден само с определена степен на сигурност и колкото по-дълго можем да продължим експеримента, толкова по-точни могат да бъдат заключенията. Най-благоприятната ситуация за изследване е, когато можете уверено да твърдите определени свойства на наблюдавания експеримент - например наличието на функционална връзка между наблюдаваните величини, нормалността на разпределението, неговата симетрия, наличието на плътност в разпределението или неговата дискретна природа и др.

Така че има смисъл да помним за (математическата) статистика, ако

· има случаен експеримент, чиито свойства са частично или напълно неизвестни,

· можем да възпроизведем този експеримент при едни и същи условия няколко (или още по-добре произволен) брой пъти.

Библиография

1. Баумол У. Икономическа теория и изследване на операциите. – М.; Наука, 1999.

2. Болшев Л.Н., Смирнов Н.В. Таблици на математическата статистика. М.: Наука, 1995.

3. Боровков А.А. Математическа статистика. М.: Наука, 1994.

4. Корн Г., Корн Т. Наръчник по математика за учени и инженери. - Санкт Петербург: Издателство Лан, 2003 г.

5. Коршунов Д.А., Чернова Н.И. Сборник задачи и упражнения по математическа статистика. Новосибирск: Издателство на Института по математика на името на. S.L. Соболев SB RAS, 2001.

6. Пехелецки И.Д. Математика: учебник за студенти. - М.: Академия, 2003.

7. Суходолски В.Г. Лекции по висша математика за хуманисти. - Санкт Петербургско издателство на Санкт Петербургския държавен университет. 2003 г

8. Фелер В. Въведение в теорията на вероятностите и нейните приложения. - М .: Мир, Т.2, 1984 г.

9. Харман Г., Съвременен факторен анализ. - М.: Статистика, 1972.


Харман Г., Съвременен факторен анализ. - М.: Статистика, 1972.

Математическата статистика се разбира като „клон на математиката, посветен на математическите методи за събиране, систематизиране, обработка и интерпретиране на статистически данни, както и използването им за научни или практически заключения. Правилата и процедурите на математическата статистика се основават на теорията на вероятностите, което ни позволява да оценим точността и надеждността на заключенията, получени във всеки проблем въз основа на наличния статистически материал. В този случай статистическите данни се отнасят до информация за броя на обектите във всяка повече или по-малко обширна колекция, която има определени характеристики.

Въз основа на типа проблеми, които се решават, математическата статистика обикновено се разделя на три раздела: описание на данните, оценка и тестване на хипотези.

Въз основа на вида на обработваните статистически данни, математическата статистика е разделена на четири области:
- едномерна статистика (статистика на случайни величини), при която резултатът от наблюдение се описва с реално число;
- многомерен статистически анализ, при който резултатът от наблюдението на даден обект се описва с няколко числа (вектор);
- статистика на случайни процеси и времеви редове, където резултатът от наблюдението е функция;
- статистика на обекти с нечислово естество, при което резултатът от наблюдение е от нечислово естество, например, това е набор (геометрична фигура), подреждане или получен в резултат на измерване, базирано по качествен критерий.

Исторически, някои области на статистиката на обекти с нечислов характер (по-специално проблеми с оценката на дела на дефектите и тестването на хипотези за това) и едномерната статистика бяха първите, които се появиха. За тях математическият апарат е по-опростен, така че техният пример обикновено се използва за демонстриране на основните идеи на математическата статистика.

Само тези методи за обработка на данни, т.е. математическата статистика е базирана на доказателства, които се основават на вероятностни модели на съответни реални явления и процеси. Става дума за модели на потребителско поведение, възникване на рискове, функциониране на технологичното оборудване, получаване на експериментални резултати, протичане на заболяване и др. Вероятностният модел на реално явление трябва да се счита за изграден, ако разглежданите величини и връзките между тях са изразени от гледна точка на теорията на вероятностите. Съответствие с вероятностния модел на реалността, т.е. неговата адекватност е обоснована, по-специално, с помощта на статистически методи за проверка на хипотези.

Невероятностните методи за обработка на данни са проучвателни, те могат да се използват само при предварителен анализ на данни, тъй като не позволяват да се оцени точността и надеждността на заключенията, получени въз основа на ограничен статистически материал.

Вероятностните и статистическите методи са приложими навсякъде, където е възможно да се конструира и обоснове вероятностен модел на явление или процес. Използването им е задължително, когато изводите, направени от данните за извадката, се прехвърлят към цялата популация (например от извадка към цяла партида продукти).

В конкретни области на приложение се използват както вероятностни и статистически методи с общо приложение, така и специфични. Например, в раздела за управление на производството, посветен на статистическите методи за управление на качеството на продуктите, се използва приложна математическа статистика (включително проектиране на експерименти). С неговите методи се извършват статистически анализи на точността и стабилността на технологичните процеси и статистическа оценка на качеството. Специфичните методи включват методи за статистическо приемане на качеството на продукта, статистическо регулиране на технологичните процеси, оценка и контрол на надеждността и др.

Приложните вероятностни и статистически дисциплини като теория на надеждността и теория на опашките са широко използвани. Съдържанието на първия от тях е ясно от името, вторият се занимава с изследване на системи като телефонна централа, която приема обаждания в произволни моменти - изискванията на абонатите, набиращи номера на своите телефонни апарати. Продължителността на обслужване на тези изисквания, т.е. продължителността на разговорите също се моделира чрез случайни променливи. Голям принос за развитието на тези дисциплини направи член-кореспондентът на Академията на науките на СССР А.Я. Хинчин (1894-1959), академик на Академията на науките на Украинската ССР Б. В. Гнеденко (1912-1995) и други местни учени.

Теорията на вероятностите и математическата статистика са в основата на вероятностните и статистическите методи за обработка на данни. И ние обработваме и анализираме данните предимно за вземане на решения. За да се използва съвременен математически апарат, е необходимо да се изразят разглежданите проблеми по отношение на вероятностно-статистически модели.

Прилагането на конкретен вероятностно-статистически метод се състои от три етапа:

Преходът от икономическа, управленска, технологична реалност към абстрактна математико-статистическа схема, т.е. изграждане на вероятностен модел на система за управление, технологичен процес, процедура за вземане на решения, по-специално въз основа на резултатите от статистически контрол и др.

Извършване на изчисления и извеждане на изводи с помощта на чисто математически средства в рамките на вероятностен модел;

Тълкуване на математически и статистически заключения във връзка с реална ситуация и вземане на подходящо решение (например относно съответствието или несъответствието на качеството на продукта с установените изисквания, необходимостта от коригиране на технологичния процес и т.н.), по-специално, заключения (за съотношението на дефектните единици продукт в партида, за конкретната форма на закони за разпределение на контролираните параметри на технологичния процес и др.).

Математическата статистика използва концепциите, методите и резултатите от теорията на вероятностите. След това разглеждаме основните въпроси на конструирането на вероятностни модели в икономически, управленски, технологични и други ситуации. Подчертаваме, че за активното и правилно използване на нормативни, технически и инструктивни документи за вероятностни статистически методи са необходими предварителни познания. По този начин е необходимо да се знае при какви условия трябва да се използва определен документ, каква първоначална информация е необходима за неговия избор и прилагане, какви решения трябва да се вземат въз основа на резултатите от обработката на данни и др.

Примери за приложение теория на вероятностите и математическа статистика.Нека разгледаме няколко примера, при които вероятностно-статистическите модели са добър инструмент за решаване на управленски, производствени, икономически и национални икономически проблеми. Така например в романа на А. Н. Толстой „Ходене през мъките“ (том 1) се казва: „цехът произвежда двадесет и три процента брак, вие се придържайте към тази цифра“, каза Струков на Иван Илич.

Как да разбираме тези думи в разговора на ръководителите на фабрики? Една единица продукция не може да има 23% дефект. Тя може да бъде или добра, или дефектна. Вероятно Струков е имал предвид, че една голяма по обем партида съдържа приблизително 23% дефектни единици продукция. Тогава възниква въпросът какво означава „приблизително“? Ако от 100 проверени бройки продукция 30 се окажат дефектни, или от 1000 - 300, или от 100 000 - 30 000 и т.н., нужно ли е да обвиняваме Струков в лъжа?

Или друг пример. Монетата, използвана като лот, трябва да бъде „симетрична“. При хвърлянето му средно в половината от случаите трябва да се появи герб (глави), а в половината от случаите - решетка (опашки, номер). Но какво означава „средно“? Ако провеждате много серии от 10 хвърляния във всяка серия, тогава често ще срещнете серии, в които монетата пада като герб 4 пъти. За симетрична монета това ще се случи в 20,5% от пусканията. И ако след 100 000 хвърляния има 40 000 герба, може ли монетата да се счита за симетрична? Процедурата за вземане на решение се основава на теорията на вероятностите и математическата статистика.

Примерът може да не изглежда достатъчно сериозен. Обаче не е така. Тегленето на жребий се използва широко при организирането на експерименти за индустриална осъществимост. Например, при обработка на резултатите от измерването на показателя за качество (момент на триене) на лагерите в зависимост от различни технологични фактори (влиянието на консервационната среда, методите за подготовка на лагерите преди измерване, влиянието на натоварването на лагера по време на процеса на измерване и др. ). Да кажем, че е необходимо да се сравни качеството на лагерите в зависимост от резултатите от тяхното съхранение в различни консервационни масла, т.е. в състава масла АИ IN. При планирането на такъв експеримент възниква въпросът кои лагери трябва да се поставят в маслото на състава А, а кои - в състава на маслото IN, но така, че да се избегне субективизма и да се гарантира обективността на взетото решение. Отговорът на този въпрос може да бъде получен чрез теглене на жребий.

Подобен пример може да се даде с контрола на качеството на всеки продукт. За да се реши дали контролираната партида от продукти отговаря или не отговаря на установените изисквания, от нея се избира проба. Въз основа на резултатите от пробния контрол се прави заключение за цялата партида. В този случай е много важно да се избегне субективизма при формирането на извадка, т.е. необходимо е всяка единица продукт в контролираната партида да има еднаква вероятност да бъде избрана за извадката. В производствени условия изборът на продуктови единици за извадката обикновено се извършва не чрез партида, а чрез специални таблици със случайни числа или с помощта на компютърни сензори за произволни числа.

Подобни проблеми за осигуряване на обективност на сравнението възникват при сравняване на различни схеми за организация на производството, възнаграждения, по време на търгове и конкурси, избор на кандидати за свободни позиции и др. Навсякъде имаме нужда от жребий или подобни процедури.

Нека е необходимо да се определи най-силният и вторият най-силен отбор, когато се организира турнир по олимпийската система (губещият се елиминира). Да кажем, че по-силният отбор винаги побеждава по-слабия. Ясно е, че най-силният отбор със сигурност ще стане шампион. Вторият по сила отбор ще стигне до финала само ако няма мачове с бъдещия шампион преди финала. Ако се планира такава игра, то вторият по сила отбор няма да стигне до финала. Този, който планира турнира, може или да „нокаутира“ втория по сила отбор от турнира предсрочно, като го противопостави на лидера в първата среща, или да му осигури второ място, като осигури срещи с по-слаби отбори чак до финал. За да се избегне субективизъм, се провежда жребий. За турнир с 8 отбора вероятността първите два отбора да се срещнат на финала е 4/7. Съответно, с вероятност от 3/7, вторият най-силен отбор ще напусне турнира рано.

Всяко измерване на продуктови единици (с дебеломер, микрометър, амперметър и т.н.) съдържа грешки. За да се установи дали има систематични грешки, е необходимо да се направят многократни измервания на единица продукт, чиито характеристики са известни (например стандартна проба). Трябва да се помни, че в допълнение към систематичната грешка има и случайна грешка.

Ето защо възниква въпросът как да разберем от резултатите от измерването дали има системна грешка. Ако само отбележим дали грешката, получена при следващото измерване, е положителна или отрицателна, тогава този проблем може да бъде сведен до вече разгледания. Наистина, нека сравним измерване с хвърляне на монета, положителна грешка със загуба на герб, отрицателна грешка с мрежа (нулева грешка с достатъчен брой деления на скалата почти никога не се случва). Тогава проверката за липса на систематична грешка е еквивалентна на проверка на симетрията на монетата.

Така че задачата за проверка на липсата на систематична грешка се свежда до задачата за проверка на симетрията на монетата. Горното разсъждение води до така наречения "критерий за знак" в математическата статистика.

При статистическото регулиране на технологичните процеси, въз основа на методите на математическата статистика, се разработват правила и планове за статистически контрол на процесите, насочени към своевременно откриване на проблеми в технологичните процеси и предприемане на мерки за тяхното коригиране и предотвратяване на освобождаването на продукти, които не отговарят на изискванията. отговарят на установените изисквания. Тези мерки са насочени към намаляване на производствените разходи и загубите от доставката на нискокачествени единици. По време на статистическия приемен контрол, базиран на методите на математическата статистика, се разработват планове за контрол на качеството чрез анализиране на проби от продуктови партиди. Трудността се състои в възможността за правилно изграждане на вероятностно-статистически модели за вземане на решения. В математическата статистика за тази цел са разработени вероятностни модели и методи за тестване на хипотези, по-специално хипотези, че делът на дефектните единици продукция е равен на определен брой Р 0 , Например, Р 0 = 0,23 (помнете думите на Струков от романа на А. Н. Толстой).

Задачи за оценка.В редица управленски, производствени, икономически и народностопански ситуации възникват проблеми от различен тип - проблеми за оценка на характеристиките и параметрите на вероятностните разпределения.

Нека разгледаме един пример. Нека една партида от нелектрически лампи От тази партида, проба от нелектрически лампи Възникват редица естествени въпроси. Как да се определи средният експлоатационен живот на електрическите лампи въз основа на резултатите от изпитването на пробни елементи и с каква точност може да се оцени тази характеристика? Как ще се промени точността, ако вземем по-голяма проба? На колко часа Tможе да се гарантира, че поне 90% от електрическите лампи ще издържат Tи още часове?

Нека приемем, че при тестване на размер на извадка нелектрическите лампи се оказаха дефектни хелектрически лампи Какви граници могат да бъдат зададени за число? ддефектни крушки в партида, за нивото на дефектност д/ ни така нататък.?

Или при статистически анализ на точността и стабилността на технологичните процеси е необходимо да се оценят такива показатели за качество като средната стойност на контролирания параметър и степента на неговото разсейване в разглеждания процес. Според теорията на вероятностите е препоръчително да се използва нейното математическо очакване като средна стойност на случайна променлива, а дисперсията, стандартното отклонение или коефициентът на вариация като статистическа характеристика на спреда. Възникват въпроси: как да се оценят тези статистически характеристики от извадкови данни и с каква точност може да се направи това?

Могат да се дадат много подобни примери. Тук беше важно да се покаже как теорията на вероятностите и математическата статистика могат да се използват в инженерни и управленски проблеми.

Съвременна идея за математическа статистика.Математическата статистика се разбира като „клон на математиката, посветен на математическите методи за събиране, систематизиране, обработка и интерпретиране на статистически данни, както и използването им за научни или практически заключения. Правилата и процедурите на математическата статистика се основават на теорията на вероятностите, което ни позволява да оценим точността и надеждността на заключенията, получени във всеки проблем въз основа на наличния статистически материал. В този случай статистическите данни се отнасят до информация за броя на обектите във всяка повече или по-малко обширна колекция, която има определени характеристики.

Въз основа на типа проблеми, които се решават, математическата статистика обикновено се разделя на три раздела: описание на данните, оценка и тестване на хипотези.

Въз основа на вида на обработваните статистически данни, математическата статистика е разделена на четири области:

Едномерна статистика (статистика на случайни променливи), при която резултатът от наблюдение се описва с реално число;

Многовариантен статистически анализ, при който резултатът от наблюдението на даден обект се описва с няколко числа (вектор);

Статистика на случайни процеси и времеви редове, където резултатът от наблюдението е функция;

Статистика на обекти от нечислово естество, при което резултатът от наблюдение е от нечислово естество, например, това е набор (геометрична фигура), подреждане или получен в резултат на измерване, базирано на по качествен критерий.

Исторически, някои области на статистиката на обекти с нечислов характер (по-специално проблеми с оценката на дела на дефектите и тестването на хипотези за това) и едномерната статистика бяха първите, които се появиха. За тях математическият апарат е по-опростен, така че техният пример обикновено се използва за демонстриране на основните идеи на математическата статистика.

Само тези методи за обработка на данни, т.е. математическата статистика е базирана на доказателства, които се основават на вероятностни модели на съответни реални явления и процеси. Става дума за модели на потребителско поведение, възникване на рискове, функциониране на технологичното оборудване, получаване на експериментални резултати, протичане на заболяване и др. Вероятностният модел на реално явление трябва да се счита за изграден, ако разглежданите величини и връзките между тях са изразени от гледна точка на теорията на вероятностите. Съответствие с вероятностния модел на реалността, т.е. неговата адекватност е обоснована, по-специално, с помощта на статистически методи за проверка на хипотези.

Невероятностните методи за обработка на данни са проучвателни, те могат да се използват само при предварителен анализ на данни, тъй като не позволяват да се оцени точността и надеждността на заключенията, получени въз основа на ограничен статистически материал.

Вероятностните и статистическите методи са приложими навсякъде, където е възможно да се конструира и обоснове вероятностен модел на явление или процес. Използването им е задължително, когато изводите, направени от данните за извадката, се прехвърлят към цялата популация (например от извадка към цяла партида продукти).

В конкретни области на приложение се използват както вероятностни и статистически методи с общо приложение, така и специфични. Например, в раздела за управление на производството, посветен на статистическите методи за управление на качеството на продуктите, се използва приложна математическа статистика (включително проектиране на експерименти). С неговите методи се извършват статистически анализи на точността и стабилността на технологичните процеси и статистическа оценка на качеството. Специфичните методи включват методи за статистическо приемане на качеството на продукта, статистическо регулиране на технологичните процеси, оценка и контрол на надеждността и др.

Приложните вероятностни и статистически дисциплини като теория на надеждността и теория на опашките са широко използвани. Съдържанието на първия от тях е ясно от името, вторият се занимава с изследване на системи като телефонна централа, която приема обаждания в произволни моменти - изискванията на абонатите, набиращи номера на своите телефонни апарати. Продължителността на обслужване на тези изисквания, т.е. продължителността на разговорите също се моделира чрез случайни променливи. Голям принос за развитието на тези дисциплини направи член-кореспондентът на Академията на науките на СССР А.Я. Хинчин (1894-1959), академик на Академията на науките на Украинската ССР Б. В. Гнеденко (1912-1995) и други местни учени.

Накратко за историята на математическата статистика.Математическата статистика като наука започва с трудовете на известния немски математик Карл Фридрих Гаус (1777-1855), който, въз основа на теорията на вероятностите, изследва и обосновава метода на най-малките квадрати, създаден от него през 1795 г. и използван за обработка на астрономически данни ( за да се изясни орбитата на малка планета Церера). Едно от най-популярните вероятностни разпределения, нормалното, често е кръстено на него, а в теорията на случайните процеси основният обект на изследване са процесите на Гаус.

В края на 19в. - началото на 20 век Основен принос в математическата статистика са направени от английски изследователи, предимно К. Пиърсън (1857-1936) и Р. А. Фишър (1890-1962). По-специално, Пиърсън разработи теста хи-квадрат за тестване на статистически хипотези, а Фишър разработи анализ на дисперсията, теорията на експерименталния дизайн и метода на максималната вероятност за оценка на параметрите.

През 30-те години на ХХ век. Полякът Йежи Нойман (1894-1977) и англичанинът Е. Пиърсън разработиха общата теория за проверка на статистически хипотези, а съветските математици академик А.Н. Колмогоров (1903-1987) и член-кореспондент на Академията на науките на СССР Н. В. Смирнов (1900-1966) полагат основите на непараметричната статистика. През четиридесетте години на ХХ век. Румънецът А. Валд (1902-1950) изгражда теорията на последователния статистически анализ.

В днешно време математическата статистика се развива бързо. Така през последните 40 години могат да се разграничат четири фундаментално нови области на изследване:

Разработване и внедряване на математически методи за планиране на експерименти;

Развитие на статистиката на обекти с нечислов характер като самостоятелно направление в приложната математическа статистика;

Разработване на статистически методи, които са устойчиви на малки отклонения от използвания вероятностен модел;

Широко разпространено развитие на работата по създаването на компютърни софтуерни пакети, предназначени за статистически анализ на данни.

Вероятностно-статистически методи и оптимизация.Идеята за оптимизация прониква в съвременната приложна математическа статистика и други статистически методи. А именно методи за планиране на експерименти, статистически приемлив контрол, статистическо регулиране на технологични процеси и др. От друга страна, оптимизационните формулировки в теорията за вземане на решения, например приложната теория за оптимизиране на качеството на продукта и стандартните изисквания, осигуряват широко използване на вероятностни статистически методи, предимно приложна математическа статистика.

В управлението на производството, по-специално, когато се оптимизира качеството на продукта и стандартните изисквания, е особено важно да се прилагат статистически методи в началния етап от жизнения цикъл на продукта, т.е. на етапа на изследователска подготовка на експериментални дизайнерски разработки (разработване на обещаващи изисквания към продукта, предварителен дизайн, технически спецификации за разработване на експериментален дизайн). Това се дължи на ограничената налична информация в началния етап от жизнения цикъл на продукта и необходимостта от прогнозиране на техническите възможности и икономическата ситуация за в бъдеще. Статистическите методи трябва да се използват на всички етапи от решаването на задача за оптимизация - при мащабиране на променливи, разработване на математически модели на функциониране на продукти и системи, провеждане на технически и икономически експерименти и др.

При оптимизационни проблеми, включително оптимизиране на качеството на продукта и стандартните изисквания, се използват всички области на статистиката. А именно статистика на случайни променливи, многомерен статистически анализ, статистика на случайни процеси и времеви редове, статистика на обекти с нечислов характер. Разработени са препоръки за избор на статистически метод за анализ на конкретни данни.