На методы какой науки опирается математическая статистика. Современное представление о математической статистике

Математическая статистика - это современная отрасль математической науки, которая занимается статистическим описанием результатов экспериментов и наблюдений, а также построением математических моделей, содержащих понятия вероятности. Теоретической базой математической статистики служит теория вероятностей.

В структуре математической статистики традиционно выделяют два основных раздела: описательная статистика и статистические выводы (рис. 1.1).

Рис. 1.1. Основные разделы математической статистики

Описательная статистика используется для:

o обобщение показателей одной переменной (статистика случайной выборки);

o выявление взаимосвязей между двумя и более переменными (корреляционно-регрессионный анализ).

Описательная статистика дает возможность получить новую информацию, быстрее понять и всесторонне оценить ее, то есть выполняет научную функцию описания объектов исследования, чем и оправдывает свое название. Методы описательной статистики призваны превратить совокупность отдельных эмпирических данных на систему наглядных для восприятия форм и чисел: распределения частот; показатели тенденций, вариативности, связи. Этими методами рассчитываются статистики случайной выборки, которые служат основанием для осуществления статистических выводов.

Статистические выводы дают возможность:

o оценить точность, надежность и эффективность выборочных статистик, найти ошибки, которые возникают в процессе статистических исследований (статистическое оценивание)

o обобщить параметры генеральной совокупности, полученные на основании выборочных статистик (проверка статистических гипотез).

Главная цель научных исследований - это получение нового знания о больших класса явлений, лиц или событий, которые принято называть генеральной совокупности.

Генеральная совокупность - это полная совокупность объектов исследования, выборка - ее часть, которая сформирована определенным научно обоснованным способом 2.

Термин "генеральная совокупность" используется тогда, когда речь идет о большой, но конечную совокупность исследуемых объектов. Например, о совокупности абитуриентов Украины в 2009 году или совокупность детей дошкольного возраста города Ровно. Генеральные совокупности могут достигать значительных объемов, быть конечным и бесконечным. На практике, как правило, имеют дело с конечным совокупностями. И если отношение объема генеральной совокупности к объему выборки составляет более 100, то, по словам Гласса и Стэнли методы оценки для конечных и бесконечных совокупностей дают в сущности одинаковые результаты . Генеральной совокупностью можно называть и полную совокупность значений какого-то признака. Принадлежность выборки к генеральной совокупности является главным основанием для оценки характеристик генеральной совокупности по характеристикам выборки.

Основная идея математической статистики базируется на убеждении о том, что полное изучение всех объектов генеральной совокупности в большинстве научных задач или практически невозможно, или экономически нецелесообразно, поскольку требует много времени и значительных материальных затрат. Поэтому в математической статистике применяется выборочный подход, принцип которого показано на схеме рис. 1.2.

Например, по технологии формирования различают выборки рандомизированы (простые и систематические), стратифицированные, кластерные (см. Раздел 4).

Рис. 1.2. Схема применения методов математической статистики Согласно выборочным подходом использования математико-статистических методов может проводиться в такой последовательности (см. Рис. 1.2):

o с генеральной совокупности, свойства которой подлежат исследованию, определенными методами формируют выборку - типичную но ограниченное количество объектов, к которым применяют исследовательские методы;

o в результате методов наблюдений, экспериментальных действий и измерений над объектами выборки получают эмпирические данные;

o обработка эмпирических данных с помощью методов описательной статистики дает показатели выборки, которые называются статистиками - как и название дисциплины, кстати;

o применяя методы статистических выводов к статистик, получают параметры, которые характеризуют свойства генеральной совокупности.

Пример 1.1. С целью оценки стабильности уровня знаний (переменная X) проведено тестирование рандомизированной выборки 3 студентов объемом n. Тесты содержали по m заданий, каждое из которых оценивалось по системе баллов: "выполнено" "- 1," не выполнено "- 0. остались средние текущие достижения студентов X

3 рандомизированных выборка (от англ. Random - случайный) - это репрезентативная выборка, которая сформирована по стратегии случайных испытаний.

на уровне прошлых лет / ч? Последовательность решения:

o выяснить содержательную гипотезу типа: "если текущие результаты тестирования не будут отличаться от прошлых, то можно считать уровень знаний студентов неизменным, а учебный процесс - стабильным";

o сформулировать адекватную статистическую гипотезу, например, нуль-гипотезу Н 0 о том, что "текущий средний балл X статистически не отличается от среднего показателя прошлых лет / ч", то есть Н 0: X = / г, против соответствующей альтернативной гипотезы X Ф ^ ;

o построить эмпирические распределения исследуемой переменной X;

o определить (при необходимости) корреляционные связи, например, между переменной X и другими показателями, построить линии регрессии;

o проверить соответствие эмпирического распределения нормальному закону;

o оценить значение точечных показателей и доверительный интервал параметров, например, среднего;

o определить критерий для проверки статистических гипотез;

o выполнить проверку статистических гипотез на основе выбранных критериев;

o сформулировать решение о статистической нуль-гипотезы на определенном уровне значимости;

o перейти от решения о принятии или отклонении статистической нуль-гипотезы интерпретации выводов относительно гипотезы содержательной;

o сформулировать содержательные выводы.

Итак, если обобщить вышеперечисленные процедуры, применение статистических методов состоит из трех основных блоков:

Переход от объекта реальности к абстрактной математико-статистической схемы, то есть построение вероятностной модели явления, процесса, свойства;

Проведение расчетных действий собственно математическими средствами в рамках вероятностной модели по результатам измерений, наблюдений, эксперимента и формулировки статистических выводов;

Интерпретация статистических выводов о реальной ситуации и принятия соответствующего решения.

Статистические методы обработки и интерпретации данных опираются на теорию вероятностей. Теория вероятностей является основой методов математической статистики. Без использования фундаментальных понятий и законов теории вероятностей невозможно обобщения выводов математической статистики, а значит и обоснованного их использования для научных и практических целей.

Так, задачей описательной статистики является превращение совокупности выборочных данных на систему показателей - статистик - распределений частот, мер центральной тенденции и изменчивости, коэффициентов связи и тому подобное. Однако, статистики являются характеристиками, по сути, конкретной выборки. Конечно, можно рассчитывать выборочные распределения, выборочные средние, дисперсии и т. Д., Но подобный "анализ данных" имеет ограниченную научно-познавательную ценность. "Механическое" перенос каких-либо выводов, сделанных на основе таких показателей, на другие совокупности не является корректным.

Для того, чтобы иметь возможность переноса выборочных показателей или другие, или на более распространены совокупности, необходимо иметь математически обоснованные положения о соответствии и способности выборочных характеристик характеристиками этих распространенных так называемых генеральных совокупностей. Такие положения базируются на теоретических подходах и схемах, связанных с вероятностными моделях реальности, например, на аксиоматическом подходе, в законе больших чисел и т.д. Только с их помощью можно переносить свойства, которые установлены по результатам анализа ограниченной эмпирической информации, или на другие или на распространенные совокупности. Таким образом, построение, законы функционирования, использование вероятностных моделей, является предметом математической области под названием "теория вероятностей", становится сутью статистических методов.

Таким образом, в математической статистике используются два параллельных строки показателей: первая строка, что имеет отношение к практике (это выборочные показатели) и второй, основанный на теории (это показатели вероятностной модели). Например, эмпирическим частотам, которые определены на выборке, соответствуют понятия теоретической вероятности; выборочном среднем (практика) соответствует математическое ожидание (теория) и т.д. Причем, в исследованиях выборочные характеристики, как правило, являются первичными. Они рассчитываются на основе наблюдений, измерений, экспериментов, после чего проходят статистическое оценивание способности и эффективности, проверку статистических гипотез в соответствии с целями исследований и в конце принимаются с определенной вероятностью как показатели свойств исследуемых совокупностей.

Вопрос. Задача.

1. Охарактеризуйте основные разделы математической статистики.

2. В чем заключается основная идея математической статистики?

3. Охарактеризуйте соотношение генеральной и выборочной совокупностей.

4. Объясните схему применения методов математической статистики.

5. Укажите перечень основных задач математической статистики.

6. Из каких основных блоков состоит применения статистических методов? Охарактеризуйте их.

7. Раскройте связь математической статистики с теорией вероятностей.

Каждое исследование в области случайных явлений своими корнями всегда уходит в эксперимент, в опытные данные. Числовые данные, которые собирают при изучении какого-либо признака некоторого объекта, называются статистическими . Статистические данные являются первоначальным материалом исследования. Для того, чтобы они представляли научную или практическую ценность, их надо обработать методами математической статистики.

Математическая статистика - это научная дисциплина, предметом изучения которой является разработка методов регистрации, описания и анализа статистических экспериментальных данных, полученных в результате наблюдений массовых случайных явлений.

Основными задачами математической статистики являются:

    определение закона распределения случайной величины или системы случайных величин;

    проверка правдоподобия гипотез;

    определение неизвестных параметров распределения.

Все методы математической статистики основаны на теории вероятностей. Однако в силу специфичности решаемых задач математическая статистика выделяется из теории вероятностей в самостоятельную область. Если в теории вероятностей считается заданной модель явления и производится расчет возможного реального течения этого явления (рис.1), то в математической статистике подбирается подходящая теоретико-вероятностная модель, исходя из статистических данных (рис.2).

Рис.1. Общая задача теории вероятностей

Рис.2. Общая задача математической статистики

Как научная дисциплина математическая статистика развивалась вместе с теорией вероятностей. Математический аппарат этой науки построен во второй половине XIX века.

2. Генеральная совокупность и выборка.

Для изучения статистических методов вводятся понятия генеральной и выборочной совокупностей. В общем случае под генеральной совокупностью понимается случайная величина X с функцией распределения
. Выборочной совокупностью или выборкой объемаn для данной случайной величины X называется набор
независимых наблюдений этой величины, гденосит название выборочного значения или реализации случайной величиныX. Таким образом, можно рассматривать как числа (если эксперимент проведен и выборка состоялась) и как случайные величины (до проведения эксперимента), поскольку они меняются от выборки к выборке.

Пример 1 . Для определения зависимости толщины ствола дерева от его высоты было отобрано 200 деревьев. В данном случае объем выборки n=200.

Пример 2. В результате распиловки древесностружечных плит на круглопильном станке было получено 15 значений удельной работы резания. В этом случае n=15.

Д
ля того чтобы по данным выборки уверенно судить об интересующем нас признаке генеральной совокупности, объекты выборки должны правильно ее представлять, то есть выборка должна бытьрепрезентативной (представительной). Репрезентативность выборки обычно достигается случайностью отбора объектов: каждому объекту генеральной совокупности обеспечивается равная со всеми остальными вероятность попадания в выборку.

Рис.3. Демонстация репрезентативности выборки

Как используются теория вероятностей и математическая статистика ? Эти дисциплины - основа вероятностно-статистических методов принятия решений . Чтобы воспользоваться их математическим аппаратом, необходимо задачи принятия решений выразить в терминах вероятностно-статистических моделей. Применение конкретного вероятностно-статистического метода принятия решений состоит из трех этапов:

  • переход от экономической, управленческой, технологической реальности к абстрактной математико-статистической схеме, т.е. построение вероятностной модели системы управления, технологического процесса, процедуры принятия решений , в частности по результатам статистического контроля, и т.п.;
  • проведение расчетов и получение выводов чисто математическими средствами в рамках вероятностной модели;
  • интерпретация математико-статистических выводов применительно к реальной ситуации и принятие соответствующего решения (например, о соответствии или несоответствии качества продукции установленным требованиям, необходимости наладки технологического процесса и т.п.), в частности, заключения (о доле дефектных единиц продукции в партии, о конкретном виде законов распределения контролируемых параметров технологического процесса и др.).

Математическая статистика использует понятия, методы и результаты теории вероятностей. Рассмотрим основные вопросы построения вероятностных моделей принятия решений в экономических, управленческих, технологических и иных ситуациях. Для активного и правильного использования нормативно-технических и инструктивно-методических документов по вероятностно-статистическим методам принятия решений нужны предварительные знания. Так, необходимо знать, при каких условиях следует применять тот или иной документ, какую исходную информацию необходимо иметь для его выбора и применения, какие решения должны быть приняты по результатам обработки данных и т.д.

Примеры применения теории вероятностей и математической статистики . Рассмотрим несколько примеров, когда вероятностно-статистические модели являются хорошим инструментом для решения управленческих, производственных, экономических, народнохозяйственных задач. Так, например, в романе А.Н. Толстого "Хождение по мукам" (т.1) говорится: "мастерская дает двадцать три процента брака, этой цифры вы и держитесь, - сказал Струков Ивану Ильичу".

Встает вопрос, как понимать эти слова в разговоре заводских менеджеров, поскольку одна единица продукции не может быть дефектна на 23%. Она может быть либо годной, либо дефектной. Наверное, Струков имел в виду, что в партии большого объема содержится примерно 23% дефектных единиц продукции. Тогда возникает вопрос, а что значит "примерно"? Пусть из 100 проверенных единиц продукции 30 окажутся дефектными, или из 1000-300, или из 100000-30000 и т.д., надо ли обвинять Струкова во лжи?

Или другой пример. Монетка, которую используют как жребий, должна быть "симметричной", т.е. при ее бросании в среднем в половине случаев должен выпадать герб, а в половине случаев - решетка (решка, цифра). Но что означает "в среднем"? Если провести много серий по 10 бросаний в каждой серии, то часто будут встречаться серии, в которых монетка 4 раза выпадает гербом. Для симметричной монеты это будет происходить в 20,5% серий. А если на 100000 бросаний окажется 40000 гербов, то можно ли считать монету симметричной? Процедура принятия решений строится на основе теории вероятностей и математической статистики.

Рассматриваемый пример может показаться недостаточно серьезным. Однако это не так. Жеребьевка широко используется при организации промышленных технико-экономических экспериментов, например, при обработке результатов измерения показателя качества (момента трения) подшипников в зависимости от различных технологических факторов (влияния консервационной среды, методов подготовки подшипников перед измерением, влияния нагрузки подшипников в процессе измерения и т.п.). Допустим, необходимо сравнить качество подшипников в зависимости от результатов хранения их в разных консервационных маслах, т.е. в маслах состава и . При планировании такого эксперимента возникает вопрос, какие подшипники следует поместить в масло состава , а какие - в масло состава , но так, чтобы избежать субъективизма и обеспечить объективность принимаемого решения.

Ответ на этот вопрос может быть получен с помощью жребия. Аналогичный пример можно привести и с контролем качества любой продукции. Чтобы решить, соответствует или не соответствует контролируемая партия продукции установленным требованиям, делается выборка . По результатам контроля выборки делается заключение обо всей партии. В этом случае очень важно избежать субъективизма при формировании выборки, т.е. необходимо, чтобы каждая единица продукции в контролируемой партии имела одинаковую вероятность быть отобранной в выборку. В производственных условиях отбор единиц продукции в выборку обычно осуществляют не с помощью жребия, а по специальным таблицам случайных чисел или с помощью компьютерных датчиков случайных чисел.

Аналогичные проблемы обеспечения объективности сравнения возникают при сопоставлении различных схем организации производства , оплаты труда, при проведении тендеров и конкурсов, подбора кандидатов на вакантные должности и т.п. Всюду нужна жеребьевка или подобные ей процедуры. Поясним на примере выявления наиболее сильной и второй по силе команд при организации турнира по олимпийской системе (проигравший выбывает). Пусть всегда более сильная команда побеждает более слабую. Ясно, что самая сильная команда однозначно станет чемпионом. Вторая по силе команда выйдет в финал тогда и только тогда, когда до финала у нее не будет игр с будущим чемпионом. Если такая игра будет запланирована, то вторая по силе команда в финал не попадет. Тот, кто планирует турнир, может либо досрочно "выбить" вторую по силе команду из турнира, сведя ее в первой же встрече с лидером, либо обеспечить ей второе место , обеспечив встречи с более слабыми командами вплоть до финала. Чтобы избежать субъективизма, проводят жеребьевку. Для турнира из 8 команд вероятность того, что в финале встретятся две самые сильные команды, равна 4/7. Соответственно с вероятностью 3/7 вторая по силе команда покинет турнир досрочно.

При любом измерении единиц продукции (с помощью штангенциркуля, микрометра, амперметра и т.п.) имеются погрешности. Чтобы выяснить, есть ли систематические погрешности, необходимо сделать многократные измерения единицы продукции, характеристики которой известны (например, стандартного образца). При этом следует помнить, что кроме систематической присутствует и случайная погрешность .

Поэтому встает вопрос, как по результатам измерений узнать, есть ли систематическая погрешность . Если отмечать только, является ли полученная при очередном измерении погрешность положительной или отрицательной, то эту задачу можно свести к предыдущей. Действительно, сопоставим измерение с бросанием монеты, положительную погрешность - с выпадением герба, отрицательную - решетки (нулевая погрешность при достаточном числе делений шкалы практически никогда не встречается). Тогда проверка отсутствия систематической погрешности эквивалентна проверке симметричности монеты.

Целью этих рассуждений является сведение задачи проверки отсутствия систематической погрешности к задаче проверки симметричности монеты. Проведенные рассуждения приводят к так называемому "критерию знаков" в математической статистике.

При статистическом регулировании технологических процессов на основе методов математической статистики разрабатываются правила и планы статистического контроля процессов, направленные на своевременное обнаружение разладки технологических процессов, принятия мер к их наладке и предотвращению выпуска продукции, не соответствующей установленным требованиям. Эти меры нацелены на сокращение издержек производства и потерь от поставки некачественных единиц продукции. При статистическом приемочном контроле на основе методов математической статистики разрабатываются планы контроля качества путем анализа выборок из партий продукции. Сложность заключается в том, чтобы уметь правильно строить вероятностно-статистические модели принятия решений , на основе которых можно ответить на поставленные выше вопросы. В математической статистике для этого разработаны вероятностные модели и методы проверки гипотез, в частности, гипотез о том, что доля дефектных единиц продукции равна определенному числу , например, (вспомните слова Струкова из романа А.Н. Толстого).

Задачи оценивания . В ряде управленческих, производственных, экономических, народнохозяйственных ситуаций возникают задачи другого типа - задачи оценки характеристик и параметров распределений вероятностей.

Рассмотрим пример. Пусть на контроль поступила партия из N электроламп. Из этой партии случайным образом отобрана выборка объемом n электроламп. Возникает ряд естественных вопросов. Как по результатам испытаний элементов выборки определить средний срок службы электроламп и с какой точностью можно оценить эту характеристику? Как изменится точность , если взять выборку большего объема? При каком числе часов можно гарантировать, что не менее 90% электроламп прослужат и более часов?

Предположим, что при испытании выборки объемом электроламп дефектными оказались электроламп. Тогда возникают следующие вопросы. Какие границы можно указать для числа дефектных электроламп в партии, для уровня дефектности и т.п.?

Или при статистическом анализе точности и стабильности технологических процессов надлежит оценить такие показатели качества , как среднее значение контролируемого параметра и степень его разброса в рассматриваемом процессе. Согласно теории вероятностей в качестве среднего значения случайной величины целесообразно использовать ее математическое ожидание, а в качестве статистической характеристики разброса - дисперсию, среднее квадратическое отклонение или коэффициент вариации . Отсюда возникает вопрос: как оценить эти статистические характеристики по выборочным данным и с какой точностью это удается сделать? Аналогичных примеров можно привести очень много. Здесь важно было показать, как теория вероятностей и математическая статистика могут быть использованы в производственном менеджменте при принятии решений в области статистического управления качеством продукции.

Что такое "математическая статистика" ? Под математической статистикой понимают "раздел математики, посвященный математическим методам сбора, систематизации, обработки и интерпретации статистических данных, а также использование их для научных или практических выводов. Правила и процедуры математической статистики опираются на теорию вероятностей, позволяющую оценить точность и надежность выводов, получаемых в каждой задаче на основании имеющегося статистического материала" [ [ 2.2 ] , с. 326]. При этом статистическими данными называются сведения о числе объектов в какой-либо более или менее обширной совокупности, обладающих теми или иными признаками.

По типу решаемых задач математическая статистика обычно делится на три раздела: описание данных, оценивание и проверка гипотез.

По виду обрабатываемых статистических данных математическая статистика делится на четыре направления:

  • одномерная статистика (статистика случайных величин), в которой результат наблюдения описывается действительным числом;
  • многомерный статистический анализ, где результат наблюдения над объектом описывается несколькими числами (вектором);
  • статистика случайных процессов и временных рядов, где результат наблюдения - функция;
  • статистика объектов нечисловой природы, в которой результат наблюдения имеет нечисловую природу, например, является множеством (геометрической фигурой), упорядочением или получен в результате измерения по качественному признаку.

Исторически первыми появились некоторые области статистики объектов нечисловой природы (в частности, задачи оценивания доли брака и проверки гипотез о ней) и одномерная статистика . Математический аппарат для них проще, поэтому на их примере обычно демонстрируют основные идеи математической статистики.

Лишь те методы обработки данных, т.е. математической статистики, являются доказательными, которые опираются на вероятностные модели соответствующих реальных явлений и процессов. Речь идет о моделях поведения потребителей, возникновения рисков, функционирования технологического оборудования, получения результатов эксперимента, течения заболевания и т.п. Вероятностную модель реального явления следует считать построенной, если рассматриваемые величины и связи между ними выражены в терминах теории вероятностей. Соответствие вероятностной модели реальности, т.е. ее адекватность , обосновывают, в частности, с помощью статистических методов проверки гипотез.

Невероятностные методы обработки данных являются поисковыми, их можно использовать лишь при предварительном анализе данных, так как они не дают возможности оценить точность и надежность выводов, полученных на основании ограниченного статистического материала.

Вероятностные и статистические методы применимы всюду, где удается построить и обосновать вероятностную модель явления или процесса. Их применение обязательно, когда сделанные на основе выборочных данных выводы переносятся на всю совокупность (например, с выборки на всю партию продукции).

В конкретных областях применений используются как вероятностно- статистические методы широкого применения, так и специфические. Например, в разделе производственного менеджмента, посвященного статистическим методам управления качеством продукции, используют прикладную математическую статистику (включая планирование экспериментов). С помощью ее методов проводится статистический анализ точности и стабильности технологических процессов и статистическая оценка качества. К специфическим относятся методы статистического приемочного контроля качества продукции, статистического регулирования технологических процессов, оценки и контроля надежности и др.

Широко применяются такие прикладные вероятностно-статистические дисциплины, как теория надежности и теория массового обслуживания. Содержание первой из них ясно из названия, вторая занимается изучением систем типа телефонной станции, на которую в случайные моменты времени поступают вызовы - требования абонентов, набирающих номера на своих телефонных аппаратах. Длительность обслуживания этих требований, т.е. длительность разговоров, также моделируется случайными величинами. Большой вклад в развитие этих дисциплин внесли член-корреспондент АН СССР А.Я. Хинчин (1894-1959), академик АН УССР Б.В. Гнеденко (1912-1995) и другие отечественные ученые.

Коротко об истории математической статистики . Математическая статистика как наука начинается с работ знаменитого немецкого математика Карла Фридриха Гаусса (1777-1855), который на основе теории вероятностей исследовал и обосновал метод наименьших квадратов , созданный им в 1795 г. и примененный для обработки астрономических данных (с целью уточнения орбиты малой планеты Церера). Его именем часто называют одно из наиболее популярных распределений вероятностей - нормальное, а в теории случайных процессов основной объект изучения - гауссовские процессы.

В конце XIX в. - начале ХХ в. крупный вклад в математическую статистику внесли английские исследователи, прежде всего К. Пирсон (1857-1936) и Р.А. Фишер (1890-1962). В частности, Пирсон разработал критерий "хи-квадрат" проверки статистических гипотез, а Фишер - дисперсионный анализ , теорию планирования эксперимента, метод максимального правдоподобия оценки параметров.

В 30-е годы ХХ в. поляк Ежи Нейман (1894-1977) и англичанин Э. Пирсон развили общую теорию проверки статистических гипотез, а советские математики академик А.Н. Колмогоров (1903-1987) и член-корреспондент АН СССР Н.В. Смирнов (1900-1966) заложили основы непараметрической статистики. В сороковые годы ХХ в. румын А. Вальд (1902-1950) построил теорию последовательного статистического анализа.

Математическая статистика бурно развивается и в настоящее время. Так, за последние 40 лет можно выделить четыре принципиально новых направления исследований [ [ 2.16 ] ]:

  • разработка и внедрение математических методов планирования экспериментов;
  • развитие статистики объектов нечисловой природы как самостоятельного направления в прикладной математической статистике;
  • развитие статистических методов, устойчивых по отношению к малым отклонениям от используемой вероятностной модели;
  • широкое развертывание работ по созданию компьютерных пакетов программ, предназначенных для проведения статистического анализа данных.

Вероятностно-статистические методы и оптимизация . Идея оптимизации пронизывает современную прикладную математическую статистику и иные статистические методы . А именно - методы планирования экспериментов, статистического приемочного контроля, статистического регулирования технологических процессов и др. С другой стороны, оптимизационные постановки в теории принятия решений , например, прикладная теория оптимизации качества продукции и требований стандартов, предусматривают широкое использование вероятностно-статистических методов, прежде всего прикладной математической статистики.

В производственном менеджменте, в частности, при оптимизации качества продукции и требований стандартов особенно важно применять статистические методы на начальном этапе жизненного цикла продукции, т.е. на этапе научно-исследовательской подготовки опытно-конструкторских разработок (разработка перспективных требований к продукции, аванпроекта, технического задания на опытно-конструкторскую разработку). Это объясняется ограниченностью информации, доступной на начальном этапе жизненного цикла продукции, и необходимостью прогнозирования технических возможностей и экономической ситуации на будущее. Статистические методы должны применяться на всех этапах решения задачи оптимизации - при шкалировании переменных, разработке математических моделей функционирования изделий и систем, проведении технических и экономических экспериментов и т.д.

В задачах оптимизации, в том числе оптимизации качества продукции и требований стандартов, используют все области статистики. А именно - статистику случайных величин, многомерный статистический анализ , статистику случайных процессов и временных рядов, статистику объектов нечисловой природы. Выбор статистического метода для анализа конкретных данных целесообразно проводить согласно рекомендациям [

Под математической статистикой понимают «раздел математики, посвященный математическим методам сбора, систематизации, обработки и интерпретации статистических данных, а также использование их для научных или практических выводов. Правила и процедуры математической статистики опираются на теорию вероятностей, позволяющую оценить точность и надежность выводов, получаемых в каждой задаче на основании имеющегося статистического материала» . При этом статистическими данными называются сведения о числе объектов в какой-либо более или менее обширной совокупности, обладающих теми или иными признаками.

По типу решаемых задач математическая статистика обычно делится на три раздела: описание данных, оценивание и проверка гипотез.

По виду обрабатываемых статистических данных математическая статистика делится на четыре направления:

— одномерная статистика (статистика случайных величин), в которой результат наблюдения описывается действительным числом;

— многомерный статистический анализ, где результат наблюдения над объектом описывается несколькими числами (вектором);

— статистика случайных процессов и временных рядов, где результат наблюдения – функция;

— статистика объектов нечисловой природы, в которой результат наблюдения имеет нечисловую природу, например, является множеством (геометрической фигурой), упорядочением или получен в результате измерения по качественному признаку.

Исторически первой появились некоторые области статистики объектов нечисловой природы (в частности, задачи оценивания доли брака и проверки гипотез о ней) и одномерная статистика. Математический аппарат для них проще, поэтому на их примере обычно демонстрируют основные идеи математической статистики.

Лишь те методы обработки данных, т.е. математической статистики, являются доказательными, которые опираются на вероятностные модели соответствующих реальных явлений и процессов. Речь идет о моделях поведения потребителей, возникновения рисков, функционирования технологического оборудования, получения результатов эксперимента, течения заболевания и т.п. Вероятностную модель реального явления следует считать построенной, если рассматриваемые величины и связи между ними выражены в терминах теории вероятностей.

Соответствие вероятностной модели реальности, т.е. ее адекватность, обосновывают, в частности, с помощью статистических методов проверки гипотез.

Невероятностные методы обработки данных являются поисковыми, их можно использовать лишь при предварительном анализе данных, так как они не дают возможности оценить точность и надежность выводов, полученных на основании ограниченного статистического материала.

Вероятностные и статистические методы применимы всюду, где удается построить и обосновать вероятностную модель явления или процесса. Их применение обязательно, когда сделанные на основе выборочных данных выводы переносятся на всю совокупность (например, с выборки на всю партию продукции).

В конкретных областях применений используются как вероятностно-статистические методы широкого применения, так и специфические. Например, в разделе производственного менеджмента, посвященного статистическим методам управления качеством продукции, используют прикладную математическую статистику (включая планирование экспериментов). С помощью ее методов проводится статистический анализ точности и стабильности технологических процессов и статистическая оценка качества. К специфическим методам относятся методы статистического приемочного контроля качества продукции, статистического регулирования технологических процессов, оценки и контроля надежности и др.

Широко применяются такие прикладные вероятностно-статистические дисциплины, как теория надежности и теория массового обслуживания. Содержание первой из них ясно из названия, вторая занимается изучением систем типа телефонной станции, на которую в случайные моменты времени поступают вызовы — требования абонентов, набирающих номера на своих телефонных аппаратах. Длительность обслуживания этих требований, т.е. длительность разговоров, также моделируется случайными величинами. Большой вклад в развитие этих дисциплин внесли член-корреспондент АН СССР А.Я. Хинчин (1894-1959), академик АН УССР Б.В.Гнеденко (1912-1995) и другие отечественные ученые.


Содержание.

1) Введение:
- Как используются теория вероятностей и математическая статистика? - стр. 2
- Что такое «математическая статистика»? - стр. 3
2) Примеры применения теории вероятностей и математической статистики:
- Выборка. - стр. 4
- Задачи оценивания. – стр. 6
- Вероятностно-статистические методы и оптимизация. – стр. 7
3) Заключение.

Введение.

Как используются теория вероятностей и математическая статистика? Эти дисциплины – основа вероятностно-статистических методов принятия решений. Чтобы воспользоваться их математическим аппаратом, необходимо задачи принятия решений выразить в терминах вероятностно-статистических моделей. Применение конкретного вероятностно-статистического метода принятия решений состоит из трех этапов:
- переход от экономической, управленческой, технологической реальности к абстрактной математико- статистической схеме, т.е. построение вероятностной модели системы управления, технологического процесса, процедуры принятия решений, в частности по результатам статистического контроля, и т.п.
- проведение расчетов и получение выводов чисто математическими средствами в рамках вероятностной модели;
- интерпретация математико- статистических выводов применительно к реальной ситуации и принятие соответствующего решения (например, о соответствии или несоответствии качества продукции установленным требованиям, необходимости наладки технологического процесса и т.п.), в частности, заключения (о доле дефектных единиц продукции в партии, о конкретном виде законов распределения контролируемых параметров технологического процесса и др.).

Математическая статистика использует понятия, методы и результаты теории вероятностей. Рассмотрим основные вопросы построения вероятностных моделей принятия решений в экономических, управленческих, технологических и иных ситуациях. Для активного и правильного использования нормативно-технических и инструктивно-методических документов по вероятностно-статистическим методам принятия решений нужны предварительные знания. Так, необходимо знать, при каких условиях следует применять тот или иной документ, какую исходную информацию необходимо иметь для его выбора и применения, какие решения должны быть приняты по результатам обработки данных и т.д.

Что такое «математическая статистика»? Под математической статистикой понимают «раздел математики, посвященный математическим методам сбора, систематизации, обработки и интерпретации статистических данных, а также использование их для научных или практических выводов. Правила и процедуры математической статистики опираются на теорию вероятностей, позволяющую оценить точность и надежность выводов, получаемых в каждой задаче на основании имеющегося статистического материала». При этом статистическими данными называются сведения о числе объектов в какой-либо более или менее обширной совокупности, обладающих теми или иными признаками.

По типу решаемых задач математическая статистика обычно делится на три раздела: описание данных, оценивание и проверка гипотез.

По виду обрабатываемых статистических данных математическая статистика делится на четыре направления:

Одномерная статистика (статистика случайных величин), в которой результат наблюдения описывается действительным числом;

Многомерный статистический анализ, где результат наблюдения над объектом описывается несколькими числами (вектором);

Статистика случайных процессов и временных рядов, где результат наблюдения – функция;

Статистика объектов нечисловой природы, в которой результат наблюдения имеет нечисловую природу, например, является множеством (геометрической фигурой), упорядочением или получен в результате измерения по качественному признаку.

Примеры применения теории вероятностей и математической статистики.
Рассмотрим несколько примеров, когда вероятностно- статистические модели являются хорошим инструментом для решения управленческих, производственных, экономических, народнохозяйственных задач. Так, например, монетка, которую используют как жребий, должна быть «симметричной», т.е. при ее бросании в среднем в половине случаев должен выпадать герб, а в половине случаев – решетка (решка, цифра). Но что означает «в среднем»? Если провести много серий по 10 бросаний в каждой серии, то часто будут встречаться серии, в которых монетка 4 раза выпадает гербом. Для симметричной монеты это будет происходить в 20,5% серий. А если на 100000 бросаний окажется 40000 гербов, то можно ли считать монету симметричной? Процедура принятия решений строится на основе теории вероятностей и математической статистики.

Рассматриваемый пример может показаться недостаточно серьезным. Однако это не так. Жеребьевка широко используется при организации промышленных технико-экономических экспериментов, например, при обработке результатов измерения показателя качества (момента трения) подшипников в зависимости от различных технологических факторов (влияния консервационной среды, методов подготовки подшипников перед измерением, влияния нагрузки подшипников в процессе измерения и т.п.). Допустим, необходимо сравнить качество подшипников в зависимости от результатов хранения их в разных консервационных маслах, т.е. в маслах состава А и В. При планировании такого эксперимента возникает вопрос, какие подшипники следует поместить в масло состава А, а какие – в масло состава В, но так, чтобы избежать субъективизма и обеспечить объективность принимаемого решения.

Выборка
Ответ на этот вопрос может быть получен с помощью жребия. Аналогичный пример можно привести и с контролем качества любой продукции. Чтобы решить, соответствует или не соответствует контролируемая партия продукции установленным требованиям, из нее отбирается выборка. По результатам контроля выборки делается заключение о всей партии. В этом случае очень важно избежать субъективизма при формировании выборки, т.е необходимо, чтобы каждая единица продукции в контролируемой партии имела одинаковую вероятность быть отобранной в выборку. В производственных условиях отбор единиц продукции в выборку обычно осуществляют не с помощью жребия, а по специальным таблицам случайных чисел или с помощью компьютерных датчиков случайных чисел.
Аналогичные проблемы обеспечения объективности сравнения возникают при сопоставлении различных схем организации производства, оплаты труда, при проведении тендеров и конкурсов, подбора кандидатов на вакантные должности и т.п. Всюду нужна жеребьевка или подобные ей процедуры. Поясним на примере выявления наиболее сильной и второй по силе команды при организации турнира по олимпийской системе (проигравший выбывает). Пусть всегда более сильная команда побеждает более слабую. Ясно, что самая сильная команда однозначно станет чемпионом. Вторая по силе команда выйдет в финал тогда и только тогда, когда до финала у нее не будет игр с будущим чемпионом. Если такая игра будет запланирована, то вторая по силе команда в финал не попадет. Тот, кто планирует турнир, может либо досрочно «выбить» вторую по силе команду из турнира, сведя ее в первой же встрече с лидером, либо обеспечить ей второе место, обеспечив встречи с более слабыми командами вплоть до финала. Чтобы избежать субъективизма, проводят жеребьевку. Для турнира из 8 команд вероятность того, что в финале встретятся две самые сильные команды, равна 4/7. Соответственно с вероятностью 3/7 вторая по силе команда покинет турнир досрочно.
При любом измерении единиц продукции (с помощью штангенциркуля, микрометра, амперметра и т.п.) имеются погрешности. Чтобы выяснить, есть ли систематические погрешности, необходимо сделать многократные измерения единицы продукции, характеристики которой известны (например, стандартного образца). При этом следует помнить, что кроме систематической погрешности присутствует и случайная погрешность.

Поэтому встает вопрос, как по результатам измерений узнать, есть л систематическая погрешность. Если отмечать только, является ли полученная при очередном измерении погрешность положительной или отрицательной, то эту задачу можно свести к предыдущей. Действительно, сопоставим измерение с бросанием монеты, положительную погрешность – с выпадением герба, отрицательную – решетки (нулевая погрешность при достаточном числе делений шкалы практически никогда не встречается). Тогда проверка отсутствия систематической погрешности эквивалентна проверке симметричности монеты.

Целью этих рассуждений является сведение задачи проверки отсутствия систематической погрешности к задаче проверки симметричности монеты. Проведенные рассуждения приводят к так называемому «критерию знаков» в математической статистике.
«Критерий знаков» (sign test) - статистический критерий, позволяющий проверить нулевую гипотезу, что выборка подчиняется биномиальному распределению с параметром p=1/2 . Критерий знаков можно использовать как непараметрический статистический критерий для проверки гипотезы равенства медианы заданному значению (в частности, нулю), а также отсутствия сдвига (отсутствия эффекта обработки) в двух связных выборках. Он также позволяет проверять гипотезу симметричности распределения, однако для этого существуют и более мощные критерии - одновыборочный критерий Уилкоксона и его модификации.

При статистическом регулировании технологических процессов на основе методов математической статистики разрабатываются правила и планы статистического контроля процессов, направленные на своевременное обнаружение разладки технологических процессов и принятия мер к их наладке и предотвращению выпуска продукции, не соответствующей установленным требованиям. Эти меры нацелены на сокращение издержек производства и потерь от поставки некачественных единиц продукции. При статистическом приемочном контроле на основе методов математической статистики разрабатываются планы контроля качества путем анализа выборок из партий продукции. Сложность заключается в том, чтобы уметь правильно строить вероятностно-статистические модели принятия решений, на основе которых можно ответить на поставленные выше вопросы. В математической статистике для этого разработаны вероятностные модели и методы проверки гипотез, в частности, гипотез о том, что доля дефектных единиц продукции равна определенному числу р0, например, р0 = 0,23.

Задачи оценивания.
В ряде управленческих, производственных, экономических, народнохозяйственных ситуаций возникают задачи другого типа – задачи оценки характеристик и параметров распределений вероятностей.

Рассмотрим пример. Пусть на контроль поступила партия из N электроламп. Из этой партии случайным образом отобрана выборка объемом n электроламп. Возникает ряд естественных вопросов. Как по результатам испытаний элементов выборки определить средний срок службы электроламп и с какой точностью можно оценить эту характеристику? Как изменится точность, если взять выборку большего объема? При каком числе часов Т можно гарантировать, что не менее 90% электроламп прослужат Т и более часов?

Предположим, что при испытании выборки объемом n электроламп дефектными оказались Х электроламп. Тогда возникают следующие вопросы. Какие границы можно указать для числа D дефектных электроламп в партии, для уровня дефектности D/N и т.п.?

Или при статистическом анализе точности и стабильности технологических процессов надлежит оценить такие показатели качества, как среднее значение контролируемого параметра и степень его разброса в рассматриваемом процессе. Согласно теории вероятностей в качестве среднего значения случайной величины целесообразно использовать ее математическое ожидание, а в качестве статистической характеристики разброса – дисперсию, среднее квадратическое отклонение или коэффициент вариации. Отсюда возникает вопрос: как оценить эти статистические характеристики по выборочным данным и с какой точностью это удается сделать? Аналогичных примеров можно привести очень много. Здесь важно было показать, как теория вероятностей и математическая статистика могут быть использованы в производственном менеджменте при принятии решений в области статистического управления качеством продукции.

Вероятностно-статистические методы и оптимизация. Идея оптимизации пронизывает современную прикладную математическую статистику и иные статистические методы. А именно, методы планирования экспериментов, статистического приемочного контроля, статистического регулирования технологических процессов и др. С другой стороны, оптимизационные постановки в теории принятия решений, например, прикладная теория оптимизации качества продукции и требований стандартов, предусматривают широкое использование вероятностно-статистических методов, прежде всего прикладной математической статистики.

В производственном менеджменте, в частности, при оптимизации качества продукции и требований стандартов особенно важно применять статистические методы на начальном этапе жизненного цикла продукции, т.е. на этапе научно-исследовательской подготовки опытно-конструкторских разработок (разработка перспективных требований к продукции, аванпроекта, технического задания на опытно-конструкторскую разработку). Это объясняется ограниченностью информации, доступной на начальном этапе жизненного цикла продукции, и необходимостью прогнозирования технических возможностей и экономической ситуации на будущее. Статистические методы должны применяться на всех этапах решения задачи оптимизации – при шкалировании переменных, разработке математических моделей функционирования изделий и систем, проведении технических и экономических экспериментов и т.д.

В задачах оптимизации, в том числе оптимизации качества продукции и требований стандартов, используют все области статистики. А именно, статистику случайных величин, многомерный статистический анализ, статистику случайных процессов и временных рядов, статистику объектов нечисловой природы. Выбор статистического метода для анализа конкретных данных целесообразно проводить согласно рекомендациям.

Заключение.
В
и т.д.................