Четверг, 09.05.2024
КВАДРАТ
Меню сайта
Категории раздела
Разработки [9]
Статистика

Онлайн всего: 1
Гостей: 1
Пользователей: 0
Главная » Статьи » Преподавателям » Разработки

Математическая статистика

ЛЕКЦИИ ПО ДИСЦИПЛИНЕ

« МАТЕМАТИЧЕСКАЯ СТАТИСТИКА»

 

                                            АВТОР:

САЛИТОВА Е.В.

 

СЫЗРАНЬ -2012

 

 

ЭЛЕМЕНТЫ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ

Предмет математической статистики. Выборки, выборочные распределения.

  1. Предмет и основные задачи математической статистики.

Математическая статистика – это раздел математики, опирающийся на теорию вероятностей, который имеет своим предметом изучения методы сбора, систематизации, обработки и использования статистических данных для получения научно обоснованных  и практических выводов о закономерностях окружающего мира,  и принятия решений.

При этом под статистическими данными понимается совокупность чисел, которые представляют количественные характеристики интересующих нас признаков изучаемых предметов. Соответствующие данные могут быть получены в результате наблюдений или специальных экспериментов, при этом возникают проблемы сохранения в них существенной информации, рационального математического описания, планирования эксперимента, определения необходимого объема наблюдений. Следующий важный этап – поиск взаимосвязей между показателями, с помощью которых могут быть описаны упомянутые закономерности, оценки существенных параметров и величин, интересующих исследователя. Все это характерные для математической статистики проблемы.

Примером статистических данных служит последовательность значений той или иной случайной величины, полученных в результате некоторого наблюдения или опыта. Так, последовательность чисел, которые получаются в результате неоднократного измерения некоторой величины, скажем взвешивания некоторого тела на аналитических весах, является простейшим примером статистических данных.

Рассмотрим еще один пример. С целью определения качества электрических лампочек, выпускаемых заводом, отмечают, сколько часов горит каждая лампочка до выхода из строя. Полученная совокупность чисел представляет статистические данные.

 Статистические данные по своей сущности зависят от многих случайных факторов, поэтому математическая статистика тесно связана с теорией вероятностей, которая является ее основой. Теория вероятностей устанавливает правила нахождения вероятностей суммы, произведения и других сложных событий, а также числовых характеристик (математического ожидания, дисперсии) случайных величин по заданным вероятностям и законам распределения данных событий и случайных величин. На практике же редко встречаются случаи, когда вероятности исходных событий и законы распределения рассматриваемых случайных величин были бы заранее известны. Возвращаясь  к нашему последнему примеру, отметим, что для прогнозирования запасов лампочек целесообразно иметь предварительные сведения о сроках службы выпускаемых заводом лампочек. Однако до начала производства эти сведения остаются неизвестными. В таких ситуациях используются статистические методы исследования, смысл которых состоит в том, что сведения об изучаемом признаке всей совокупности объектов получают, изучая более или менее обширную часть, должным образом отобранную из общей совокупности объектов. Так, в нашем примере из всей партии случайным образом отбирают для испытания некоторое количество лампочек. Полученные сведения о продолжительности работы отобранных лампочек представляют собой уже известные статистические данные, которые будучи обработаны методами математической статистики, позволяют сделать выводы о качестве продукции данного завода.

Среди основных задач математической статистики могут быть отмечены следующие:

  1. оценка неизвестной вероятности случайного события
  2. оценка неизвестного закона распределения случайной величины или ее числовых характеристик (математического ожидания, дисперсии)
  3. проверка гипотез, сделанных относительно некоторых случайных событий, случайных величин (о вероятности события, о законе распределения случайной величины и т.д.)

результаты проводимых исследований методами математической статистики применяются к принятию решений, в частности, при планировании и организации производства, при анализе технологических процессов, при предупредительном и приемочном контроле качества продукции, при выборе оптимального времени настройки или замены действующей аппаратуры – например, определение срока замена двигателя самолета, отделочных деталей станков и т.п.

Большое значение статистические методы изучения случайных явлений имеют в экономике, сельском хозяйстве, биологии, медицине и т.д.

Математическая статистика возникла в 18 веке в работах Я. Бернулли, П. Лапласа. Большой вклад в математическую статистику внесли русские и советские ученые В.Я. Буняковский, П.Л. Чебышев, А.А. Марков, А.Н. Колмогоров, Б.В. Гнеденко и многие другие.

В настоящее время математическая статистика продолжает бурно развиваться, при этом все больше расширяется круг ее задач и методов исследования с широким применением ЭВМ. Так, разрабатываются статистические методы распознавания образов, определения характеристик элементов автоматического управления и т. п.

  1. Основные понятия математической статистики

Пусть требуется изучить данную (как правило многочисленную) совокупность объектов относительно некоторого признака. Например, требуется определить, в какой степени параметры выпускаемых изделий соответствуют стандартным нормативам. Если число элементов в совокупности не очень большое и обследование объекта не связано с его уничтожением и не требует больших затрат, то можно исследовать каждый элемент в отдельности, фиксировать значение исследуемого признака и соответствующей обработкой результатов сделать тот или иной вывод об изучаемом признаке.

Если же совокупность состоит из очень большого числа объектов, или  исследование связано с уничтожением объекта, или  оно дорого стоит, то сплошное исследование нецелесообразно. Бессмысленно, например исследовать на срок горения все лампочки данной партии, так как в результате вся партия уничтожится. В таких случаях выводы об исследуемом признаке делаются на основе изучения ограниченного числа объектов, должным образом отобранных из общей совокупности.

Так как практически любой признак допускает количественную оценку, то, вместо того чтобы говорить о совокупности изучаемых объектов, можно говорить о значениях изучаемого признака этих объектов.

Основными понятиями математической статистики являются генеральная и выборочная совокупности.

Определение1. Генеральной совокупностью называется множество числовых значений некоторого признака всех объектов рассматриваемой совокупности. (множество всех изучаемых объектов)

Определение 2. Выборочной совокупностью или просто выборкой называется множество числовых значений некоторого признака всех объектов, случайным образом отобранных из всей совокупности рассматриваемых объектов. (объекты, отобранные для исследования из генеральной совокупности)

Например, генеральной совокупностью является совокупность чисел, соответствующих срокам службы всех лампочек выпущенной партии (эти числа в действительности остаются неизвестными) – все лампочки выпускаемые заводом, а выборочной совокупностью будет совокупность чисел, соответствующая срокам службы отобранных для испытания лампочек (определяются из проведенного опыта) – лампочки взятые для обследования.

Основную задачу математической статистики можно сформулировать как задачу получения обоснованных выводов о неизвестных свойствах генеральной совокупности по известным свойствам извлеченной из нее выборки.

Число объектов совокупности называется объемом данной совокупности. Например, если цех выпустил 2000 деталей, а для обследования отобрано 150 деталей, то объем генеральной совокупности равен 2000 (N=2000), а объем выборки 150 (n=150).

  1. Основные виды выборок.

Различают выборки с возвращением и без возвращения. Если после фиксирования значения параметра объект возвращается в генеральную совокупность и, таким образом, он может многократно повторяться в выборке, то говорят о выборке с возвращением или с повторением. Если же раз отобранный объект не возвращается и он не может больше одного раза повторяться в выборке, то такая выборка называется выборкой без возвращения или без повторения.  Когда объем выборки намного меньше объема генеральной совокупности, то различие между выборкой с повторением и без повторения практически исчезает.

Говорят, что выборка репрезентативна (представительна), если она достаточно полно представляет изучаемые признаки генеральной совокупности.

Важным условием обеспечения репрезентативности выборки является соблюдение случайности отбора, т. е. все объекты генеральной совокупности должны иметь равные вероятности попасть в выборку.

С целью обеспечения репрезентативности выборки в зависимости от конкретных условий применяются различные способы отбора: простой, типический, механический, серийный.

Простым называется отбор, при котором из генеральной совокупности случайным образом извлекается по одному элементу с возвращением или без возвращения. Например, для изучения белых медведей экспедиция ловит случайным образом попавшихся ей белых медведей, измеряет исследуемые параметры и отпускает животных на волю или сдает в зоопарк в зависимости от целей, которые стоят перед ней.

Типическим называется отбор, при котором объекты случайным образом отбираются из каждой «типической»части генеральной совокупности. Например, если детали изготовляются разными цехами, то для обеспечения репрезентативности выборки отбор производится случайным образом с соблюдением пропорций из продукции каждого цеха. Типическим отбором пользуются тогда, когда исследуемый признак существенно колеблется в различных частях генеральной совокупности.

Механическим называется отбор, при котором объекты отбираются через определенный интервал, скажем, каждый пятый, двадцатый, сотый и т.д. механическим отбором надо пользоваться осторожно. Например, если резец заменяется после тридцати обработанных деталей, то нельзя составлять выборку, отбирая каждую десятую или пятнадцатую деталь.

Серийным называется отбор, при котором выборка состоит из целой серии объектов. Этим способом пользуются в тех случаях, когда исследуемый признак в генеральной совокупности колеблется незначительно. Например, если квалификация всех рабочих цеха, качество технических средств и сырья существенно не изменяются в течение недели, то для проверки недельной продукции данного цеха можно провести сплошную проверку продукции одного дня.

Если отбор объектов из генеральной совокупности и образование выборки невозможны непосредственным манипулированием самими объектами ввиду их громоздкости, труднодоступности или по другим причинам, то объектам  генеральной совокупности присваиваются номера, которые записываются, например, на отдельных карточках, удобных для перемешивания и осуществления отбора. Путем случайного отбора карточек образуется выборка заданного объема, а потом из генеральной совокупности отбираются те объекты, номера которых совпадают с номерами карточек, попавших в выборку. Описанным способом поступают, например, при составлении тиражей выигрышных билетов в денежно-вещевых лотереях.

В научных исследованиях для формирования выборок чаще всего пользуются так называемыми таблицами случайных чисел, которые могут быть получены при помощи случайного выбора карточек или специальными алгоритмами на ЭВМ. Существуют четырехзначные, пятизначные и т.д. таблицы случайных чисел.

  1. Группировка статистических данных. Определение статистических (выборочных ) распределений.

Для установления закономерностей массовых случайных явлений изучаются статистические данные, то есть сведения, полученные путем наблюдений или экспериментов, о значениях интересующего нас признака. Рассмотрим пример обработки статистических данных. Экономист, интересующийся тарифным разрядом рабочих некоторого подразделения завода, выбрал документы 100 рабочих и выписал из них последовательность разрядов: 5,1,4,5,3,6 и т. д. эти статистические данные представляют собой выборку, которая подлежит обработке.

Изучение статистических данных обычно начинается с их группировки в порядке возрастания признака. Пусть в нашем примере после упорядочения по возрастанию получили ряд из 100 чисел

1,1,1,1,2,2,2,2,2,2,3,3,3,3,3,3,3,3,3,3,3,4,4,4,4,4….., где 1 повторяется 4 раза, 2 -6 раз, 3 – 12 раз, 4 – 16 раз, 5 – 44 раза, 6 – 18 раз.

Оперделение 3. Наблюдаемые значения рассматриваемого признака называются вариантами, а последовательность вариант, записанных в возрастающем порядке, называется выборочным или вариационным рядом.

Условимся обозначать через x1, x2, …   xk    значения вариант в данной выборке. Если x1, x2, …   xk     - вариационный ряд, т.е.

x1 < x2, <         <   xk    , то  x1 – наименьшее значение, xk    - наибольшее значение признака в данной выборке, а разность

xk    - x - называется размахом выборки.

Пусть из генеральной совокупности отобрана выборка, в которой значение x1 признака Х наблюдалось nраз, значение х2 – n2 раз, …, значение xk    - nk  раз. Если объем выборки равен n , то

                        

Определение 4. Числа n1 ,   n2 ,  n 3 , …   n k  называются частотами, а их отношения к объему выборки, т.е. wi  = ni /n , - относительными частотами соответствующих вариант

Рассматривается еще накопленная или кумулятивная частота 

 , которая показывает, сколько наблюдалось элементов выборки со значениями признака, меньшими xi

Определение 5. Отношение накопленной частоты к общему объему выборки называется относительной накопленной частотой,    .

Определение 6. Статистическим распределением выборки называется перечень вариант и соответствующих им частот или относительных частот.

В теории вероятностей изучается аналогичное понятие – закон распределения случайной величины, который записывается как правило, в виде таблицы.

X

X1

X2

….

xk

P

P1

P2

….

Pk

В первой строке указаны значения случайной величины, во второй  - соответствующие вероятности. Аналогичным образом, статистическое распределение выборки можно записать в виде таблицы:

X

X1

X2

….

xk

N

N1

N2

….

Nk

         

Примеры 1,2.

Определение 7. Выборка является репрезентативной, если относительные частоты вариант выборки близки к соответствующим относительным частотам вариант генеральной совокупности.

Пример 3.

При большом числе наблюдений и большом числе вариант удобно варианты группировать по отдельным интервалам их значений. Для этого шкала интересующего нас признака разделяется на некоторое число интервалов, и вместо отдельных вариант рассматриваются группы значений вариант, попавших в последовательно расположенные интервалы.  Число таких интервалов берется, как правило в пределах от 10 до 20. ширина интервала ∆х определяется путем деления размаха выборки на количество интервалов:

Пример 4.

  1. Геометрическое изображение статистических распределений выборки

Определение 8. Ломаная линия, отрезки которой соединяют точки (xi , ni ), называется полигоном частот.

Пример 5.

Определение 9. Полигоном относительных частот называют ломаную, отрезки которой соединяют точки (xi , wi).

Пример 6.

Если статистическое распределение выборки задается в виде последовательности интервалов значений вариант и их частот, то геометрическое изображение дается при помощи гистограммы частот.

Определение 10. Гистограммой  частот называют ступенчатую фигуру, состоящую из прямоугольников, построенных на частичных интервалах с длиной d и высотой, равной отношению ni  / d (плотность частоты на данном интервале)

Пример 7.

Числовые характеристики выборки

Для произвольной выборки можно определить ряд числовых характеристик.

  1. Выборочное и генеральное среднее.

Определение 1. Выборочным средним хв выборки объема n со статистическим распределением называется среднее арифметическое значений признака выборки, то есть:

пример 1 (9)

  1. Выборочная и генеральная дисперсии

Определение 2. Выборочной дисперсией Dв некоторой выборки называется среднее арифметическое квадратов отклонений значений  признака от выборочной средней хв

пример 2 (10)

пример 3 (11)

Дисперсию можно вычислить по формуле:

D = x2 – (x)2          то есть дисперсия равна разности среднего арифметического значений квадратов признака и квадрата среднего значения признака.

Пример 6 (12)

Статистическое оценивание неизвестных числовых характеристик событий и случайных величин

Оценивание неизвестной вероятности событий

Вероятностные характеристики события, случайной величины называются теоретическими, а их статистические аналоги – эмпирическими.

На практике, учитывая закон больших чисел, в качестве приближенного значения вероятности события принимают относительную частоту соответствующей варианты репрезентативной выборки.

Оценка неизвестных параметров распределения случайной величины

В качестве оценки математического ожидания М(х) берется выборочное среднее хв , выборочную дисперсию Dв принимают в качестве оценки дисперсии D(x) случайной величины Х.

Пример 1 (13) стр 534

Эмпирическая функция распределения

Определение 1. Функцию F(x), определяемую формулой

назовем функцией распределения выборки.

Пример 2 (14) стр. 539

Нормальный закон распределения :

Показательный закон распределения:

 

Категория: Разработки | Добавил: motherlena (27.08.2014)
Просмотров: 2871 | Теги: математическая статистика | Рейтинг: 0.0/0
Всего комментариев: 0
Имя *:
Email *:
Код *:
Форма входа
Block title
Библиотека
Поиск
Друзья сайта
  • Официальный блог
  • Сообщество uCoz
  • FAQ по системе
  • Инструкции для uCoz
  • Copyright MyCorp © 2024