Docsity
Docsity

Prepare for your exams
Prepare for your exams

Study with the several resources on Docsity


Earn points to download
Earn points to download

Earn points by helping other students or get them with a premium plan


Guidelines and tips
Guidelines and tips

Energy eprovement rdre, Exercises of Energy Efficiency

hjjkj jikhk orgdgnasdfjkgh ;sdflksdfm magsdklgsd;ifn sdfjjglskdfm sfdsg

Typology: Exercises

2019/2020

Uploaded on 02/16/2020

roman-lebedev
roman-lebedev 🇺🇸

1 document

1 / 15

Toggle sidebar

This page cannot be seen from the preview

Don't miss anything!

bg1
Ми ни ст ер ств о образова ни я Ро сс ий ск ой Ф ед ер ац ии
Мо ск ов ск ий госуда рс тв ен ны й ун ив ер си те т печа ти
Факультет полиграфической технологии
Дисциплина: Математика
Курсовая работа по теме:
«Статистические методы обработки
Экспериментальных данных»
Выполнил: студент
Курс 2
Группа ЗТПМ
форма обучения заочная
Номер зачетной книжки Мз 023 н
Вариант № 13
Допущено к защите
Дата защиты
Результат защиты
Подпись преподавателя
Москва – 2010 год
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff

Partial preview of the text

Download Energy eprovement rdre and more Exercises Energy Efficiency in PDF only on Docsity!

Министерство образования Российской Федерации Московский государственный университет печати

Факультет полиграфической технологии

Дисциплина: Математика

Курсовая работа по теме: «Статистические методы обработки Экспериментальных данных»

Выполнил: студент

Курс 2

Группа ЗТПМ

форма обучения заочная

Номер зачетной книжки Мз 023 н

Вариант № 13

Допущено к защите

Дата защиты

Результат защиты

Подпись преподавателя

Москва – 2010 год

0;3 3;6 6;9 9;12 12;15 15;18 18; 4 6 9 11 14 18 13 21;24 24;27 27;30 30; 11 7 4 3

1. Построение интервального и точечного статистических

распределений результатов наблюдений. Построение

полигона и гистограммы относительных частот.

i – порядковый номер; Ii – интервал разбиения; xi – середина интервала Ii; ni – частота (количество результатов наблюдений, принадлежащих данному интервалу Ii); wi =

ni

n (^) - относительная частота (n = ∑^ ni (^) - объём выборки); Hi =

wi

h - плотность относительной частоты (h – шаг разбиения, т.е. длина

интервала Ii). Объём выборки: n = ∑^

ni

=100, wi = ni/1 00 ; контроль: ∑^

wi

= Длина интервала разбиения (шаг): h = 3 , Hi =

wi

: 100 1, Статистическим распределением называется соответствие между результатами наблюдений (измерений) и их частотами и относительными частотами.

Интервальное распределение – это наборы троек (Ii ; ni ; wi) для всех номеров i, а

точечное – наборы троек (xi ; ni ; wi). Таким образом, в таблице имеются оба – и

интервальное, и точечное - статистическое распределения. Далее, строим полигон и гистограмму относительных частот.

i Ii xi ni wi Hi

Полигон относительных частот – ломаная, отрезки которой последовательно (в

порядке возрастания xi) соединяют точки (xi ; wi). Гистограмма относительных

частот – фигура, которая строится следующим образом: на каждом интервале Ii, как на основании, строится прямоугольник, площадь которого равна относительной

частоте wi; отсюда следует, что высота этого прямоугольника равна Hi = wi/h –

плотности относительной частоты. Полигон и гистограмма являются формами графического изображения статистического распределения.

2. Нахождение точечных оценок математического ожидания и

дисперсии.

В качестве точечных оценок числовых характеристик изучаемой случайной величины используются:

  • для математического ожидания x (^) =

n

i xi ni =∑ i

xi wi

( выборочная

средняя ),

  • для дисперсии

s^2 =

n − 1

i ( xi −^ x ) 2

ni

( исправленная выборочная ),

где n – объём выборки, ni – частота значения xi. Таким образом, в статистических расчетах используют приближенные равенства MX  x^ , DX  s^2. Нахождение точечных оценок математического ожидания и дисперсии по данным варианта осуществим с помощью расчетной таблицы. x (^) =

n

i xi ni =∑ i

xi wi

хini/100 = 1590/100= 15, s^2 =

n − 1

i ( xi −^ x )

2 n

i

= 5324,04/99=53,: 100 1590 5324, i xi ni xi ni (^) (xi - x^ )^2 ni 1 2 3 4 5 6 7 8 9 1 0 1 1 1,

  1. 5 7, 10, 13, 16, 19, 22, 25, 28, 31,

3.Выдвижение гипотезы о распределении случайной величины.

При выдвижении гипотезы (предположения) о законе распределения изучаемой случайной величины мы опираемся лишь на внешний вид статистического распределения. Т.е. будем руководствоваться тем, что профиль графика плотности теоретического распределения должен соответствовать профилю гистограммы: если середины верхних сторон прямоугольников, образующих гистограмму, соединить плавной кривой, то эта линия представляет в первом приближении график плотности распределения вероятностей. Итак, изобразим график и выпишем формулу плотности нормального (или гауссовского) распределения с параметрами а и , -   а  + , Сравнение построенной гистограммы и графика плотности распределения приводит к следующему заключению о предполагаемом (теоретическом) законе распределения в рассматриваемом варианте исходных данных:

Вариант 13 – нормальное (или гауссовское распределение)

4.Построение графика теоретической плотности распределения.

Чтобы выписать плотность теоретического (предполагаемого) распределения, нужно определить значения параметров и а и подставить их в соответствующую формулу. Все параметры тесно связаны с числовыми характеристиками случайной величины, т.е. MX = а , DX = σ^2 Поскольку значения математического ожидания и дисперсии неизвестны, то их заменяют соответствующими точечными оценками, т.е. используют (уже упомянутые ранее) приближенные равенства MX  x^ , DX  s^2 , что позволяет найти значения параметров распределения. По исходным данным была выдвинута гипотеза о нормальном распределении изучаемой случайной величины. Найдем параметры этого распределения: _ x = а, 15,9 = а, а=15, s^2 = σ^2 53,78 = σ^2 σ=7,

5.Проверка гипотезы о распределении с помощью критерия

согласия Пирсона.

Ранее была выдвинута гипотеза о законе распределения рассматриваемой случайной величины. Сопоставление статистического распределения (гистограмма) и предполагаемого теоретического (графика плотности) показывает наличие некоторых расхождений между ними. Поэтому возникает естественный вопрос: чем объясняются эти несовпадения? Ответить на него можно двояко:

  1. Указанные расхождения несущественны и вызваны ограниченным количеством наблюдений и случайными факторами – случайностью результата единичного наблюдения, способа группировки данных и т.п. В этом случае выдвинутая гипотеза о распределении считается правдоподобной и принимается как не противоречащая опытным данным.
  2. Указанные расхождения являются существенными (неслучайными) и связаны с тем, что действительное распределение случайной величины отличается от предполагаемого. В этом случае выдвинутая гипотеза о распределении отвергается как плохо согласующаяся данными наблюдений. Для выбора первого или второго варианта ответа и служат так называемые критерии согласия. Словари толкуют слово критерий (от греч. kriterion – средство для суждения) как признак, на основании которого производится оценка, определение и классификация чего-либо. Существуют различные критерии согласия: К. Пирсона, А.Н. Колмогорова, Н.В. Смирнова, В.И. Романовского и другие. Мы рассмотрим лишь один из них – критерий Пирсона, называемый также критерием ^2 («хи - квадрат»). (К. Пирсон хи - квадрат»). (К. Пирсон (1857 - 1936) – английский математик, биолог, философ – позитивист.) 0 0, 0, 0, 0, 0, 0, 0, 0, 2,2 4,2 6,2 8,2 10,2 12,2 14,2 16,2 18,2 20,2 22,

Критерий Пирсона выгодно отличается от остальных, во – первых, применимостью к любым (дискретным, непрерывным) распределениям и, во – вторых, простотой вычислительного алгоритма. Правило проверки статистических гипотез с помощью критерия Пирсона будет объяснено на примерах.

Группировка исходных данных.

Применяется критерий Пирсона к сгруппированным данным. Предположим, что произведено n независимых опытов, в каждом из которых изучаемая случайная величина приняла определенное значение. Предположим, что вся числовая ось разбита на несколько непересекающихся промежутков (интервалов и полуинтервалов). Обозначим через I количество результатов измерений (значений случайной величины), попавших в i-й промежуток. Очевидно, что I = n. Отметим, что критерий ^2 будет давать удовлетворительный для практических приложений результат, если:

  1. количество n опытов достаточно велико, по крайней мере n100;
  2. в каждом промежутке окажется не менее 5…10 результатов измерений, т.е. i 5 при любом i; если количество полученных значений в отдельных промежутках мало (меньше 5), то такие промежутки следует объединить с соседними, суммируя соответствующие частоты. Пусть концами построенного разбиения являются точки zi , где z 1  z 2  …  zi
  • 1 , т.е. само разбиение имеет вид (-   z 0 ; z 1 ) ,  z 1 ; z 2 ) ,  z 2 ; z 3 ) , … ,  zi – 1; zi   ). После объединения соответствующих промежутков (последних двух) и замены самой левой границы разбиения на - , а самой правой на +  (поскольку на промежутки должна разбиваться вся числовая ось, а не только диапазон полученных в результате опыта значений), мы приходим к следующим интервальным распределениям, пригодным для непосредственного применения критерия Пирсона:

zi –1; zi -^ ;^6 6;9^ 9;12^ 12;15^ 15;18^ 18;

 i 10 9 11 14 18 13

Вычисление теоретических частот. Критерий Пирсона основан на сравнении эмпирических (опытных) частот с теоретическими. Эмпирические частоты I определяются по фактическим

результатам наблюдений. Теоретические частоты, обозначаемые далее νi

' , находятся с помощью равенства

νi

'

= n  pi ,

Статистика ^2 и вычисление ее значения по опытным данным. Для того чтобы принять или отвергнуть гипотезу о законе распределения изучаемой случайной величины, в каждом из критериев согласия рассматривается некоторая (специальным образом подбираемая) величина, характеризующая степень расхождения теоретического (предполагаемого) и статистического распределения. В критерии Пирсона в качестве такой меры расхождения используется величина χ^2 = (^) ∑ i ( νi −^ νi ' ) 2 νi ' , называемая статистикой «хи - квадрат» или статистикой Пирсона (вообще, статистикой называют любую функцию от результатов наблюдений). Ясно, что

всегда ^2 , причем ^2 = 0, тогда и только тогда, когда νi^ =^ νi

' при каждом i , т.е. когда все соответствующие эмпирические и теоретические частоты совпадают. Во всех остальных случаях ^2 ; при этом значение ^2 тем больше, чем больше различаются эмпирические и теоретические частоты. Прежде чем рассказать о применении статистики ^2 к проверке гипотезы о закон е распределения , вычислим ее значение для данного варианта; это значение, найденное по данным наблюдений и в рамках выдвинутой гипотезы, будем обозначать через ^2 набл..

i  i νi

' (^ νi −^ νi ' ) 2 νi^ ' 1 2 3 4 5 6 7 8 9 10

Σ (^) : 100 100 0,

2

набл. = 0,

5.4. Распределение статистики ^2. Случайная величина имеет ^2 – распределение с r степенями свободы (r = 1; 2; 3; …), если ее плотность имеет вид

κr = ¿ { cr x

r 2 − 1 ex 2 , при x ≻ 0, ¿ ¿ ¿ где cr – которая положительная постоянная ( cr определяется из равенства ∫ − ∞

κr ( x ) dx = 1

). Случайная величина, имеющая распределение ^2 с r степенями свободы, будет обозначаться χr 2 . Для дальнейшего изложения важно лишь отметить, что, во – первых,

распределение χ

2 определяется одним параметром – числом r степеней свободы и, во – вторых, существуют таблицы, позволяющие произвольно найти вероятность попадания значений случайной величины χr 2 в любой промежуток. Вернемся теперь к статистике χ^2 = (^) ∑ i ( νi −^ νi ' ) 2 νi^ '. Отметим, что она является случайной величиной, поскольку зависит от результатов наблюдений и, следовательно, в различных сериях опытов принимает различные, заранее не

известные значения. Понятно, кроме того, закон распределения статистики χ

2 зависит: 1) от действительного (но неизвестного нам) закона распределения случайной величины, измерения которой осуществляются (им определяются эмпирические частоты

νi

) ; 2) от количества произведенных наблюдений (от числа n) и от способа разбиения числовой оси на промежутки (в частности, от числа i ); 3) от теоретического (выдвинутого в качестве гипотезы) закона распределения изучаемой случайной величины (им определяются теоретические вероятности pi и

теоретические частоты νi

'

= n  pi )

Если выдвинутая гипотеза верна, то очевидно, закон распределения статистики

2 зависти только от закона распределения изучаемой случайной величины, от числа n и от выбора промежутков разбиения. Но на самом же деле, в этом случае

(благодаря мастерски подобранному Пирсоном выражению для χ

2 ) справедливо куда более серьезное утверждение. А именно, при достаточно больших n закон

распределения статистики χ

2 практически не зависит от закона распределения изучаемой случайной величины и ни от количества n произведенных опытов: при

n → ∞ распределение статистики χ

2

стремится к χ

2

- распределению с r степенями свободы. Эта теорема объясняет, почему статистика Пирсона

обозначается через χ

2 . Если в качестве предполагаемого выбрано одно их трех основных непрерывных распределений (нормальное, показательное или равномерное), то r = i – 3, где i – количество промежутков, на которые разбита числовая ось (количество групп опытных данных). В общем случае

r = i − Ν пар − 1 ,

где

Νпар

  • количество параметров предполагаемого (теоретического) распределения, которые заменены вычисленными по опытным данным оценками. Т.е. в данном варианте после группировки исходных данных получаем количество промежутков разбиения i = 10,

Νпар

= 2, т.к. количество параметров

αΡ (^) ( χ 2 ≥ χкрит 2 ) , называется уровнем значимости.

Чтобы определить критическое значение χ

2 , поступим следующим образом. Зададим какое – либо малое значение уровня значимости α^ (как правило α^ = 0,05 или α^ = 0,01) и найдем

χкрит

2 как уровень уравнения Ρ (^ χ 2 ≥ x )^ = α

с неизвестной x. Поскольку распределение статистики χ

2 близко при n →^ ∞^ к

2

  • распределению с r степенями свободы, то Ρ (^ χ 2 ≥ x )^ ¿^ Ρ^ (^ χ^ r (^2) ≥ x ) и приближенное значение

χкрит

2 можно найти из уравнения Ρ (^) ( χr 2 ≥ x (^) ) = α ⇔ (^) ∫ x

k r ( t ) dt = α.

Геометрические соображения показывают, что последнее уравнение имеет единственное решение: его корень – это такое число x , при котором площадь

под графиком функции kr^ (^ t^ )^ (плотности χ

2

  • распределения) над участком

[ x ; + ∞ ) равна. На практике решение последнего уравнения находят с помощью

специальных таблиц, имеющихся в любом руководстве по математической статистике; эти таблицы позволяют по двум входным параметрам – уровню значимости α^ и числу степеней свободы r определить критическое значение

χкрит

2

. (Находимое таким образом критическое значение зависит, конечно, от

α и r,что при необходимости отражают и в обозначениях: χкрит

2

= χ крит

2

( r , α ) .

Зададим уровень значимости как α^ = 0,05 (условие курсовой работы). Подводя итоги, сформулируем правило проверки гипотезы о законе

распределения случайной величины с помощью χ

2

  • критерия Пирсона:
  1. Проводят n независимых наблюдений случайной величины (принято считать, что должно быть n  100).
  2. Разбивают всю числовую ось на несколько (как правило, на 8…12) промежутков (−^ ∞^ ;^ z 1 ) ,^ [^ z 1 ;^ z 2 )^ ,^ [^ z 2 ;^ z 3 )^ ,^ ..^.^ ,^ [^ zi − 1 ;^ +^ ∞^ ) так, чтобы количество измерений в каждом из них (называемое эмпирической частотой

νi

' ) оказалось не менее пяти (т.е.

νi

'  5 при каждом i).

  1. Выдвигают (например, судя по профилю гистограммы) гипотезу о законе распределения изучаемой случайной величины и находят параметры этого закона (чаще всего, заменяя математическое ожидание и дисперсию их оценками).
  2. С помощью предполагаемого (теоретического) распределения находят теоретические вероятности pi и теоретические частоты

νi

'

= n  pi

попадания значений случайной величины в i-й промежуток.

  1. По эмпирическим и теоретическим частотам вычисляют значения

статистики χ

2

, обозначаемое через 

2 набл ..

  1. Определяют число r степеней свободы.
  2. Используя заданное значение уровня значимости α^ и найденное число степеней свободы r, по таблице находят (на пересечении строки, отвечающей r, и столбца, отвечающего α^ ) критическое значение

χкрит

2 .

  1. Формулируя вывод, опираясь на основной принцип проверки статистических гипотез : если наблюдаемое значение критерия принадлежит критической области, т.е. если

χнабл

2

≥ χкрит

2 , то гипотезу отвергают как плохо согласующуюся с результатами эксперимента; если наблюдаемое значение критерия принадлежит области принятия гипотезы, т.е.

χнабл

2

≺ χ крит

2 , то гипотезу принимают как не противоречащую результатам эксперимента. 5.6. Вывод о соответствии выдвинутой гипотезы и опытных данных в варианте. Правило проверки выдвинутой гипотезы о законе распределения изучаемой случайной величины для данного варианта реализовано в таблице: Название величины Обозначение и числовое значение величины Уровень значимости (задан в условии) α (^) = 0, Количество промежутков разбиения l^ =

Число степеней свободы r=

Критическое значение (находится по таблице)

χкрит

2

Наблюдаемое значение критерия ^2 набл. = 0, ВЫВОД Гипотеза не принимается для данного 9 варианта, поскольку

χнабл

2

≺ χ крит

2 : 83,5 << 15,

Замечания: 1. Заданное значение уровня значимости α^ = 0,05 означает, что

αΡ (^) ( χ 2 ≥ χкрит 2 ) ≈^ α^ =^0 ,^^05 , т.е. вероятность события {

2

≥ χ крит

2 } очень мала. Однако это событие, обладая ненулевой вероятностью, и тогда (при α^ = 0,05 примерно в 5% случаев) будет отвергнута правильная гипотеза. Отвержение гипотезы, когда она верна, называется ошибкой первого рода. Таким образом, уровень значимости α^ - это вероятность ошибки первого рода. Отметим, что ошибкой второго рода называется принятие гипотезы в случае, когда она неверна.