









Study with the several resources on Docsity
Earn points by helping other students or get them with a premium plan
Prepare for your exams
Study with the several resources on Docsity
Earn points to download
Earn points by helping other students or get them with a premium plan
Community
Ask the community for help and clear up your study doubts
Discover the best universities in your country according to Docsity users
Free resources
Download our free guides on studying techniques, anxiety management strategies, and thesis advice from Docsity tutors
hjjkj jikhk orgdgnasdfjkgh ;sdflksdfm magsdklgsd;ifn sdfjjglskdfm sfdsg
Typology: Exercises
1 / 15
This page cannot be seen from the preview
Don't miss anything!
Министерство образования Российской Федерации Московский государственный университет печати
Курсовая работа по теме: «Статистические методы обработки Экспериментальных данных»
Вариант № 13
0;3 3;6 6;9 9;12 12;15 15;18 18; 4 6 9 11 14 18 13 21;24 24;27 27;30 30; 11 7 4 3
i – порядковый номер; Ii – интервал разбиения; xi – середина интервала Ii; ni – частота (количество результатов наблюдений, принадлежащих данному интервалу Ii); wi =
n (^) - относительная частота (n = ∑^ ni (^) - объём выборки); Hi =
интервала Ii). Объём выборки: n = ∑^
=100, wi = ni/1 00 ; контроль: ∑^
= Длина интервала разбиения (шаг): h = 3 , Hi =
: 100 1, Статистическим распределением называется соответствие между результатами наблюдений (измерений) и их частотами и относительными частотами.
интервальное, и точечное - статистическое распределения. Далее, строим полигон и гистограмму относительных частот.
Полигон относительных частот – ломаная, отрезки которой последовательно (в
частот – фигура, которая строится следующим образом: на каждом интервале Ii, как на основании, строится прямоугольник, площадь которого равна относительной
плотности относительной частоты. Полигон и гистограмма являются формами графического изображения статистического распределения.
В качестве точечных оценок числовых характеристик изучаемой случайной величины используются:
∑ i xi ni =∑ i
∑ i ( xi −^ x ) 2
где n – объём выборки, ni – частота значения xi. Таким образом, в статистических расчетах используют приближенные равенства MX x^ , DX s^2. Нахождение точечных оценок математического ожидания и дисперсии по данным варианта осуществим с помощью расчетной таблицы. x (^) =
∑ i xi ni =∑ i
хini/100 = 1590/100= 15, s^2 =
∑ i ( xi −^ x )
= 5324,04/99=53, : 100 1590 5324, i xi ni xi ni (^) (xi - x^ )^2 ni 1 2 3 4 5 6 7 8 9 1 0 1 1 1,
При выдвижении гипотезы (предположения) о законе распределения изучаемой случайной величины мы опираемся лишь на внешний вид статистического распределения. Т.е. будем руководствоваться тем, что профиль графика плотности теоретического распределения должен соответствовать профилю гистограммы: если середины верхних сторон прямоугольников, образующих гистограмму, соединить плавной кривой, то эта линия представляет в первом приближении график плотности распределения вероятностей. Итак, изобразим график и выпишем формулу плотности нормального (или гауссовского) распределения с параметрами а и , - а + , Сравнение построенной гистограммы и графика плотности распределения приводит к следующему заключению о предполагаемом (теоретическом) законе распределения в рассматриваемом варианте исходных данных:
Чтобы выписать плотность теоретического (предполагаемого) распределения, нужно определить значения параметров и а и подставить их в соответствующую формулу. Все параметры тесно связаны с числовыми характеристиками случайной величины, т.е. MX = а , DX = σ^2 Поскольку значения математического ожидания и дисперсии неизвестны, то их заменяют соответствующими точечными оценками, т.е. используют (уже упомянутые ранее) приближенные равенства MX x^ , DX s^2 , что позволяет найти значения параметров распределения. По исходным данным была выдвинута гипотеза о нормальном распределении изучаемой случайной величины. Найдем параметры этого распределения: _ x = а, 15,9 = а, а=15, s^2 = σ^2 53,78 = σ^2 σ=7,
Ранее была выдвинута гипотеза о законе распределения рассматриваемой случайной величины. Сопоставление статистического распределения (гистограмма) и предполагаемого теоретического (графика плотности) показывает наличие некоторых расхождений между ними. Поэтому возникает естественный вопрос: чем объясняются эти несовпадения? Ответить на него можно двояко:
Критерий Пирсона выгодно отличается от остальных, во – первых, применимостью к любым (дискретным, непрерывным) распределениям и, во – вторых, простотой вычислительного алгоритма. Правило проверки статистических гипотез с помощью критерия Пирсона будет объяснено на примерах.
Применяется критерий Пирсона к сгруппированным данным. Предположим, что произведено n независимых опытов, в каждом из которых изучаемая случайная величина приняла определенное значение. Предположим, что вся числовая ось разбита на несколько непересекающихся промежутков (интервалов и полуинтервалов). Обозначим через I количество результатов измерений (значений случайной величины), попавших в i-й промежуток. Очевидно, что I = n. Отметим, что критерий ^2 будет давать удовлетворительный для практических приложений результат, если:
Вычисление теоретических частот. Критерий Пирсона основан на сравнении эмпирических (опытных) частот с теоретическими. Эмпирические частоты I определяются по фактическим
' , находятся с помощью равенства
'
Статистика ^2 и вычисление ее значения по опытным данным. Для того чтобы принять или отвергнуть гипотезу о законе распределения изучаемой случайной величины, в каждом из критериев согласия рассматривается некоторая (специальным образом подбираемая) величина, характеризующая степень расхождения теоретического (предполагаемого) и статистического распределения. В критерии Пирсона в качестве такой меры расхождения используется величина χ^2 = (^) ∑ i ( νi −^ νi ' ) 2 νi ' , называемая статистикой «хи - квадрат» или статистикой Пирсона (вообще, статистикой называют любую функцию от результатов наблюдений). Ясно, что
' при каждом i , т.е. когда все соответствующие эмпирические и теоретические частоты совпадают. Во всех остальных случаях ^2 ; при этом значение ^2 тем больше, чем больше различаются эмпирические и теоретические частоты. Прежде чем рассказать о применении статистики ^2 к проверке гипотезы о закон е распределения , вычислим ее значение для данного варианта; это значение, найденное по данным наблюдений и в рамках выдвинутой гипотезы, будем обозначать через ^2 набл..
' (^ νi −^ νi ' ) 2 νi^ ' 1 2 3 4 5 6 7 8 9 10
Σ (^) : 100 100 0,
2
5.4. Распределение статистики ^2. Случайная величина имеет ^2 – распределение с r степенями свободы (r = 1; 2; 3; …), если ее плотность имеет вид
r 2 − 1 e − x 2 , при x ≻ 0, ¿ ¿ ¿ где cr – которая положительная постоянная ( cr определяется из равенства ∫ − ∞
). Случайная величина, имеющая распределение ^2 с r степенями свободы, будет обозначаться χr 2 . Для дальнейшего изложения важно лишь отметить, что, во – первых,
2 определяется одним параметром – числом r степеней свободы и, во – вторых, существуют таблицы, позволяющие произвольно найти вероятность попадания значений случайной величины χr 2 в любой промежуток. Вернемся теперь к статистике χ^2 = (^) ∑ i ( νi −^ νi ' ) 2 νi^ '. Отметим, что она является случайной величиной, поскольку зависит от результатов наблюдений и, следовательно, в различных сериях опытов принимает различные, заранее не
2 зависит: 1) от действительного (но неизвестного нам) закона распределения случайной величины, измерения которой осуществляются (им определяются эмпирические частоты
) ; 2) от количества произведенных наблюдений (от числа n) и от способа разбиения числовой оси на промежутки (в частности, от числа i ); 3) от теоретического (выдвинутого в качестве гипотезы) закона распределения изучаемой случайной величины (им определяются теоретические вероятности pi и
'
Если выдвинутая гипотеза верна, то очевидно, закон распределения статистики
2 зависти только от закона распределения изучаемой случайной величины, от числа n и от выбора промежутков разбиения. Но на самом же деле, в этом случае
2 ) справедливо куда более серьезное утверждение. А именно, при достаточно больших n закон
2 практически не зависит от закона распределения изучаемой случайной величины и ни от количества n произведенных опытов: при
2
2
- распределению с r степенями свободы. Эта теорема объясняет, почему статистика Пирсона
2 . Если в качестве предполагаемого выбрано одно их трех основных непрерывных распределений (нормальное, показательное или равномерное), то r = i – 3, где i – количество промежутков, на которые разбита числовая ось (количество групп опытных данных). В общем случае
где
= 2, т.к. количество параметров
α ≡ Ρ (^) ( χ 2 ≥ χкрит 2 ) , называется уровнем значимости.
2 , поступим следующим образом. Зададим какое – либо малое значение уровня значимости α^ (как правило α^ = 0,05 или α^ = 0,01) и найдем
2 как уровень уравнения Ρ (^ χ 2 ≥ x )^ = α
2 близко при n →^ ∞^ к
2
2 можно найти из уравнения Ρ (^) ( χr 2 ≥ x (^) ) = α ⇔ (^) ∫ x
Геометрические соображения показывают, что последнее уравнение имеет единственное решение: его корень – это такое число x , при котором площадь
2
специальных таблиц, имеющихся в любом руководстве по математической статистике; эти таблицы позволяют по двум входным параметрам – уровню значимости α^ и числу степеней свободы r определить критическое значение
2
. (Находимое таким образом критическое значение зависит, конечно, от
2
2
Зададим уровень значимости как α^ = 0,05 (условие курсовой работы). Подводя итоги, сформулируем правило проверки гипотезы о законе
2
' ) оказалось не менее пяти (т.е.
' 5 при каждом i).
'
попадания значений случайной величины в i-й промежуток.
2
2 набл ..
2 .
2
2 , то гипотезу отвергают как плохо согласующуюся с результатами эксперимента; если наблюдаемое значение критерия принадлежит области принятия гипотезы, т.е.
2
2 , то гипотезу принимают как не противоречащую результатам эксперимента. 5.6. Вывод о соответствии выдвинутой гипотезы и опытных данных в варианте. Правило проверки выдвинутой гипотезы о законе распределения изучаемой случайной величины для данного варианта реализовано в таблице: Название величины Обозначение и числовое значение величины Уровень значимости (задан в условии) α (^) = 0, Количество промежутков разбиения l^ =
Критическое значение (находится по таблице)
Наблюдаемое значение критерия ^2 набл. = 0, ВЫВОД Гипотеза не принимается для данного 9 варианта, поскольку
2
2 : 83,5 << 15,
α ≡ Ρ (^) ( χ 2 ≥ χкрит 2 ) ≈^ α^ =^0 ,^^05 , т.е. вероятность события {
2
2 } очень мала. Однако это событие, обладая ненулевой вероятностью, и тогда (при α^ = 0,05 примерно в 5% случаев) будет отвергнута правильная гипотеза. Отвержение гипотезы, когда она верна, называется ошибкой первого рода. Таким образом, уровень значимости α^ - это вероятность ошибки первого рода. Отметим, что ошибкой второго рода называется принятие гипотезы в случае, когда она неверна.