Математическая статистика

Заказать уникальную курсовую работу
Тип работы: Курсовая работа
Предмет: Статистика
  • 29 29 страниц
  • 10 + 10 источников
  • Добавлена 25.03.2021
1 000 руб.
  • Содержание
  • Часть работы
  • Список литературы
  • Вопросы/Ответы

Оглавление
Введение 3
1. Общие понятия 4
1.1. Определения 4
1.2. Виды и назначения критериев и границы их применимости 6
1.2.1. Критерий Стьюдента 6
1.2.2. U – Критерий U-Манна-Уитни (Mann-Whitney) 7
1.2.3. Q – критерий Розенбаума 9
1.2.4. Критерий H Крускала–Уоллиса 10
1.2.5 Критерий Зигеля-Тьюки 11
1.2.6. Т – Критерий Вилкоксона 12
1.2.7. Быстрый критерий Тьюки 14
1.2.8. Критерий Сэвиджа для положительных случайных величин 16
2. Определение статистической значимости непараметрических тестов с большими объемами выборки 19
3. Программная реализация процедур Матлаб для обработки данных эксперимента 23
Заключение 28
Список использованной литературы 29

Фрагмент для ознакомления

Для больших выборок или когда метод является приближенным, функция signrank вычисляет p-значение, используя z-статистику, заданную следующим образом:где n - размер выборки разности x - y или x - m. Для случая с двумя выборками signrank использует [tie_rank, tieadj] = tiedrank (abs (diffxy), 0,0, epsdiff) для получения значения регулировки связи tieadj.Для реализации критерия Вилкоксона в МатЛаб имеются следующие функции.p = signrank(x)p = signrank(x,y)p = signrank(x,y,Name,Value)[p,h] = signrank(___)[p,h,stats] = signrank(___)[___] = signrank(x,m)[___] = signrank(x,m,Name,Value)Функцияp = signrank(x)возвращаетp-value для двустороннего критерия Вилкоксона. signrank проверяет нулевую гипотезу о том, что данные в векторе x поступают из распределения, медиана которого равна нулю на уровне значимости 5%. Тест предполагает, что данные в x поступают из непрерывного распределения, симметричного относительно его медианы.При уровне значимости по умолчанию 5% значение h = 1 указывает, что тест отвергает нулевую гипотезу о нулевой медиане.p = signrank(x,y)возвращает p-значение парного двустороннего теста для нулевой гипотезы о том, что x - y происходит из распределения с нулевой медианой. Проверяет гипотезу о нулевой медиане разницы x – y.p = signrank(x,y,Name,Value)возвращает p-значение для проверки с дополнительными параметрами, указанными одним или несколькими аргументами пары Name, Value. [p, h] = signrank (___) также возвращает логическое значение, указывающее решение теста. h = 1 указывает на отклонение нулевой гипотезы, а h = 0 указывает на невозможность отклонить нулевую гипотезу на уровне значимости 5%. Можно использовать любой из входных аргументов в предыдущих синтаксисах.[p, h, stats] = signrank (___) также возвращает статистику структуры с информацией о тестовой статистике.[___] = signrank (x, m) возвращает любой из выходных аргументов в предыдущих синтаксисах для нулевой гипотезы о том, что данные в x являются наблюдениями из распределения с медианой m.[___] = signrank (x, m, Name, Value) возвращает любой из выходных аргументов в предыдущих синтаксисах для теста ранжирования со знаком с дополнительными параметрами, заданными одним или несколькими аргументами пары Name, Value.'alpha',0.01,'method','approximate','tail','right' определяет правосторонний знаковый ранговый тест с 1% уровнем значимости, который возвращает приблизительное p-значение.Выходные аргументы p-value – неотрицательный скалярp-значение теста, возвращенное как неотрицательный скаляр от 0 до 1. p - это вероятность того, что статистика теста будет экстремальной или более экстремальной, чем наблюдаемое значение при нулевой гипотезе. signrank вычисляет двустороннее p-значение, удваивая наиболее значимое одностороннее значение.h — Результат проверки гипотезы1 | 0Результат проверки гипотезы, возвращенный как логическое значение.Если h = 1, это указывает на отклонение нулевой гипотезы на уровне значимости 100 * альфа%.Если h = 0, это указывает на невозможность отклонить нулевую гипотезу на уровне значимости 100 * альфа%.stats—Тестовая статистикаСтатистика теста, возвращенная в виде структуры. В статистике хранится следующая тестовая статистика:signrank: Значение статистики критерия знакового ранга.zval: значение z-статистики (вычисляется, когда указан "метод" является "приблизительным").Алгоритмыsignrank обрабатывает NaN в x и y как отсутствующие значения и игнорирует их.Для случая с двумя выборками signrank использует допуск на основе значений epsdiff = eps (x) + eps (y). Функция signrank обрабатывает любую пару значений с разницей d (i) = x (i) - y (i), которые отличаются не более чем на сумму их двух значений eps (abs (d (i)) > length(T1) ans = 4598График первого фрагмента исходной функции:plot(1:50,T(1:50))График другого фрагмента ряда:plot(1000:1050,T(1000:1050))title('функция для аппроксимации')xlabel('P') ylabel('T')Следовательно, нужно провести вариант расчета критерия для большой выборки.Шаг 2. Поскольку размер выборки больше 15, signrankтест для больших выборок проводится с использованием приближенного метода вычисления p-значения, а также возвращает значение z-статистики.Проведем односторонний тест на большой выборке с использованием аппроксимации.Проверяем нулевую гипотезу о том, что средняя величина измеренного диаметра светового пятна отличается от медианного значения. По умолчанию это двусторонняя проверка.>> [p,h,stats] = signrank(T1,m)Получаем результат:p = 3.6861e-10h = 1stats = zval: 6.2668signedrank: 5.7937e+06Значение h = 1 указывает на то, что тест дает основания отвергнуть нулевую гипотезу об отсутствии разницы между медианной оценкой при 5% уровне значимости. Имеется достаточно статистических данных, чтобы сделать вывод о том, что средний размер пятнане равен медианной оценке. Следовательно, имеется смещение среднего диаметра в процессе эксперимента.Можно аналогично проверить гипотезу о постоянстве среднихпри 1% уровне значимости mean(T1):[p,h,stats] = signrank(T1,mean(T1),'alpha',0.01,'method', 'approximate','tail','both')p = 1.3715e-17h = 1stats = zval: 8.5375signedrank: 6055087Двусторонняя проверка гипотез - тип проверки по умолчанию.В этом случае Н0-гипотеза также отвергнута, т.е. вероятность смещения еще раз подтверждена. Далее нужно установить характер этого смещения.Нормальное приближение при вычислении p-значения, р-значение по умолчанию для более 15 наблюдений в x, x - m, когда 'method' не указан, потому что точный метод может быть медленным на больших выборках.Шаг 3.Следующая функция определяет правосторонний знаковый ранговый тест с 1% уровнем значимости, который возвращает приблизительное p-значение.[p,h,stats] = signrank(T1,mean(T1),'alpha',0.01,'method','approximate','tail','right')p = 6.8577e-18h = 1stats = zval: 8.5375signedrank: 6055087Для теста с одной выборкой альтернативная гипотеза утверждает, что данные в x поступают из непрерывного распределения со средним значением, отличным от 0 или m. Двусторонняя и правая гипотеза были отвергнуты, остается проверить напрямую гипотезу левостороннего сдвига диаметра светового пятна.[p,h,stats] = signrank(T1,mean(T1),'tail','left',...'alpha',0.01,'method','approximate')p = 1h =0stats = zval: 8.5375signedrank: 6055087Таким образом, гипотеза левостороннего сдвига диаметра светового пятна подтверждена. Полученные результаты позволяют сделать вывод о несимметричности экспериментальных данных относительно как медианы, так и среднего значения.ЗаключениеНепараметрические процедуры часто более эффективны, чем классические тесты для реальных данных, которые редко имеют нормальное распределение. Также, описаны существующие методы расчёта математической статистики (по типу Т-критерия Вилкоксона) с разбором и описанием принципов методов.С помощью непараметрической процедуры критерия Вилкоксона в среде MatLabисследован реальный массив результатов измерения площади изображения круглой метки. Методами математической статистики выявлена тенденция этих значений в сторону уменьшения. Список использованной литературыЛапач С. Н., Чубенко А. В., Бабич П. Н. Статистика в науке и бизнесе. — Киев: Морион, 2002. — 164-166 с.Gibbons, J. D., and S. Chakraborti. Nonparametric Statistical Inference, 5th Ed., Boca Raton, FL: Chapman & Hall/CRC Press, Taylor & Francis Group, 2011.Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006. — 457-458 с.Hollander, M., and D. A. Wolfe. Nonparametric Statistical Methods. Hoboken, NJ: John Wiley & Sons, Inc., 1999.Орлов А. И. Эконометрика. — М.: Экзамен, 2003. — §4.5.Бочаров П.П., Печенкин А.В. Математическая статистика: Учебное пособие для вузов. – М.: Изд-во ун-та Дружбы Народов, 1994. – 164 с.Лагутин М. Б. Наглядная математическая статистика. В двух томах. — М.: П-центр, 2003. — 222-227 с.Плохинский Н.А. Биометрия. 2-е изд. – М.: МГУ, 1970. – 368 с.Пустыльник Е.И. Статистические методы анализа и обработки наблюдений. – М.: Наука, 1968. – 185 с.Холлендер М., Вулф Д. Непараметрические методы статистики. — М.: Финансы и статистика, 1983.

Список использованной литературы

1. Лапач С. Н., Чубенко А. В., Бабич П. Н. Статистика в науке и бизнесе. — Киев: Морион, 2002. — 164-166 с.
2. Gibbons, J. D., and S. Chakraborti. Nonparametric Statistical Inference, 5th Ed., Boca Raton, FL: Chapman & Hall/CRC Press, Taylor & Francis Group, 2011.
3. Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006. — 457-458 с.
4. Hollander, M., and D. A. Wolfe. Nonparametric Statistical Methods. Hoboken, NJ: John Wiley & Sons, Inc., 1999.
5. Орлов А. И. Эконометрика. — М.: Экзамен, 2003. — §4.5.
6. Бочаров П.П., Печенкин А.В. Математическая статистика: Учебное пособие для вузов. – М.: Изд-во ун-та Дружбы Народов, 1994. – 164 с.
7. Лагутин М. Б. Наглядная математическая статистика. В двух томах. — М.: П-центр, 2003. — 222-227 с.
8. Плохинский Н.А. Биометрия. 2-е изд. – М.: МГУ, 1970. – 368 с.
9. Пустыльник Е.И. Статистические методы анализа и обработки наблюдений. – М.: Наука, 1968. – 185 с.
10. Холлендер М., Вулф Д. Непараметрические методы статистики. — М.: Финансы и статистика, 1983.


Вопрос-ответ:

Что такое математическая статистика?

Математическая статистика — раздел математики, который изучает методы обработки и анализа статистических данных и выводы на основе этих данных.

Какие виды критериев существуют в математической статистике?

В математической статистике существуют различные виды критериев, такие как критерий Стьюдента, критерий U Манна-Уитни, Q-критерий Розенбаума, критерий H Крускала-Уоллиса, критерий Зигеля-Тьюки, Т-критерий Вилкоксона, быстрый критерий Тьюки и критерий Сэвиджа для положительных случайных величин.

Для чего используется критерий Стьюдента?

Критерий Стьюдента используется для проверки статистической значимости различий между средними значениями двух выборок, когда известны дисперсии выборок и данные распределены нормально.

Что такое статистическая значимость непараметрических критериев?

Статистическая значимость непараметрических критериев означает, что существует статистически значимое различие между двумя или более группами данных, не требуя нормального распределения или знания о параметрах выборок.

Какие есть методы обработки и анализа статистических данных в математической статистике?

В математической статистике используются различные методы обработки и анализа статистических данных, такие как описательная статистика, корреляционный анализ, регрессионный анализ, факторный анализ, анализ дисперсии и др.

Что такое математическая статистика?

Математическая статистика - это раздел математики, который изучает методы сбора, анализа и интерпретации данных с целью принятия статистических выводов о популяции на основе выборочных данных.

Какие бывают виды и назначения критериев в математической статистике?

В математической статистике существует несколько видов критериев, которые используются для проверки статистических гипотез. Некоторые из них включают: критерий Стьюдента, U-критерий Манна-Уитни, Q-критерий Розенбаума, критерий H-Крускала-Уоллиса, критерий Зигеля-Тьюки, T-критерий Вилкоксона, быстрый критерий Тьюки, критерий Сэвиджа для положительных случайных величин и другие.

Что такое критерий Стьюдента?

Критерий Стьюдента - это статистический тест, используемый для проверки статистических гипотез о различии средних значений двух независимых выборок. Он основан на t-распределении Стьюдента и позволяет определить, насколько вероятно различие между средними значениями выборок является случайным или статистически значимым.