программное обеспечение для решения задач оценивания и прогнозирования
Заказать уникальную курсовую работу- 37 37 страниц
- 16 + 16 источников
- Добавлена 04.12.2021
- Содержание
- Часть работы
- Список литературы
Введение 3
1 Программное обеспечение для решения задач оценивания и прогнозирования 4
1.1 Статистические пакеты обработки информации для решения задач оценивания и прогнозирования 4
1.2 Интеллектуальные системы оценивания и прогнозирования 7
2 Расчетная часть 17
2.1 Практическая работа 1 17
2.2 Практическая работа 2 22
2.3 Практическая работа 3 24
2.4 Практическая работа 4 28
2.5 Практическая работа 5 32
Заключение 35
Список литературы 36
Так как , то гипотезу о нормальном распределении выборочной совокупности по критерию Пирсона принимаем.Критерий РомановскогоДля того, чтобы принять гипотезу о нормальном распределении, нужно чтобы выполнилось следующее условие:(2.21)Воспользуемся результатами предыдущих расчетов:Гипотезу о соответствии данного распределения нормальному закону распределения принимаем.Критерий ЯстремскогоИмеется условие, по которому определим принимаем гипотезу или нет: (2.22)(2.23,2.24)Так как k<10, то Θ=0,6.Гипотезу о нормальном распределении данных принимаем.Критерий Колмогорова для сгруппированной выборкиКритическое значение статистики Колмогорова расчитывается по формуле: (2.25)K(λ)0,222 . Гипотеза о нормальном распределении принимается, так как K(λ)>0,05. Приближенные критерииИспользуются выборочные статистики: асимметрию, эксцесс и их средние квадратические отклонения: (2.26) (2.27)Условием принятия гипотезы о нормальном распределении являются условия |As|≤ и |Ex|≤. В нашем случае выборочная совокупность не подчиняется нормальному закону распределения, т.к..1.356>0,486.Общий вывод: гипотезу о нормальном распределении выборочной совокупности принимаемПрактическая работа № 3Вариант №31.При исследовании зависимости средней заработной платы X (руб.) от среднедушевого прожиточного минимума в день одного трудоспособного Y (тыс. руб.) по десяти регионам получены следующие сведения:X178180187179196206167198173187Y5370550055405370588061805010594052905560Условие: по имеющимся исходным данным:Построить корреляционное поле. По характеру расположения точек в корреляционном поле выбрать вид регрессии.Вычислить числовые характеристики , sx,sy, r.Определить значимость коэффициента корреляции r.Найти эмпирическое уравнение регрессий Y наX.Вычислить коэффициент детерминации R2 и объяснить его смысловое значение.Проверить адекватность уравнения регрессии Y наX.Расчет:Построим корреляционное поле (рисунок 7) для выявления вида зависимости.Рисунок 7 – Корреляционное полеИз рисунка 5 видно, что можно провести прямую,которая пройдет рядом с точками. Это означает, что между X и Y существует линейная зависимость.Вычислим среднее значение заработной платы: (2.29)Средний среднедушевой прожиточный минимум: (2.30)Для вычисления среднеквадратических отклонений в MSExcel составимрасчетную таблицу 7:Таблица 7 – Расчетная таблица (2.31) (2.32)Линейный коэффициент корреляции: (2.33)Имеем положительную корреляцию величин X и Y,так как r> 0.Определим значимость коэффициента корреляции. Для этого выдвинем нулевую гипотезу, при которой коэффициент корреляции равен нулю.Найдем величину t:(2.34)С помощью статистической функции в MSExcel СТЬЮДЕНТ.ОБР, входом в которую является вероятность 1-0,05/2=0,975 и 10-2=8 степеней свободы найдем критическое значение:tкр = 2,31В виду того, что t=18,97> tкр=2,306, то выборочный коэффициент корреляции значимо отличается от нуля. Нулевая гипотеза отклоняется. Найдем эмпирическое уравнение регрессий Yна X.Уравнение линейной регрессии Yна X имеет вид: y=a+bx.Уравнение линейной регрессии Yна Xдля исходных данных имеет вид:(2.35)Вычислим коэффициент детерминации R2.(2.36)Необходимые расчеты проведены в MSExcel таблица 8:Таблица 8 – Расчетная таблицаТаким образом коэффициент детерминации равен:Большое значение коэффициента детерминации говорит о том, что 97,8% вариации показателя y объясняется фактором x.Проверим адекватность уравнения регрессии Yна X.Проверим гипотезу об адекватности полученной сглаживающей прямой исходными данными по критерию Фишера при уровне значимости α=0,05.Для этого вычислим статистику (2.37)Критическое значение найдем с помощью статистической функции в MSExcelFРАСПОБР: Fкр =5,3177.В виду того, чтоFвыбFкр, то можно сделать вывод о том, что полученное уравнение линейной регрессии статистически значимо и адекватно описывает результат эксперимента. Практическая работа № 4Вариант 5Данные экспериментального определения производительности труда Y в зависимости от коэффициента эксплуатации скважин Х1, дебита скважин Х2, уровня автоматизации труда Х3 приведены в таблице 4.2. Пользуясь данными этой таблицы, выполнить задание (по образцу приведенного выше примера) по вариантам, номера предприятий (НГДУ) для которых указаны в таблице 4.3 Определить форму связи между факторными и результативным признаками, построив корреляционные поля для каждой пары признаков. Определить тесноту связи между факторами. Произвести отбор факторов, включаемых в модель (отобрать два фактора).Записать уравнение множественной регрессии. Найти оценки параметров коэффициентов модели методом наименьших квадратов.Проверить адекватность полученного уравнения тремя способами: с помощью коэффициента детерминации R2, по критерию Фишера и с помощью средней ошибки аппроксимации.Найти значения коэффициентов эластичности. ФакторыЗначения факторов на различных НГДУНомера НГДУ45678910111216Х10,890,910,900,920,930,890,900,900,890,89Х240494345444246404951Х365686769726568656665Y31333034353133323230Определим форму связи между факторными и результативным признаками, построив корреляционные поля для каждой пары признаков (рисунки 8-10).Рисунок 8 – Корреляционное поле X1/YРисунок 9 – Корреляционное поле X2/YРисунок 10 – Корреляционное поле X3/YВизуальный анализ показывает, что между показателем Yи факторами и наблюдается прямая заметная связь, с фактором связь слабая.Определим тесноту связи между факторами на основе парных коэффициентов корреляции (рисунок 11).Рисунок 11 – парные коэффициенты корреляцииТаким образом, фактор не целесообразно включать в модель.Найдем оценки параметров коэффициентов модели методом наименьших квадратов (рисунок 12), система уравнений которого имеет вид:Рисунок 12 – Параметры модели множественной регрессии методом наименьших квадратовТаким образом, уравнение регрессии имеет вид:Выполним проверку адекватности полученного уравнения регрессии.с помощью коэффициента детерминации R2, который вычислим по коэффициенту множественной корреляцииТаким образом, 74% вариации yобъясняется факторами, вошедшими в модель. Модель умеренного качества.по критерию Фишера.Расчетное значение критерия вычислим по формуле:Критическое значение определим с помощью функции F.ОБР.ПХ при уровне значимости 0,05 и степенях свободы 2 и 7:с помощью средней ошибки аппроксимации.Составим расчетную таблицу (таблица 11).Таблица 9 – Расчетная таблицаЗначение средней ошибки аппроксимации равно:Значение средней ошибки аппроксимации свидетельствует о высокой точности модели.Найдем значения коэффициентов эластичности:Таким образом, изменение на 1% приводит к изменению y на 1,733%. Влияние фактора существенно.Изменение на 1% приводит к изменению y на 0,537%. Влияние фактора не существенно.Практическая работа № 5Условие: Два преподавателя оценили знания 15 студентов по двум дисциплинам и выставили им оценки по сто балльной шкале. Найти коэффициент ранговой корреляции Спирмена и Кендалла, оценить значимость.Студент1234567891011Дисциплина 19660748899797247834793Дисциплина 24676539861784972535352Расчет: присвоим ранги по дисциплине 1 и 2 (таблица 10):Таблица 10– Присвоение ранговВыпишем последовательность рангов xiиyi (таблица 18):Таблица 11 - Последовательность рангов xiиyiВычислим сумму квадратов разностей рангов:244(2.43)Коэффициент ранговой корреляции Спирмена: (2.44)Проверка значимости коэффициента ранговой корреляции Спирмена:(2.45)Так как |ρB|
1. Базы данных Oracle [Электронный ресурс]. http://www.oracle.com/technetwork/ru/database/express-edition/overview/index.html (дата обращения: 02.11.2021).
2. Интегрированные хранилища данных Teradata [Электронный ресурс]. http://www.teradata.com.ru/Russian/Teradata_Database/?LangType=1049&LangSelect=true (дата обращения: 02.11.2021)
3. Кудрявцев Ю.П. OLAP-технологии: обзор решаемых задач и исследований// Бизнес-информатика. – 2012. – № 1. – С. 66-80
4. Лебедев В.В. Информационные технологии бизнес-аналитики. Система подготовки принятия решения Deductor. Учебно-методическое пособие. Кафедра информационных технологий в бизнесе. НИУ ВШЭ ПФ, 2016. – 15 с.
5. Обзор возможностей применения ведущих СУБД для построения хранилищ данных (DataWarehouse) [Электронный ресурс]. http://www.olap.ru/basic/dbms.asp (дата обращения: 02.11.2021)
6. Программные решения компании IBM [Электронный ресурс]. http://www-03.ibm.com/software/products/ru/retail (дата обращения: 03.11.2021)
7. Стратегия Microsoft в области создания хранилищ данных: платформа для совершенствования процессов принятия решений за счет облегчения доступа и анализа данных [Электронный ресурс]. http://www.olap.ru/desc/microsoft/SQL7_dwa.asp (дата обращения: 02.11.2021)
8. Eviews. Официальный сайт программного продукта [Электронный ресурс]. http://www.eviews.com/
9. Gretl. Официальный сайт программного продукта [Электронный ресурс]. http://gretl.sourceforge.net/ (дата обращения: 03.11.2021)
10. Polyanalyst [Электронный ресурс]. http://www.megaputer.com/ (дата обращения: 02.11.2021)
11. SAS Enterprise Miner [Электронный ресурс]. http://www.sas.com/ (дата обращения: 03.11.2021)
12. SPSS [Электронный ресурс]. http://www.spss.com (дата обращения: 02.11.2021)
13. STATA. Официальный сайт программного продукта [Электронный ресурс]. http://www.stata.com/ (дата обращения: 03.11.2021)
14. Statistica. Официальный сайт программного продукта [Электронный ресурс]. http://www.statsoft.ru/ (дата обращения: 03.11.2021)
15. Statistica Data Miner [Электронный ресурс]. http://www.StatSoft.com/ (дата обращения: 03.11.2021)
16. Weka [Электронный ресурс]. http://www.cs.waikato.ac.nz/ml/weka/index.html (дата обращения: 03.11.2021)