Использование статистических методов для анализа и оценки взаимосвязи между приростом ВРП и ресурсным потенциалом регионов РФ
Заказать уникальную курсовую работу- 47 47 страниц
- 17 + 17 источников
- Добавлена 27.02.2021
- Содержание
- Часть работы
- Список литературы
- Вопросы/Ответы
Введение 5
ТЕОРЕТИЧЕСКОЕ ОБОСНОВАНИЕ МОДЕЛИ 8
1.1. Описание изучаемой предметной области 8
1.2. Теоретико-методическое обеспечение проводимого исследования 13
2 СПЕЦИФИКАЦИЯ МОДЕЛИ 18
2.1. Обоснование модели 18
2.2. Описание используемых данных 21
3 ПОСТРОЕНИЕ ЭКОНОМИЧЕСКОЙ МОДЕЛИ 23
3.1. Предварительный анализ данных 23
3.2. Построение модели и проверка условий использования МНК 23
3.2.1. Построение и тестирование OLS модели 23
3.2.2. Анализ регрессии на возможность использования моделей с фиксированными или случайными эффектами 23
3.3. Анализ и моделирование на основе экономической модели 23
Заключение 23
Список использованных источников 23
Приложения 25
Предполагается, что в результате анализа выявим то, что одни из них будут незначительными, а другие изменят свою функциональную форму. Эти предположения, естественно, повлияют на окончательную модель и экономическую интерпретацию. Прежде чем мы сможем создать регрессионную модель, мы должны выполнить предварительный анализ данных с использованием описательной статистики.3 ПОСТРОЕНИЕ ЭКОНОМИЧЕСКОЙ МОДЕЛИ3.1. Предварительный анализ данныхПостроим основные описательные статистики: количество наблюдений (obs), среднее (mean), стандартное отклонение (Std.Dev.), максимум (max) и минимум (min)указанных переменных для каждого года. Для этого используем следующую команду (sum). Для получения более детальной описательной статистики необходимо через запятую указать опцию detail. Добавление опции detail позволяет вывести также характерные квантили (percentiles), несколько самых больших (largest) и самых маленьких(smallest) значений, коэффициенты асимметрии (skewness) и эксцесса (kurtosis). Проведем для каждой переменной подробную статистику и сведем все в таблицу.Таблица 2 –Описательная статистика переменныхНазвание переменной в моделиПеременнаяКоличество наблюденийСреднееСтандартное отклонениеminmaxДисперсияКоэффициент асимметрииКоэффициент эксцесса12345678910VRPpВаловой региональный продукт на душу населения648406847,918021,463569,75710130210451624049,415,841547,7226ImpСреднедушевые доходы населения64824890,16408,4348829,479614108098300,502,23876,6233TradepОборот розничной торговли на душу населения (в фактически действовавших ценах, руб.)648151448,32004,843314163820162604569091,630,78341,8826Продолжение таблицы 2 – Описательная статистика перменнныхНазвание переменной в моделиПеременнаяКоличество наблюденийСреднееСтандартное отклонениеminmaxДисперсияКоэффициент асимметрииКоэффициент эксцесса12345678910ServpОбъем платных услуг на душу населения64847434,08806,420514446,35148352,1421403515,931,68523,5736InvpИнвестиции в основной капитал на душу населения646108697,17053,93314438,52204285032143651649,477,421565,83417SpopОбщая жилая площадь на душу населения64824,558490,1368212,933,712,13-0,65951,1056Продолжение таблицы 2 – Описательная статистика переменныхНазвание переменной в моделиПеременнаяКоличество наблюденийСреднееСтандартное отклонениеminmaxДисперсияКоэффициент асимметрииКоэффициент эксцесса12345678910PdocЧисленность населения на одного врача648457,8475166,9914264443718070220,1910,2711103,8174PmedЧисленность населения на одного работника среднего медицинского персонала648111,60490,66322863,6167,1285,040,21760,6554OPLОжидаемая продолжительность жизни64871,259570,10361,7983,416,870,40452,9759Так как коэффициенты асимметрии и эксцесса не равны нулю, то, необходимо решить, какие отклонения от идеального сценария допустимы для того, чтобы считать распределение полученных данных нормальным или близким к нормальному [17]. Проведем дополнительные тесты, с помощью которых можно будет сделать выводы о нормальности распределения. sktest тест (p < 0,05) указывает на значимое отличие распределения переменной от нормального (значение p в данном случае обозначается как Prob>chi2) (рисунок 1). Рисунок 1 – Результаты sktest тестаТаким образом, нулевая гипотеза о том, что распределение переменной не отличается значимо от нормального распределения отвергается для всех переменных. Другим статистическим критерием является тест на проверку распределения с помощью критериев Shapiro-Wilk. При применении критериев Shapiro-Wilk за нулевую гипотезу принимается гипотеза о том, что изучаемое распределение не отличается от нормального, значит, если достигнутый уровень значимости при проверке гипотезы будет меньше, чем критический уровень значимости (р, обычно 0,05), обозначаемый в данном случае как Prob>z, то нулевая гипотеза о сходстве распределений отклоняется, значит, распределение отличается от нормального. Соответственно если p > 0,05, распределение не отличается от нормального (рисунок 2).Рисунок 2 - КритерийShapiro-WilkТаким образом, для всех показателей достигнутый уровень значимости представляет собой малую величину и позволяет отвергнуть нулевую гипотезу о подчинении данных закону нормального распределения. Такие же выводы можно получить на основании результатов анализа графиков: гистограмм (histogram) и квантильных диаграмм (qnorm). Также, на основании коэффициента асимметрии, можно заключить: все показатели кроме «Spop» имеют правостороннюю асимметрию. Итак, на основании проверки распределения можно сделать вывод, что значения всех переменных не подчиняются закону нормального распределения. Такие данные не рекомендуется описывать с помощью средней арифметической и стандартного отклонения, которые сильно подвержены влиянию крайних вариант. Обратим внимание на рисунок, отражающий зависимость зависимого показателя от других - независимых показателей. Используем команду graphmatrix … ,half. (см. рисунок 3).Рисунок 3 - Общий график зависимости ВРП на душу населения от рассматриваемых показателейgraph matrix VRPpInvpTradepServpSpop Imp PdocPmed OPL ,halfНо для более наглядной проверки результирующей переменной стоит рассмотреть рисунок, содержащий показывающий результирующую переменную в разрезе регионов. Используем командуscatterVRPpyear , mlabel( region )(рисунок 4).Рисунок 4 – ВРП на душу населения по годамИз рисунка можно увидеть, что у величины заметны значения, явно отклоняющиеся от большинства (выбросы). Однако однозначно утверждать, что только эти регионы необходимо убрать из выборки - невозможно. Необходимо провести ряд дополнительных тестов, которые будет рассматриваться дальше в работе.3.2. Построение модели и проверка условий использования МНК3.2.1. Построение и тестирование OLS моделиПостроение модели взаимосвязи ВРП на душу населения (VRPp) и социально-экономических факторов начнем с введения команды regress с перечисление результирующей и зависимых переменных в программу Stata (см. рисунок 5).Рисунок 5 – Результаты построения регрессионной модели на основе первоначальных показателейДанная регрессионная модель характеризуется большим количеством показателем, часть из которых не имеет значимости (Servp, Pdoc, OPL), а также большим значением коэффициента детерминации , что объясняется введением большого количества переменных. Рассмотрим линейность распределения данных показателей относительно Y (см. рисунок 6).Рисунок 6 - Проверка линейности связи между зависимой и независимыми переменными avplotsИз рисунка 6 можно сделать вывод о том, что показательPdoc имеет форму отличную от линейной, в следствие чего, стоит проверить возможность изменения их функциональной формы. О том, что изменение функциональной формы необходимо, говорит и предварительный анализ данных (ненормальное распределение, в том числе и результирующего показателя). Начнем с результирующего показателя VRPp. Наиболее близкое к нормальному распределению натуральный логарифм показателя (рисунок 7).Рисунок 7 - Гистограмма трансформации результирующего показателяВыполним построение регрессионной модели, в которой в качестве результирующего показателя возьмем lnVRPp (см. рисунок 8). Рисунок 8 - Повторная регрессия после изменения функциональной формы результирующего показателяПри изменении функциональной формы результирующего показателя коэффициенты при регрессорах изменились. Снизился и среднеквадратическая ошибка. Отметим, что значимость показателей также изменилась. Таким образом, приведение даже одного показателя к функциональной форме, распределение которого стремится к нормальному, увеличило уровень значимости показателей.Анализ показывает, что статистически значимым не является только коэффициент при Pdoc. Даже изменение функциональной формы данной переменной не позволяет обеспечить ее статистическую значимость в модель.Для более жесткой оценки регрессионной модели воспользуемся оператором vce (hc3). Данный оператор используется для более строгой оценки модели, что, на взгляд авторов, позволит построить более качественную модель. Так, оператор (hc3) используется, когда наблюдается возможность гетероскедостичности данных (неоднородности наблюдений). Он формирует более консервативные рамки доверительного интервала, таким образом, уровень значимости многих переменных в модели становится ниже, что позволит выбрать наиболее значимые переменные (см. таблицу 9).Рисунок 9 - Повторная регрессия после изменения функциональной формы регрессоровТаким образом, из таблицы видно, что все показатели в модели статистически значимы.Проведем тест на мультиколлинеарность (наличие линейной зависимости между объясняющими переменными (факторами) регрессионной модели) (см. рисунок 10).Рисунок 10 - Проверка переменных на мультиколлинеарностьЗначения vifне превышают 10. Таким образом, мультиколлинеарность отсутствует.Уравнение модели имеет вид:Экономическую интерпретацию рационально провести после проведения тестов на качество модели, так как в ходе тестирования может возникнуть ситуация, при которой от модели придется отказаться в пользу более качественной. Еще раз обратимся к линейности выбранных переменных. На рисунке представлены взаимосвязь между результирующим показателей и регрессорами (см. рисунок 11).Рисунок 11 - Проверка линейности связи между зависимой и независимыми переменными в выбранной моделиПоказатель Pdocне распределен линейно.Наиболее приближенным вариантом, при котором данный показатель был бы распределён линейно, является логарифмическая форма, но при использовании lnPdocданный показатель теряет значимость.Проведем тест на спецификацию. Тестирование позволит определить, были ли пропущены переменные в модели. Для этого используем два теста: linktest, важным условием которого является объяснение показателейпредсказанным Y (_hat) и отсутствием объясняющей взаимосвязь с Y2 (рисунок 12). Рисунок 12 – Результаты linktestРезультаты данного теста подтверждают гипотезу, что спецификация определена верно. Выполним ovtest или тест Рамсея, который предполагает наличие нулевой гипотезы, при которой модель не имеет пропущенных переменных. Результаты теста показывают превышение допустимого значения на 0,0018, по этой причине, мы предполагаем, что тест пройден и спецификация построена верно (см. рисунок 13).Рисунок 13 – Результаты теста РамсеяВыполним анализ остатков на гетероскедастичность (рисунок 14).Рисунок 14 – Тесты на гетероскедастичность остатковСогласно всем тестам остатки гетероскедастичны.Таким образом, линейная модель не может качественно отразить взаимосвязь показателей, что прежде всего объясняется структурой данной (панельная).3.2.2. Анализ регрессии на возможность использования моделей сфиксированными или случайными эффектамиПо результатам построения модели с фиксированными эффектами наблюдается: рост по сравнению с OLS скорректированного R2 , переменныхTradep, Invp, Pdocи не являются статистически значимыми, 96% дисперсии возникает из-за различий между панелями (странами) (см. рисунок 15). Рисунок 15 – Регрессия с фиксированными эффектамиВыполним построение модели со случайными эффектами (см. рисунок 16).Рисунок 16 – Регрессия со случайными эффектамиВ данной модели ошибки не коррелированы с регрессорами, отмечается средний относительно предыдущих моделей скорректированного R2, 92% дисперсии объясняется общими изменениями в панелях.О значимости регрессии в целом свидетельствует высокое значение статистики Вальда - Wald chi2(6)=3685,47.Исключим из модели статистически не значимые переменные Pdoc, Pmed(рисунок 17).Рисунок 17 – Регрессия со случайными эффектами после исключения переменныхДля того, чтобы определить, какую модель выбрать используем тест Хаусмана (см. рисунок 18).Рисунок 18 – Тест ХаусманаПо результатам теста можно сделать вывод, что нулевая гипотеза о том, что ошибки не коррелированы с регрессорами, отвергается, а значит в выборе между моделью с фиксированными эффектами и случайными, предпочтение следует отдать первой.С помощью LM теста было определено, что между обычной моделью OLS и моделью со случайными эффектами, предпочтение стоит отдать последнему. Однако на предыдущем этапе было выяснено, что модель со случайными эффектами уступает модель с фиксированными эффектами.Рисунок 19 – Результаты LM тестаТаким образом, на основании тестов необходимо отвергнуть обычную OLS модель.3.3. Анализ и моделирование на основе экономической моделиТаким образом, окончательный вид регрессионной модели имеет следующий вид:В полученной модели все переменные, выбранные в качестве регрессоров, не зависят друг от друга. Таким образом, в связи с наличием обоснованных связей между показателями, можно утверждать, что выбранная модель, может быть принята. Перейдем к интерпретации коэффициентов в итоговой регрессионной модели.В построенной модели коэффициенты при таких показателях, как численность населения на одного работника среднего медицинского персонала и ожидаемая продолжительность жизни - отрицательны, а для всех остальных переменных – положительные. Рассмотрим коэффициенты при каждом показатели подробнее.К наибольшему росту ВРП на душу населения приводит увеличение общей жилой площади на душу населения. Данный факт экономически обоснован в виду того, что объем работ по виду экономической деятельности «Строительство» формирует значительную долю ВРП.Положительное влияние объема платных услуг на душу населения на показатель ВРП также обосновано с учетом того, что ВРП представляет собой стоимость всех конечных товаров и услуг, произведенных в регионе за год.Отрицательное влияние показателя ожидаемой продолжительности жизни на показатель ВРП, прежде всего, обусловлено увеличением нагрузки на трудоспособное население региона, что снижает производственные показатели.Таким образом, интерпретируя коэффициенты при показателях модели можно сделать вывод о ее пригодности для прогнозирования значений ВРП на душу населения в будущем, так как ни один из коэффициентов явно не опровергает экономического смысла.ЗаключениеСписок использованных источниковhttps://www.acjournal.ru/jour/article/viewFile/894/883Амирова Э.А «УСЛОВИЯ И ФАКТОРЫ СОЦИАЛЬНО-ЭКОНОМИЧЕСКОЙДИФФЕРЕНЦИАЦИИ РЕГИОНОВ СКФО»С.Ю. Петров, С.Ф. ЗябироваУсловия и факторы социально-экономической дифференциации регионов России. https://voprstat.elpub.ru/jour/article/viewFile/377/378https://www.dissercat.com/content/statisticheskaya-otsenka-urovnya-sotsialno-ekonomicheskogo-razvitiya-munitsipalnykh-obrazovahttps://rosinfostat.ru/dotatsionnye-regiony/https://www.fundamental-research.ru/ru/article/view?id=30023https://www.imf.org/external/pubs/ft/fandd/rus/2004/06/pdf/boeri.pdfhttps://risa.ru/images/8papers/8konvent-rami_tom6.pdfМежсекционный сборник № 6 «Мировая экономика» (Материалы VIII Конвента РАМИ, апрель 2014 г.) : научное издание / Под ред. О. В. Хмыз, И. Н. Платоновой, Л. М. Капицы, Т. А. Митровой. — Издательство «МГИМО– Университет», 2015. — 352 с. ISBN 978–5-9228–1372–3https://www.researchgate.net/publication/4901181_A_Sensitivity_Analysis_of_Cross-Country_Growth_RegressionsПолетаев А.В. Валовой внутренний продукт Российской Федерации в со# поставлении с Соединенными Штатами Америки, 1960–2004 гг. Пре# принт WP6/2006/02. — М.: ГУ ВШЭ, 2006. — 48 с. Экономический рост и неравенство: институциональный аспект и эмпирический анализ Т.В. Меркулова. https://conf.hse.ru/data/2010/04/03/1218253057/merkulova_doklad.pdfГусев Александр Борисович кандидат экономических наук, зам. директора РИЭПП, Оценка влияния межрегионального экономического неравенства на макроэкономический рост https://riep.ru/upload/iblock/6a9/6a944c3122097dd481a5ab53850cdaec.pdfhttps://www.fbk.ru/upload/images/regions_doklad.pdfhttps://cyberleninka.ru/article/n/otsenka-vliyaniya-sotsialno-ekonomicheskoy-differentsiatsii-na-razvitie-regionov/viewerАНАЛИЗ ФАКТОРОВ РОСТА ВВП В УСЛОВИЯХ КРИЗИСА. Алехина Н.М.https://www.top-technologies.ru/ru/article/view?id=25658ОЦЕНКА ЭКОНОМИЧЕСКОГО РОСТА И ЕГО ЗАВИСИМОСТЬ ОТ ЗАНЯТОСТИ НАСЕЛЕНИЯ. Коновалова М.Е. Балашова О.Ю. https://www.fundamental-research.ru/ru/article/view?id=31302#:~:text=Обращаясь%20к%20реальным%20статистическим%20показателям,и%20обычно%20подсчитываются%20за%20год.Приложения
1. https://www.acjournal.ru/jour/article/viewFile/894/883
2. Амирова Э.А «УСЛОВИЯ И ФАКТОРЫ СОЦИАЛЬНО-ЭКОНОМИЧЕСКОЙ ДИФФЕРЕНЦИАЦИИ РЕГИОНОВ СКФО»
3. С.Ю. Петров, С.Ф. Зябирова Условия и факторы социально-экономической дифференциации регионов России.
4. https://voprstat.elpub.ru/jour/article/viewFile/377/378
5. https://www.dissercat.com/content/statisticheskaya-otsenka-urovnya-sotsialno-ekonomicheskogo-razvitiya-munitsipalnykh-obrazova
6. https://rosinfostat.ru/dotatsionnye-regiony/
7. https://www.fundamental-research.ru/ru/article/view?id=30023
8. https://www.imf.org/external/pubs/ft/fandd/rus/2004/06/pdf/boeri.pdf
9. https://risa.ru/images/8papers/8konvent-rami_tom6.pdf Межсекционный сборник № 6 «Мировая экономика» (Материалы VIII Конвента РАМИ, апрель 2014 г.) : научное издание / Под ред. О. В. Хмыз, И. Н. Платоновой, Л. М. Капицы, Т. А. Митровой. — Издательство «МГИМО– Университет», 2015. — 352 с. ISBN 978–5-9228–1372–3
10. https://www.researchgate.net/publication/4901181_A_Sensitivity_Analysis_of_Cross-Country_Growth_Regressions
11. Полетаев А.В. Валовой внутренний продукт Российской Федерации в со# поставлении с Соединенными Штатами Америки, 1960–2004 гг. Пре# принт WP6/2006/02. — М.: ГУ ВШЭ, 2006. — 48 с.
12. Экономический рост и неравенство: институциональный аспект и эмпирический анализ Т.В. Меркулова. https://conf.hse.ru/data/2010/04/03/1218253057/merkulova_doklad.pdf
13. Гусев Александр Борисович кандидат экономических наук, зам. директора РИЭПП, Оценка влияния межрегионального экономического неравенства на макроэкономический рост https://riep.ru/upload/iblock/6a9/6a944c3122097dd481a5ab53850cdaec.pdf
14. https://www.fbk.ru/upload/images/regions_doklad.pdf
15. https://cyberleninka.ru/article/n/otsenka-vliyaniya-sotsialno-ekonomicheskoy-differentsiatsii-na-razvitie-regionov/viewer
16. АНАЛИЗ ФАКТОРОВ РОСТА ВВП В УСЛОВИЯХ КРИЗИСА. Алехина Н.М. https://www.top-technologies.ru/ru/article/view?id=25658
17. ОЦЕНКА ЭКОНОМИЧЕСКОГО РОСТА И ЕГО ЗАВИСИМОСТЬ ОТ ЗАНЯТОСТИ НАСЕЛЕНИЯ. Коновалова М.Е. Балашова О.Ю. https://www.fundamental-research.ru/ru/article/view?id=31302#:~:text=Обращаясь%20к%20реальным%20статистическим%20показателям,и%20обычно%20подсчитываются%20за%20год.
Вопрос-ответ:
Какие статистические методы использовались для анализа и оценки взаимосвязи между приростом ВРП и ресурсным потенциалом регионов РФ?
Для анализа и оценки взаимосвязи между приростом ВРП и ресурсным потенциалом регионов РФ в данной статье были использованы методы статистического анализа, включая метод наименьших квадратов (МНК) и предварительный анализ данных.
Какое теоретико-методическое обеспечение используется в данном исследовании?
В данном исследовании используется теоретико-методическое обеспечение, основанное на анализе взаимосвязи между приростом ВРП и ресурсным потенциалом регионов в Российской Федерации. Это включает в себя использование экономической модели, предварительный анализ данных и проверку условий использования МНК.
Как строится экономическая модель в данной статье?
Экономическая модель в данной статье строится путем анализа данных о приросте ВРП и ресурсном потенциале регионов РФ. Сначала проводится предварительный анализ данных, затем строится модель и проверяются условия использования метода наименьших квадратов (МНК).
Какие данные использовались при построении модели?
При построении модели использовались данные о приросте ВРП и ресурсном потенциале регионов РФ. Конкретные детали о данных не указаны в данной статье.
Какие методы были использованы для проверки условий использования метода наименьших квадратов (МНК)?
Для проверки условий использования метода наименьших квадратов (МНК) в данной статье были применены статистические методы, включая предварительный анализ данных и проверку соответствия модели теоретическим предпосылкам.
Какие статистические методы используются для анализа и оценки взаимосвязи между приростом ВРП и ресурсным потенциалом регионов РФ?
Для анализа и оценки взаимосвязи между приростом ВРП и ресурсным потенциалом регионов РФ используются различные статистические методы, такие как корреляционный анализ, регрессионный анализ и множественная регрессия. Эти методы позволяют определить наличие и силу связи между указанными переменными и выявить статистическую значимость полученных результатов.
Какие данные используются при анализе и оценке взаимосвязи между приростом ВРП и ресурсным потенциалом регионов РФ?
При анализе и оценке взаимосвязи между приростом ВРП и ресурсным потенциалом регионов РФ используются соответствующие статистические данные, такие как данные о приросте ВРП регионов и данные о ресурсном потенциале этих регионов. Эти данные могут быть представлены в виде временных рядов или панельных данных, в зависимости от постановки исследования.
Как проводится предварительный анализ данных при построении экономической модели связи между приростом ВРП и ресурсным потенциалом регионов РФ?
При построении экономической модели связи между приростом ВРП и ресурсным потенциалом регионов РФ проводится предварительный анализ данных. В рамках этого анализа осуществляется проверка наличия и степени линейной связи между переменными, проверка наличия выбросов, проверка наличия мультиколлинеарности и других предпосылок для использования модели. Также проводится оценка статистической значимости полученных результатов.
Какими методами проверяются условия использования МНК при построении экономической модели связи между приростом ВРП и ресурсным потенциалом регионов РФ?
При построении экономической модели связи между приростом ВРП и ресурсным потенциалом регионов РФ условия использования МНК проверяются с помощью различных методов. Например, можно провести тесты на гетероскедастичность ошибок модели, на автокорреляцию ошибок, на нормальность распределения ошибок и т.д. Если условия использования МНК не выполняются, то может потребоваться выбор другого метода оценки параметров модели.
Какие методы используются для анализа и оценки взаимосвязи между приростом ВРП и ресурсным потенциалом регионов РФ?
Для анализа и оценки взаимосвязи между приростом ВРП и ресурсным потенциалом регионов РФ используются статистические методы. Они позволяют определить степень зависимости между этими двумя переменными, а также выявить другие факторы, которые могут влиять на рост ВРП. Некоторые из методов, которые могут быть использованы, включают корреляционный анализ, регрессионный анализ и анализ временных рядов.