Реферат на тему:


Воспользуйтесь поиском к примеру Реферат        Грубый поиск Точный поиск






Загрузка...

Реферат на тему:

Верификация модели

Показатели качества модели

В классическом регрессионном анализе считается, что функция регрессии известна к оценке параметров, то есть регрессионная модель специфицированы правильно. Однако в эмпирических экономических и социальных исследованиях не всегда известно, сколько факторов должно быть введено в модель и какая форма зависимости лучше описывает реальные н связки. Чтобы обеспечить наиболее адекватное воспроизведение изучаемого явления или процесса необходимо выбрать регрессионную функцию среди многих вариантов, используя специальные критерии качества модели.

Для проверки корректности построения модели определяют прежде всего:

. стандартную погрешность уравнения;

. коэффициент детерминации;

. коэффициент множественной корреляции;

. стандартную погрешность параметров.

Заметим, что указанные показатели получают на основании конкретных статистических данных, то есть каждая из этих характеристик является выборочной характеристикой и поэтому масс быть проверена на значимость с помощью специальных статистических критериев.

Стандартная погрешность уравнения (точечная оценка эмпирической дисперсии остатков) характеризует абсолютную величину разброса случайной составляющей уравнения и вычисляется по формуле

Поправка на число степеней свободы дает несмещенную оценку дисперсии остатков

Понятно, что предпочтение отдается моделям, в которых стандартная ошибка уравнения меньше по сравнению с другими моделями. Однако такая оценка качества имеет существенный недостаток: из-за того что для нее не определен верхний предел, сравнение различных моделей по этому критерию достаточно проблематично.

Коэффициент детерминации R2 показывает, какая часть движения зависимой переменной описывается данным регрессионным уравнением, и вычисляется по формуле

; в среднее значение зависимой переменной,

На значение коэффициента детерминации влияет множество факторов, учтенных в модели. Введение в модель каждой новой переменной увеличивает значение коэффициента детерминации. Поэтому чо предотвратить неоправданное расширению модели и иметь возможность сравнивать модели с разным количеством факторов, вводят специальный оценен коэффициент детерминации

где а2ы - несмещенная оценка дисперсии остатков; а2у - несмещенная оценка дисперсии зависимой переменной, а 2 = ------ Y (уи - в) 2.

п-1 i = 1

Нетрудно заметить, что оба коэффициента д связанные такой завись ностью

Исчисленный таким образом коэффициент детерминации называется скорректированным по Тейло и сказывается RT. Кроме того применяют также корректировки по Амемия, которое выполняется по формуле "

Исчисленный таким образом коэффициент детерминации называется скорректированным по Амемия и обозначается RA.

Оба коэффициенты RT2 и R2A учитывают тот факт, что введение в модель каждого нового регрессоров уменьшает число степеней свободы. А для применения статистических критериев проверки качества полученных результатов степеней свободы желательно иметь как можно больше.

Очевидно, для каждого RT2 и R2A выполняется неравенство R2 & lt; R2, то есть с увеличением количества факторов модели оценены коэффициенты

детерминации растут медленнее, чем R2. Кроме того, если R2 = 1, то и R2 = 1. Если R2 стремится к нулю, оценены коэффициенты становятся от емкими. Такое свойство скорректированных коэффициентов детерминации позволяет более о объективно оценивать качество моделей с разной

количеством факторов, причем в случае применения коэффициента R2A (скорректированного по Амемия) преимущество однозначно отдается уравнению с меньшим количеством регрессоров.

Замечания. Коэффициент детерминации имеет еще два равноценных определения. По первому, коэффициент детерминации R2 равна квадрату эмпирического коэффициента корреляции между двумя рядами наблюдений (теоретическими значениями регресанда Уи и его расчетными значениями уи, i = 1, 2, ..., п) и вычисляется по формуле

По второму, коэффициент детерминации R2 равен отношению суммы квадратов отклонений расчетных значений регресанда от его среднегозначение к сумме квадратов отклонений наблюдений зна-ний регресанда от того же среднего значения

В обоих случаях сумма? вычисляется по всем наблюдениям i = 1, 2, ..., п.

Коэффициент множественной корреляции R (R) определяет меру н связи зависимой переменной со всеми независимыми факторами и является корнем квадратным из соответствующего коэффициента детерминации: R = \ R (R = yR).

Стандартная погрешность уравнения, коэффициент детерминации и множественной корреляции являются характеристиками, по которым проверяется правильность выбора независимых переменных модели. При сравнении регрессионных уравнений с разным количеством независимых переменных решающими критериями являются стандартная ошибка уравнения (наименьшая) и коэффициент детерминации (можно ближе к единице и с большим числом степеней свободы).

Проверка значимости и доверительные интервалы

Рассмотренные показатели качества модели построены по данным наблюдений, то есть некоторым выборочным характеристикам генеральной совокупности. С математической статистики известно, что любая статистика (функция от элементов выборки) должна быть проверена на значимость. Другими словами, с помощью специальных критериев необходимо установить, обусловлено значение этой функции только погрешностями измерения, или она отражает какую-то существенную (значимую) информацию. Непроверенный статистический результат является лишь некоторой гипотезе, которая может быть принята или отклонена.

Напомним, что проверка гипотез в общем случае выполняется в таком порядке: для каждой задачи подбирается некоторая случайная величина, имеющая известный или близок к известному закон распределения. Функция от элементов выборки является конкретной реализацией этой случайной величины.

Замечания. В задачах регрессионного анализа важное значение имеет предположение о нормальном распределении случайных величин, задействованных в данной модели. Определенные преобразования нормально распределенных величин обеспечивают их распределение по закону Стьюдента или по закону Фишера: на основании первого из них определяютсядоверительные интервалы, а второй позволяет оценивать отношение двух случайных величин.

По каждому статистического результата выдвигается так называемая нулевая гипотеза (о равенстве нулю некоторой случайной величины) и альтернативная к ней гипотеза (о ее существенное отличие от нуля). В нулевой гипотезе формулируют результат, желательно отклонить, а в альтернативной, которая иначе называется экспериментальной, то, что его необходимо подтвердить.

Замечания. Равенство двух величин в общем случае может рассматриваться как равенство нулю их разности.

По заданным уровнем значимости множество допустимых значений разбивается на две непересекающихся множества: одна содержит значение случайной величины, вероятность достижения которых превышает заданный уровень значимости, а другая критическая область определяет те значения, достигаемые редко (вероятность попасть в такой области ниже заданного уровня), и расположена она, как правило, на "хвостах распределения".

В зависимости от альтернативной гипотезы критическая область может состоять из одного или двух промежутков на числовой оси. Это будет один промежуток (правый или левый "хвост" распределения), если отмечается направление неравенства (больше или меньше некоторой величины), и два промежутка (оба "хвосты" распределения), если устанавливается неравенство (не равно определенной величине).

По данным наблюдений вычисляется значение соответствующей статистики функции от элементов выборки. Если эта величина попадает в критической области, это означает, что произошла практически невозможное событие, то есть событие, имеющее очень малую вероятность, а следовательно, от нулевой гипотезы следует отказаться и отдать предпочтение альтернативной. Если вычисленное значение статистики не попало в критической области, делают вывод, что данная выборка не противоречит нулевой гипотезе, то есть неправильной является экспериментальная гипотеза.

При проверке гипотез может быть допущена ошибка, например может быть отклонена нулевая гипотеза, хотя на самом деле она правиритерию Стьюдента. Фактическое значение t-статистики вычисляется по формуле

и сравнивается с табличным значением t-распределения с n - m - 1 степенями свободы и при заданном уровне значимости б / 2 (такой уровень обусловлен тем, что критическая область состоит из двух промежутков). Если абсолютная величина экспериментального значения t-статистики превышает табличное, то есть можно сделать вывод, что коэффициент корреляции достоверный (значимый), а н связь между зависимой переменной и всеми независимыми факторами существенный.

Кроме общих показателей адекватности модели существуют также оценки, позволяющие установить качество отдельных частей уравнения, в том числе одного или нескольких коэффициентов регрессии. Как и в предыдущих случаях, решение относительно качества коэффициентов принимают на основе соответствующих статистических критериев.

На основании одного из важнейших предположений МНК - предположение о нормальном распределении случайной составляющей уравнения с нулевым математическим ожиданием и постоянной дисперсией - доказано, что каждый параметр линейной регрессии также нормальное распределение. Причем математическое ожидание параметра равно значению параметра обобщенной регрессии, а дисперсия - смещена дисперсии случайной составляющей уравнения, умноженной на соответствующий диатональний элемент обратной матрицы (XTX) 1.

Статистическая значимость каждого параметра модели можно проверить с помощью t-критерия. При этом нулевая гипотеза имеет вид

aj = 0, альтернативная aj? 0.

Экспериментальное значение t-статистики для каждого параметра модели вычисляется по формуле

где cjj - диагональный элемент матрицы (XTX) -1; Saj -стандартизована погрешность оценки параметра модели.

Экспериментальное значение t j-критерия сравнивается с табличным значением t ^ с n-m-1 степенями свободы при заданном уровне значимости б / 2 (критическая область разбивается на два фрагмента, границы которых задаются квантиля б / 2). Если значение tj-статистики попадает в критической области (в абсолютном знаетнием превышает табл), принимается альтернативная гипотеза о значимости соответствующего параметра. Иначе делается вывод о статистической незначительности параметра aj, а это значит, что соответствующая независимая переменная не влияет существенно на изменение регресанда.

Замечания. Поскольку t j-статистика является отношением соответствующего параметра модели к его стандартной погрешности (среднеквадратичного-го отклонения), то на практике чаще применяют грубую оценку, а именно допускают, чтобы стандартные ошибки составляли 45-50% значе-ние параметра, чтобы утверждать о его статистическую значимость.

Доверительные интервалы для каждого параметра aj исчисляются на основе его стандартной ошибки и критерия Стьюдента

Табличное значение tтабл, по-прежнему имеет n - m - 1 степеней свободы и уровень значимости б / 2 (tтабл = tб / 2 (n-m-1)).

Вычисленные значения t j-статистик применяют также для расчета частичных коэффициентов детерминации? Rj, которые определяют предельный вклад j-то регрессоров в общий коэффициент детерминации. Коэффициент? Rj показывает, на какую величину уменьшится коэффициент

детерминации R2, если j-й регрессоров (и только он!) Будет удален из группы регрессоров. Формула для расчета частичного коэффициента детерминации имеет вид

где R2 - коэффициент детерминации, рассчитанный для модели с m регресса-рамы; t2j - квадрат измеренного значения t-статистики для j-ro рег-ресийного коэффициента; n - количество наблюдений, m - количество рег-рессор.

Замечания. Частичные коэффициенты детерминации? R2 и? R2A, вычисленные по соответствующим значениям RT и RA, могут быть как положительными, так и от емкими, что позволяет более о объективно оценивать модели с разным количеством регрессоров.

Список использованной литературы

Грубер И. Эконометрика: Введение в множественной регрессии и эконометрии: В 2 т. - М: Началова, 1998-1999.

Джонстон Дж. Эконометрические методы. & Mdash; М .: Статистика, 1980. 444 с.

Доугерти К. Введение в эконометрику: Пер. с англ. — М.: ИНФРА-М, 1997. - 402 с.

Дрейпер П., Смит Г. Прикладной регрессионный анализ. — М.: Финансы и статистика, 1986. — Т. 1 — 365 с; Т. 2 — 379 с.

Емельянов А. С. Эконометрия и прогнозирование. — М.: Экономика, 1985. - С. 82-89.

Єлейко В. Основи економетрії. — Львів: "Марка Лтд", 1995. — 191с.

Кейн Э. Экономическая статистика и эконометрия. Введение в количественный экономический анализ. — М.: Статистика, 1977. — 254с.

Корольов О. А. Економетрія: Навч. посіб. — К: Європейський ун-т,2002. - 660 с.

Ланге О. Введение в эконометрию. — М.: Прогресс, 1964. — 360 с.

Лук'яненко I. Г., Краснікова Л. І. Економетрика: Підручник. — К.: Т-во "Знання", КОО, 1998. - 494 с

Магнус Я. Р., Катышев П. К., Пересецкий А. А. Эконометрика: Навч. курс. - М.: Дело, 1997. - 248 с.

Маленво Э. Статистические методы эконометрии. — М.: Статистика, 1975. - 423 с.

Наконечний С. I., Терещенко Т .О., Романюк Т. П. Економетрія: Навч. посіб. - К: КНЕУ, 1997. - 352 с.

Тинтнер Г. Введение в эконометрию. — М.: Статистика, 1965. — 368 с.

Толбатое Ю. А. Економетрика: Підруч. для студ. екон. спец. вищ. навч. закл. — К.: Четверта хвиля, 1997. — 320 с.

Загрузка...