Метод авторегрессии

Еще один метод, полезный для прогнозирования по временным рядам, основан на авторегрессионных моделях. Обычно обнаруживается, что значения отклика в некоторой точке временного ряда сильно коррелировано с несколькими предшествующими и/или последующими значениями. Действительно, для многих явлений их современное состояние функционально определяется предшествующими состояниями системы, в большей степени недавними, в гораздо меньшей – далеко отстоящими от заданного по временному ряду. Подобные связи принято называть автокорреляцией – корреляцией ряда с самим собой.

Автокорреляция первого порядка характеризует тесноту связи между соседними значениями временного ряда, автокорреляция второго порядка – между отстоящими друг от друга на два периода etc. И вообще, автокорреляция n-го порядка относится к степени связанности откликов, разнесенных на n периодов. Предполагая, что возникшая связь между значениями сохранится некоторое время в будущем, мы получаем механизм прогнозирования, основанный на построении регрессии точек ряда на самих себя, то есть – авторегрессии.

Авторегрессионные модели разных порядков – первого, второго, в общем случае n-ого – можно описать уравнениями следующего вида:

где b₀ - константа (свободный член) авторегрессионного уравнения, b₁, b₂,... b_n – коэффициенты авторегрессии, Y_i - величина отклика в некоторый момент времени, Y_i–1, Y_i–2,...Y_i–n – соответственно отклики одним, двумя,... n периодами ранее заданного, – нескоррелированная случайная компонента, присутствующая в отклике и связанная с ошибками наблюдения и погрешностями модели.

Понятно, что применяя средства регрессионного анализа пакетов Quattro Pro и Excel, можно строить авторегрессионные зависимости также элегантно, как и простые уравнения регрессии. Зависимой переменной при построении авторегрессии первого порядка будет сам временной ряд, а независимой – он же, но смещенный на одно значение вниз. Таким образом, второе значение ряда будет определяться регрессией на первой значение, третье – регрессией на второе и так далее. Ниже на странице приведены итоговые результаты построения уравнения авторегрессии первого порядка, но Вы также можете загрузить таблицу в формате Quattro или в формате Excel и выполнить упражнение, а затем сравнить свои результаты с представленными здесь.

Расположите окна с табличным процессором и браузером так, чтобы Вам было удобно с ними работать. Если разрешение монитора невелико, просто переключайтесь между окнами.
Скопируйте значения из ячеек B7..B29 в ячейки C8..C30 (со сдвигом вниз на одну строку). Первое значение 2.8 должно оказаться в ячейке C8, а ячейка C7 должна остаться свободной.
Вызовите функцию построения регрессии.
В поле независимых переменных X введите блок ячеек от C8 до C29.
В поле зависимых переменных Y введите блок ячеек от B8 до B29.
Определите блок вывода результатов B36..D38 (в загруженной таблице этот блок выделен линией сверху и слева).
Нажмите клавишу Ok для проведения расчетов. Результаты будут выведены в указанный Вами блок.
В ячейку D46 в системе Quattro Pro введите формулу @abs(D43)/D44 для получения расчетного значения критерий Стьюдента. В системе Excel это значение уже рассчитано и находится в ячейке E53.
В соседней свободной ячейке рассчитайте табличное значение одностороннего критерия Стьюдента. Воспользуйтесь встроенной функцией Quattro @tinv или функцией Excel СТЬЮДРАСПОБР. В качестве первого параметра этой функции указывается уровень значимости, а второго – число степеней свободы. Таким образом формула должна включать параметры 0.1 в качестве уровня значимости и 20 как число степеней свободы для 95%-ной доверительной вероятности.
Сравните расчетное и табличное значения критерия Стьюдента.
Можно представить соответствие расчетных величин по уравнению авторегрессии первого порядка наблюдаемым и прогноз в графической форме. Для этого вначале построим прогноз.
В ячейку D8 введите формулу +E$37+C8*D$43 в случае Quattro и =C$52+C8*C$53 в случае Excel и скопируйте вниз по колонке до ячейки D33 включительно. Пока не обращайте внимания на странные расчетные значения в конце столбца.
В ячейку C31 введите формулу +D30 (Quattro) или =D30 (Excel) и скопируйте ее в ячейки C32 и C33. Прогноз на 4 периода вперед построен.
Вызовите функцию построения графика.
В качестве оси X укажите года, выделив все ячейки от A7 до A33.
В качестве первой серии укажите все ячейки от B7 до B29.
В качестве второй серии укажите все ячейки от D7 до D33. Внимание – первую незаполненную ячейку тоже надо указывать.
При необходимости измените цвета кривых и отмените вывод маркеров на графике.
Сравните вид Вашего графика и Ваши данные с тем, что представлено на странице пособия. Можно при этом округлить рассчитанные значения так же, как это сделано в пособии.
Сохраните таблицу с расчетами в нужном Вам каталоге. Пока не закрывайте систему, эта же таблица потребуется далее для расчета более высоких порядков авторегрессии.

Результаты расчета коэффициентов авторегрессии

Результат регрессионного анализа
Константа	0.477
Оценка стандартной ошибки Y	0.839
Коэффициент вариации	0.978
Число наблюдений	22
Степени свободы	20
Коэффициент(ы) X	1.032
Стандартная ошибка коэффициента	0.035
Критерий Стьюдента	29.654
Табличное значение критерия Стьюдента	1.725

Наблюдаемые значения отклика и расчет по модели авторегрессии

Год	Объем выпуска	Значение X для регрессии	Рассчитанное значение
1970	2.8	—	—
1971	3.0	2.8	3.368
1972	3.5	3.0	3.574
1973	4.0	3.5	4.091
1974	4.6	4.0	4.607
1975	5.0	4.6	5.226
1976	5.4	5.0	5.639
1977	6.0	5.4	6.052
1978	7.0	6.0	6.672
1979	8.0	7.0	7.704
1980	9.7	8.0	8.736
1981	10.3	9.7	10.491
1982	10.8	10.3	11.111
1983	10.2	10.8	11.627
1984	10.6	10.2	11.008
1985	10.6	10.6	11.421
1986	11.5	10.6	11.421
1987	13.3	11.5	12.350
1988	17.0	13.3	14.208
1989	18.4	17.0	18.028
1990	18.9	18.4	19.473
1991	19.4	18.9	19.989
1992	20.1	19.4	20.505
Прогнозные значения
1993		20.1	21.228
1994		21.228	22.393
1995		22.393	23.595
1996		23.595	24.836

Графическое представление результатов моделирования методом авторегрессии 1-го порядка в данном случае не требуется, поскольку еще нет уверенности, что модель хороша по статистическим критериям, тем не менее уже наблюдается хорошее соответствие расчета наблюдаемым величинам, а значит, и прогноз должен быть удовлетворительным.

Для построения надежного прогноза нам потребуется выбрать лучшую модель из многих авторегрессионных, и определение порядка этой лучшей модели часто оказывается нетривиальной задачей, включающей расчет статистических характеристик многих построенных моделей и нахождение хрупкого баланса между относительной простотой моделей низких порядков и игнорированием в этих моделях некоторых тонких взаимодействий между факторами, которые могут быть учтены только в более сложных моделях.

Обычно в эпоху до широкого распространения персональных компьютеров предпочитали начинать построения с моделей высоких порядков, а затем постепенно ее упрощать, последовательно снижая порядок модели. В настоящее время чаще поступают строго наоборот, начиная с простейшей модели, и при необходимости усложняя ее.

В данном случае получено очень высокое значение коэффициента корреляции r² = 0.978, а стандартная ошибка регрессии невелика. И все-таки главным инструментом анализа качества авторегрессии служит проверка значимости коэффициента регрессии самого высокого порядка из рассчитанных. Критерий Стьюдента в данном случае для единственного рассчитанного коэффициента b₁ равен 29.654 и его следует сравнить с табличной величиной одностороннего критерия Стьюдента, и проще всего, учитывая симметричность распределения, рассчитать его для удвоенного уровня значимости. Обычно мы принимаем доверительную вероятность на уровне 0.95, но функции и @tinv в Quattro и СТЬЮДРАСПОБР в Excel требует при расчете указания не вероятности, а уровня значимости, который в данном случае равен 0.05; поэтому мы обращаемся к функции с удвоенным значением, равным 0.1, и получаем величину 1.725. Гипотеза о незначимости коэффициента регрессии в данном случае отвергается и следует признать модель первого порядка приемлемой. Оценку значимости коэффициентов можно проводить и по Z-критерию, однако этот прием не принят в отечественной статистике.

Предыдущий раздел

Меню навигации

Следующий раздел

Created 24.08.2007, Revised 16.04.2008

Используются технологии uCoz