Предыдущий раздел | Меню навигации | Следующий раздел |
Еще один метод, полезный для прогнозирования по временным рядам, основан на авторегрессионных моделях. Обычно обнаруживается, что значения отклика в некоторой точке временного ряда сильно коррелировано с несколькими предшествующими и/или последующими значениями. Действительно, для многих явлений их современное состояние функционально определяется предшествующими состояниями системы, в большей степени недавними, в гораздо меньшей – далеко отстоящими от заданного по временному ряду. Подобные связи принято называть автокорреляцией – корреляцией ряда с самим собой.
Автокорреляция первого порядка характеризует тесноту связи между соседними значениями временного ряда, автокорреляция второго порядка – между отстоящими друг от друга на два периода etc. И вообще, автокорреляция n-го порядка относится к степени связанности откликов, разнесенных на n периодов. Предполагая, что возникшая связь между значениями сохранится некоторое время в будущем, мы получаем механизм прогнозирования, основанный на построении регрессии точек ряда на самих себя, то есть – авторегрессии.
Авторегрессионные модели разных порядков – первого, второго, в общем случае n-ого – можно описать уравнениями следующего вида:
где b0 - константа (свободный член) авторегрессионного уравнения, b1, b2,... bn – коэффициенты авторегрессии, Yi - величина отклика в некоторый момент времени, Yi–1, Yi–2,...Yi–n – соответственно отклики одним, двумя,... n периодами ранее заданного, – нескоррелированная случайная компонента, присутствующая в отклике и связанная с ошибками наблюдения и погрешностями модели.
Понятно, что применяя средства регрессионного анализа пакетов Quattro Pro и Excel, можно строить авторегрессионные зависимости также элегантно, как и простые уравнения регрессии. Зависимой переменной при построении авторегрессии первого порядка будет сам временной ряд, а независимой – он же, но смещенный на одно значение вниз. Таким образом, второе значение ряда будет определяться регрессией на первой значение, третье – регрессией на второе и так далее. Ниже на странице приведены итоговые результаты построения уравнения авторегрессии первого порядка, но Вы также можете загрузить таблицу в формате Quattro или в формате Excel и выполнить упражнение, а затем сравнить свои результаты с представленными здесь.
|
Результаты расчета коэффициентов авторегрессии
Результат регрессионного анализа | |
Константа | 0.477 |
Оценка стандартной ошибки Y | 0.839 |
Коэффициент вариации | 0.978 |
Число наблюдений | 22 |
Степени свободы | 20 |
Коэффициент(ы) X | 1.032 |
Стандартная ошибка коэффициента | 0.035 |
Критерий Стьюдента | 29.654 |
Табличное значение критерия Стьюдента | 1.725 |
Наблюдаемые значения отклика и расчет по модели авторегрессии
Год | Объем выпуска | Значение X для регрессии | Рассчитанное значение |
1970 | 2.8 | — | — |
1971 | 3.0 | 2.8 | 3.368 |
1972 | 3.5 | 3.0 | 3.574 |
1973 | 4.0 | 3.5 | 4.091 |
1974 | 4.6 | 4.0 | 4.607 |
1975 | 5.0 | 4.6 | 5.226 |
1976 | 5.4 | 5.0 | 5.639 |
1977 | 6.0 | 5.4 | 6.052 |
1978 | 7.0 | 6.0 | 6.672 |
1979 | 8.0 | 7.0 | 7.704 |
1980 | 9.7 | 8.0 | 8.736 |
1981 | 10.3 | 9.7 | 10.491 |
1982 | 10.8 | 10.3 | 11.111 |
1983 | 10.2 | 10.8 | 11.627 |
1984 | 10.6 | 10.2 | 11.008 |
1985 | 10.6 | 10.6 | 11.421 |
1986 | 11.5 | 10.6 | 11.421 |
1987 | 13.3 | 11.5 | 12.350 |
1988 | 17.0 | 13.3 | 14.208 |
1989 | 18.4 | 17.0 | 18.028 |
1990 | 18.9 | 18.4 | 19.473 |
1991 | 19.4 | 18.9 | 19.989 |
1992 | 20.1 | 19.4 | 20.505 |
Прогнозные значения | |||
1993 | 20.1 | 21.228 | |
1994 | 21.228 | 22.393 | |
1995 | 22.393 | 23.595 | |
1996 | 23.595 | 24.836 |
Графическое представление результатов моделирования методом авторегрессии 1-го порядка в данном случае не требуется, поскольку еще нет уверенности, что модель хороша по статистическим критериям, тем не менее уже наблюдается хорошее соответствие расчета наблюдаемым величинам, а значит, и прогноз должен быть удовлетворительным.
Для построения надежного прогноза нам потребуется выбрать лучшую модель из многих авторегрессионных, и определение порядка этой лучшей модели часто оказывается нетривиальной задачей, включающей расчет статистических характеристик многих построенных моделей и нахождение хрупкого баланса между относительной простотой моделей низких порядков и игнорированием в этих моделях некоторых тонких взаимодействий между факторами, которые могут быть учтены только в более сложных моделях.
Обычно в эпоху до широкого распространения персональных компьютеров предпочитали начинать построения с моделей высоких порядков, а затем постепенно ее упрощать, последовательно снижая порядок модели. В настоящее время чаще поступают строго наоборот, начиная с простейшей модели, и при необходимости усложняя ее.
В данном случае получено очень высокое значение коэффициента корреляции r2 = 0.978, а стандартная ошибка регрессии невелика. И все-таки главным инструментом анализа качества авторегрессии служит проверка значимости коэффициента регрессии самого высокого порядка из рассчитанных. Критерий Стьюдента в данном случае для единственного рассчитанного коэффициента b1 равен 29.654 и его следует сравнить с табличной величиной одностороннего критерия Стьюдента, и проще всего, учитывая симметричность распределения, рассчитать его для удвоенного уровня значимости. Обычно мы принимаем доверительную вероятность на уровне 0.95, но функции и @tinv в Quattro и СТЬЮДРАСПОБР в Excel требует при расчете указания не вероятности, а уровня значимости, который в данном случае равен 0.05; поэтому мы обращаемся к функции с удвоенным значением, равным 0.1, и получаем величину 1.725. Гипотеза о незначимости коэффициента регрессии в данном случае отвергается и следует признать модель первого порядка приемлемой. Оценку значимости коэффициентов можно проводить и по Z-критерию, однако этот прием не принят в отечественной статистике.
Предыдущий раздел | Меню навигации | Следующий раздел |