пятница, 3 октября 2008 г.

Линейная регрессия методом "гусеница".

В предыдущем эксперименте (см. Простая линейная регрессионная модель.) рассказывалось о проблеме забегания вперёд при получении данных для построения рекомендации (прогноза). В настоящем эксперименте данная проблема устранена. Здесь моделируется построение прогноза в каждом дне по данным которые известны только на расчётную дату. Т.е. берутся только предыдущие дни. В такой ситуации появляется вопрос - "Какую глубину выборки необходимо брать для расчёта корреляций и прочих параметров?". Для этого проведён эксперимент в котором брались разные глубины (кажется это называется лагом). Итак тестирование по-прежнему на диапазоне в 1 год по сегодняшнее число. Для каждого из расчётов получены по две характеристики: корреляция прогноза с реальными относительными изменениями и процент угадывания знака. Результаты ниже.



По результатам испытаний вычислены границы в виде максимумов, минимумов и среднего от корреляций и вероятности угадывания знака.



Полученные результаты можно сравнить с предыдущим экспериментом (см. Простая линейная регрессионная модель.). Скажем так, что результаты моделей отличаются в разных направлениях. Хотя настоящая модель более реальная. По угадыванию знака весьма не плохой результат (по крайней мере в максимумах). Если поставить оптимизирующую систему, то можно иметь неплохую модель. Но в рамках построения 23 модели мы ищем более сложную схему нежели чем линейная. И все эти эксперименты - лишь закладывание фундамента под мощную нелинейную модель.

Таким образом варьируя лагом можно получать модель с более лучшим качеством.

Комментариев нет: