пятница, 3 октября 2008 г.

Линейная регрессия методом "гусеница" (6 предыдущих дней)

В добавок к проведённым экспериментам (см. Линейная регрессия методом "гусеница", Линейная регрессия методом "гусеница" (2 предыдущих дня), Линейная регрессия методом "гусеница" (3 предыдущих дня), Линейная регрессия методом "гусеница" (4 предыдущих дня) и Линейная регрессия методом "гусеница" (5 предыдущих дней)) ещё один. Здесь используем 6 предыдущих дня для построения прогноза.








Ну вот и начинает проявляться снижение. Смотрим дальше.

Линейная регрессия методом "гусеница" (5 предыдущих дней)

В добавок к проведённым экспериментам (см. Линейная регрессия методом "гусеница", Линейная регрессия методом "гусеница" (2 предыдущих дня), Линейная регрессия методом "гусеница" (3 предыдущих дня) и Линейная регрессия методом "гусеница" (4 предыдущих дня)) ещё один. Здесь используем 5 предыдущих дней для построения прогноза.





Таким образом можно и до доходной модели добраться. Хотя по Газпромнефти скорее всего количества угаданных знаков уже достаточно для положительной доходности.

Начинает проявляться некоторое новое свойство модели. Хорошее качество модели получается при малых лагах - до 100. При увеличении лага качество падает.

Пока есть время проведем эксперименты с разным количеством предыдущих дней. Да и вычислительных мощностей пока достаточно. Компьютер считает за приемлемое время.

Линейная регрессия методом "гусеница" (4 предыдущих дня).

В добавок к проведённым экспериментам (см. Линейная регрессия методом "гусеница", Линейная регрессия методом "гусеница" (2 предыдущих дня) и Линейная регрессия методом "гусеница" (3 предыдущих дня)) ещё один. Здесь используем 4 предыдущих дня для построения прогноза.





Интересно - долго ли это будет продолжаться. рост по прежнему продолжается. Пика пока не видать, хотя в литературе упоминается об ограничениях при увеличении лагового пространства. Смотрим дальше.

Линейная регрессия методом "гусеница" (3 предыдущих дня).

В добавок к проведённым экспериментам (см. Линейная регрессия методом "гусеница" и Линейная регрессия методом "гусеница" (2 предыдущих дня)) ещё один. Здесь используем 3 предыдущих дня для построения прогноза.





Изменения стали слабее, но движение в положительную сторону сохраняется.

Линейная регрессия методом "гусеница" (2 предыдущих дня).

В предыдущем эксперименте (см. Линейная регрессия методом "гусеница".) прогноз строился на одном предыдущем дне. В настоящем эксперименте осуществляем попытку строить прогноз из двух предыдущих дней. Смотрим результаты.







Наблюдаем повышение качества в основном по корреляции.

Линейная регрессия методом "гусеница".

В предыдущем эксперименте (см. Простая линейная регрессионная модель.) рассказывалось о проблеме забегания вперёд при получении данных для построения рекомендации (прогноза). В настоящем эксперименте данная проблема устранена. Здесь моделируется построение прогноза в каждом дне по данным которые известны только на расчётную дату. Т.е. берутся только предыдущие дни. В такой ситуации появляется вопрос - "Какую глубину выборки необходимо брать для расчёта корреляций и прочих параметров?". Для этого проведён эксперимент в котором брались разные глубины (кажется это называется лагом). Итак тестирование по-прежнему на диапазоне в 1 год по сегодняшнее число. Для каждого из расчётов получены по две характеристики: корреляция прогноза с реальными относительными изменениями и процент угадывания знака. Результаты ниже.



По результатам испытаний вычислены границы в виде максимумов, минимумов и среднего от корреляций и вероятности угадывания знака.



Полученные результаты можно сравнить с предыдущим экспериментом (см. Простая линейная регрессионная модель.). Скажем так, что результаты моделей отличаются в разных направлениях. Хотя настоящая модель более реальная. По угадыванию знака весьма не плохой результат (по крайней мере в максимумах). Если поставить оптимизирующую систему, то можно иметь неплохую модель. Но в рамках построения 23 модели мы ищем более сложную схему нежели чем линейная. И все эти эксперименты - лишь закладывание фундамента под мощную нелинейную модель.

Таким образом варьируя лагом можно получать модель с более лучшим качеством.

Простая линейная регрессионная модель.

Прошу прощения за предыдущую редакцию. Поспешил. В расчёты закралась ошибочка. Теперь печатаю точный вариант.

В рамках исследований для 23 модели проведён эксперимент по исследованию линейной регрессионной модели. В предыдущем эксперименте были даны оценки для корреляций с предыдущими значениями. На основе полученной матрицы корреляций проведено регрессионное восстановление ряда данных простым линейным преобразованием из относительных изменений предыдущего дня. Диапазон был прежним - 1 год. Таким образом в восстановлении ряда каждого инструмента участвовали все 7 рядов. Для востановленых рядов были получены оценки - корреляция и процент угадывания знака. Результаты представлены на графиках ниже.





Результаты обнадёживают. Но так модели не строятся. Рекомендации полученные в начале ряда тестирования в этой модели уже имели данные (корреляцию, среднее,...) за весь период. В реальности такое не известно. В следующем эксперименте будет использован метод гусеницы и такой проблемы не будет.

Все равно результаты этой модели будем использовать в дальнейшем для сравнения.