вторник, 24 февраля 2009 г.

Перспективы будущей модели

На сегодняшний момент имеется технология прогнозирования (см. Прогнозируем другие параметры по множественной корреляции и Прогнозируем закрытие по множественной корреляции). Появляется ряд вопросов.

Правильно-ли мы берем оценку качества по корреляции?

Оценка качества всех предыдущих моделей производилась только по корреляции. Нет полной гарантии того что данный подход достаточен. Необходимо проверить это. В качестве альтернатив этой оценки можно предложить оценку ошибки.

Как использовать полученные прогнозы?

Допустим у нас имеется некоторая технология прогнозирования будущих параметров в следующем дне. Как их использовать для игры на этой бумаге?

Есть небольшая проблема. В одном из экспериментов (см. Строим модель на прогнозах [090219_06]) мы пытались построить игру по прогнозам изменения среднего. модель имела одно грубое допущение - она всегда реализовывалась по предыдущему среднему курсу. После корректировки получили новую модель (см. Исправленная модель прогнозирования [090219_09]). Результаты упали до нуля. Она в редких случаях могла реализоваться в следующем дне по среднему курсу предыдущего дня.

Таким образом необходимо не только угадывать направление куда играть (вверх или вниз), но на каком уровне открывать позицию. Для этого понадобятся прогнозы среднего, верхнего и нижнего курса. Остается выяснить модель для перевода прогнозов в конкретную рекомендацию. Причем рекомендация будет включать два параметра: направление и уровень.

Будут ли в будущем повторяться эти зависимости?

До сих пор все модели оценивались только на одной выборке. На одной выборке получали модель и на этой-же выборке производили оценку качества. Одно здесь умоляет ситуацию - это то, что эта выборка была большая (1000 дней).

Здесь просматриваются несколько путей проверки.

Введение проверочной выборки. Можно работать на двух выборках - обучающей и тестовой. На обучающей выборке можно получать модель, а на тестовой выборке уже смотреть результат. Выборки можно расположить последовательно одну за другой.

Пошаговое построение моделей. Здесь подразумевается следующее. Шагаем по дням тестовой выборки. В каждом дне ищем модель по некоторому количеству предыдущих дней. Это фактически плывущая обучающая выборка. Как и ранее каждый день получаем новую модель на обучающей выборке, а на итоговой тестовой выборке оцениваем качество нашего подхода.

Каковы дальнейшие пути повышения качества модели?

Во всех предыдущих экспериментах прогнозировались следующие значения от предыдущего дня. Причем брались параметры только той-же бумаги. В качестве входов брались только разницы между параметрами в предыдущем дне отнесенные к среднему в этом-же дне. В качестве прогноза бралась разница между параметром в будущем дне к параметру в предыдущем дне отнесенная к среднему в предыдущем дне. Для восстановления абсолютного значения прогнозируемого параметра было необходимо умножать прогноз на среднее в предыдущем дне и добавлять участвующий параметр предыдущего дня.

Для усиления прогноза брались результаты от нескольких моделей и складывались по множественной корреляции. Результаты действительно становились лучше.

Для дальнейшего совершенствования модели необходимо пробовать следующее.

Необходимо расширять входы модели в глубину. Возможно есть решения если на входы начать подавать данные от нескольких предыдущих дней.

Необходимо расширять входы в ширину. Должны быть решения при добавлении данных от других инструментов.

Необходимо вводить другие инструменты оценки зависимостей. Одним из таких инструментов может быть метод box-counting. Другими методами могут быть - оценка ошибки, оценка угадывания знака.

Необходимо вводить другие прогнозные инструменты. Это может быть нейронная сеть, ассоциативные сети и другие нелинейные преобразователи.


Комментариев нет: