пятница, 3 октября 2008 г.

Линейная регрессия методом "гусеница" (6 предыдущих дней)

В добавок к проведённым экспериментам (см. Линейная регрессия методом "гусеница", Линейная регрессия методом "гусеница" (2 предыдущих дня), Линейная регрессия методом "гусеница" (3 предыдущих дня), Линейная регрессия методом "гусеница" (4 предыдущих дня) и Линейная регрессия методом "гусеница" (5 предыдущих дней)) ещё один. Здесь используем 6 предыдущих дня для построения прогноза.








Ну вот и начинает проявляться снижение. Смотрим дальше.

Линейная регрессия методом "гусеница" (5 предыдущих дней)

В добавок к проведённым экспериментам (см. Линейная регрессия методом "гусеница", Линейная регрессия методом "гусеница" (2 предыдущих дня), Линейная регрессия методом "гусеница" (3 предыдущих дня) и Линейная регрессия методом "гусеница" (4 предыдущих дня)) ещё один. Здесь используем 5 предыдущих дней для построения прогноза.





Таким образом можно и до доходной модели добраться. Хотя по Газпромнефти скорее всего количества угаданных знаков уже достаточно для положительной доходности.

Начинает проявляться некоторое новое свойство модели. Хорошее качество модели получается при малых лагах - до 100. При увеличении лага качество падает.

Пока есть время проведем эксперименты с разным количеством предыдущих дней. Да и вычислительных мощностей пока достаточно. Компьютер считает за приемлемое время.

Линейная регрессия методом "гусеница" (4 предыдущих дня).

В добавок к проведённым экспериментам (см. Линейная регрессия методом "гусеница", Линейная регрессия методом "гусеница" (2 предыдущих дня) и Линейная регрессия методом "гусеница" (3 предыдущих дня)) ещё один. Здесь используем 4 предыдущих дня для построения прогноза.





Интересно - долго ли это будет продолжаться. рост по прежнему продолжается. Пика пока не видать, хотя в литературе упоминается об ограничениях при увеличении лагового пространства. Смотрим дальше.

Линейная регрессия методом "гусеница" (3 предыдущих дня).

В добавок к проведённым экспериментам (см. Линейная регрессия методом "гусеница" и Линейная регрессия методом "гусеница" (2 предыдущих дня)) ещё один. Здесь используем 3 предыдущих дня для построения прогноза.





Изменения стали слабее, но движение в положительную сторону сохраняется.

Линейная регрессия методом "гусеница" (2 предыдущих дня).

В предыдущем эксперименте (см. Линейная регрессия методом "гусеница".) прогноз строился на одном предыдущем дне. В настоящем эксперименте осуществляем попытку строить прогноз из двух предыдущих дней. Смотрим результаты.







Наблюдаем повышение качества в основном по корреляции.

Линейная регрессия методом "гусеница".

В предыдущем эксперименте (см. Простая линейная регрессионная модель.) рассказывалось о проблеме забегания вперёд при получении данных для построения рекомендации (прогноза). В настоящем эксперименте данная проблема устранена. Здесь моделируется построение прогноза в каждом дне по данным которые известны только на расчётную дату. Т.е. берутся только предыдущие дни. В такой ситуации появляется вопрос - "Какую глубину выборки необходимо брать для расчёта корреляций и прочих параметров?". Для этого проведён эксперимент в котором брались разные глубины (кажется это называется лагом). Итак тестирование по-прежнему на диапазоне в 1 год по сегодняшнее число. Для каждого из расчётов получены по две характеристики: корреляция прогноза с реальными относительными изменениями и процент угадывания знака. Результаты ниже.



По результатам испытаний вычислены границы в виде максимумов, минимумов и среднего от корреляций и вероятности угадывания знака.



Полученные результаты можно сравнить с предыдущим экспериментом (см. Простая линейная регрессионная модель.). Скажем так, что результаты моделей отличаются в разных направлениях. Хотя настоящая модель более реальная. По угадыванию знака весьма не плохой результат (по крайней мере в максимумах). Если поставить оптимизирующую систему, то можно иметь неплохую модель. Но в рамках построения 23 модели мы ищем более сложную схему нежели чем линейная. И все эти эксперименты - лишь закладывание фундамента под мощную нелинейную модель.

Таким образом варьируя лагом можно получать модель с более лучшим качеством.

Простая линейная регрессионная модель.

Прошу прощения за предыдущую редакцию. Поспешил. В расчёты закралась ошибочка. Теперь печатаю точный вариант.

В рамках исследований для 23 модели проведён эксперимент по исследованию линейной регрессионной модели. В предыдущем эксперименте были даны оценки для корреляций с предыдущими значениями. На основе полученной матрицы корреляций проведено регрессионное восстановление ряда данных простым линейным преобразованием из относительных изменений предыдущего дня. Диапазон был прежним - 1 год. Таким образом в восстановлении ряда каждого инструмента участвовали все 7 рядов. Для востановленых рядов были получены оценки - корреляция и процент угадывания знака. Результаты представлены на графиках ниже.





Результаты обнадёживают. Но так модели не строятся. Рекомендации полученные в начале ряда тестирования в этой модели уже имели данные (корреляцию, среднее,...) за весь период. В реальности такое не известно. В следующем эксперименте будет использован метод гусеницы и такой проблемы не будет.

Все равно результаты этой модели будем использовать в дальнейшем для сравнения.

Прогноз курсов акций на 03.10.2008

Нынче пятница 3 октября. Смотрим, что компьютер нам спрогнозировал на сегодня.

Сбербанк Пр. и Газпромнефть должны подняться. Сбербанк, Норникель, Лукойл и Ростелеком должны упасть.

Прогноз в табличном виде и детальный отчёт в виде PDF файла смотреть ниже.

sber - down
sberp -
up
gmkn -
down
lkoh -
down
rtkm -
down
sibn -
up

Подробнее [PDF]

четверг, 2 октября 2008 г.

Прогноз курсов акций на 02.10.2008

Сегодня четверг, 2 октября. Смотрим, что компьютер нам спрогнозировал на сегодня.

Сбербанк, Сбербанк Пр., Лукойл и Газпромнефть должны подняться. Норникель и Ростелеком должны упасть.

Прогноз в табличном виде и детальный отчет в виде PDF файла смотреть ниже.

sber - up
sberp -
up
gmkn -
down
lkoh -
up
rtkm -
down
sibn -
up

Подробнее [PDF]

среда, 1 октября 2008 г.

Корреляция с предыдущими относительными изменениями

Проведён очередной эксперимент (модель № 23) по анализу корреляционной зависимости от относительных изменений в предыдущем дне. Результаты находятся в таблице ниже. Каждая строка из таблицы соответствует корреляционным коэффициентам выбранного инструмента к соответствующим инструментам в предыдущем дне обозначенным в столбцах. Для большей наглядности таблица продублирована в виде столбчатой диаграммы ниже.


Сбербанк Сбербанк Пр. Норникель Лукойл Ростелеком Сургутнефтегаз Газпромнефть
Сбербанк -0,11 +0,06 -0,13 +0,06 +0,06 +0,00 -0,04
Сбербанк Пр. -0,10 +0,07 -0,09 +0,09 -0,01 +0,03 -0,03
Норникель +0,04 +0,12 +0,07 +0,13 -0,03 +0,09 +0,09
Лукойл -0,23 -0,11 -0,09 +0,01 -0,01 -0,11 -0,11
Ростелеком +0,05 -0,00 -0,19 +0,02 -0,03 +0,03 +0,03
Сургутнефтегаз -0,10 +0,08 -0,03 +0,11 +0,04 +0,03 -0,01
Газпромнефть +0,05 +0,15 +0,07 +0,18 +0,11 +0,15 +0,13



Как видно из таблицы корреляционная связь очень низкая и находится в пределах 0,25. Это очень мало для построения регрессионной модели.

Анализ корреляции (совместной связанности) курсов акций.

В рамках 23 модели проведены исследования линейных корреляций относительных изменений курсов 7-и бумаг из нашего списка. Данные рассчитаны на периоде в один год по сегодняшнее число. Результаты представлены в таблице ниже и продублированы на графике.

Нетрудно увидеть высокую скоррелированость некоторых инструментов. Значит в большом количестве случаев они ведут себя одинаково. Но есть отдельный инструмент (Ростелеком) который показывает низкую связь с другими бумагами.



Сбербанк Сбербанк Пр. Норникель Лукойл Ростелеком Сургутнефтегаз Газпромнефть
Сбербанк +1,00 +0,93 +0,52 +0,76 +0,20 +0,82 +0,63
Сбербанк Пр. +0,93 +1,00 +0,53 +0,78 +0,18 +0,86 +0,65
Норникель +0,52 +0,53 +1,00 +0,56 +0,29 +0,54 +0,46
Лукойл +0,76 +0,78 +0,56 +1,00 +0,21 +0,88 +0,69
Ростелеком +0,20 +0,18 +0,29 +0,21 +1,00 +0,12 +0,19
Сургутнефтегаз +0,82 +0,86 +0,54 +0,88 +0,12 +1,00 +0,69
Газпромнефть +0,63 +0,65 +0,46 +0,69 +0,19 +0,69 +1,00


Линейные статистические характеристики

В рамках исследований 23 модели публикую результаты расчёта статистических характеристик. Результаты даны для периода в 1 год по сегодняшний день и представлены в таблице ниже. Результаты для относительных изменений продублированы в графиках ниже таблиц.

Инструмент Абсолютные значения Относительные изменения
Максимум Минимум Среднее Максимум Минимум Среднее Отклонение
Сбербанк 109,90 32,55 83,08 35,15% -21,72% -0,29% 3,82%
Сбербанк Пр. 76,15 14,72 53,13 47,73% -30,73% -0,31% 4,68%
Норникель 7620,50 3051,00 6161,27 8,45% -15,47% -0,17% 3,17%
Лукойл 2686,00 1366,00 2045,90 27,05% -12,83% -0,06% 3,30%
Ростелеком 301,49 182,51 271,05 5,58% -16,29% -0,12% 2,01%
Сургутнефтегаз 34,15 14519,00 25,03 45,34% -19,21% -0,28% 4,18%
Газпромнефть 190,10 95,00 141,46 16,85% -9,40% 0,10% 2,89%




Анализ доходности

Как уже анонсировалось ранее публикую результаты анализа теоретической и практической доходности модели.

Анализ теоретической доходности [PDF]
Анализ практической доходности [PDF]

В отчётах хорошо видно какой уровень доходности можно получить на разном качестве модели. Показан разрыв между теоретической и практической доходностью.

Изучайте.

Прогноз курсов акций на 01.10.2008

Сегодня среда, 1 октября. Первый день октября. Смотрим, что компьютер нам спрогнозировал на сегодня.

Лукойл и Ростелеком должны подняться. Сбербанк, Сбербанк Пр., Норникель и Газпромнефть должны упасть.

Прогноз в табличном виде и детальный отчет в виде PDF файла смотреть ниже.

sber - down
sberp -
down
gmkn -
down
lkoh -
up
rtkm -
up
sibn -
down

Подробнее [PDF]

вторник, 30 сентября 2008 г.

Оценка попадания закрытия в окно следующего дня.

Сегодня проведен эксперимент в рамках 23 модели по изучению попадания курса закрытия в окно максимума и минимума следующего дня. Данные расчитаны для 7 бумаг торгуемых на ММВБ за период в один год с 26 сентября 2007 года по 29 сентября 2008 года (250 рабочих дней). Подсчитывали в каком количестве дней закрытие предыдущего дня попадет в окно следующего дня. Результаты в таблице.

Инструмент Попал в окно Процент
Сбербанк 160 64,0%
Сбербанк Пр. 165 66,0%
Норникель 185 74,0%
Лукойл 164 65,6%
Ростелеком 210 84,0%
Сургутнефтегаз 180 72,0%
Газпромнефть 191 76,4%
В среднем 179,29 71,7%

Как видно из таблицы таких дней более 60%. В среднем по всем бумагам результат вышел за 70%. Наиболее сложная ситуация у Сбербанка. Там ниже 65%. Сразу видно, что по наиболее активной бумаге самые большие движения курса. Наиболее лучшая ситуация у Ростелекома. Но по этой бумаге и самые слабые доходности.

Таким образом имеем оценку попадания курса закрытия в окно между максимумом и минимумом в следующем дне.

Анонс. Анализ отличий теоретической и практической доходности модели.

Ранее поднимался вопрос о моделировании реальной игры (см. ОБСУЖДЕНИЕ). Дело в том, что в существующей модели не учитываются такие риски, как невозможность реализоваться в следующем дне по курсу закрытия предыдущего. Т.е окно максимума и минимума курса в следующем дне зачастую уходит за пределы курса закрытия в предыдущем. Кажется биржевики это называют "гэпом". А в существующей модели заявки ставятся по курсу закрытия предыдущего дня. Кроме того в существующей модели не учитывается комиссия. Все эти риски могут оказать существенное влияние на игру при использовании данной технологии прогнозирования направления изменения курса.

На днях проведены два эксперимента.

В первом эксперименте анализировалась теоретическая доходность модели при разном качестве (вероятности угадывания знаков). Теоретическая доходность - это та доходность которая может быть получена от модели при отсутствии рисков не реализоваться в следующем дне и при отсутствии комиссии. Именно такие теоретические выкладки представлены в ежедневных отчетах прилагаемых к прогнозам. Расчет производился для всех прогнозируемых бумаг. Результаты оказались очень интересными.

Во втором эксперименте в модель был добавлен учет рисков по невозможности реализоваться в следующем дне в связи с уходом окна максимума-минимума курса и добавлен учет комиссии. Результаты в виде графиков были наложены на теоретические, полученные в предыдущем эксперименте. В итоге прояснилось насколько риск нереализации в следующем дне снижает доходность модели и какой уровень качества должен быть у модели, чтобы эффективно играть.

В обоих экспериментах моделировалась игра на разных уровнях качества на отрезке в один год.

В настоящее время отчеты по двум этим экспериментам находятся на оформлении. Скорее всего завтра выставлю оба этих отчета в блоге.

Прогноз курсов акций на 30.09.2008

Сегодня четверг, 30 сентября. Последний день сентября. Смотрим, что компьютер нам спрогнозировал на сегодня.

Сбербанк и Сбербанк Пр. должны подняться. Норникель, Лукойл, Ростелеком и Газпромнефть должны упасть.

Прогноз в табличном виде и детальный отчет в виде PDF файла смотреть ниже.

sber - up
sberp -
up
gmkn -
down
lkoh -
down
rtkm -
down
sibn -
down

Подробнее [PDF]

понедельник, 29 сентября 2008 г.