В добавок к проведённым экспериментам (см. Линейная регрессия методом "гусеница", Линейная регрессия методом "гусеница" (2 предыдущих дня), Линейная регрессия методом "гусеница" (3 предыдущих дня), Линейная регрессия методом "гусеница" (4 предыдущих дня) и Линейная регрессия методом "гусеница" (5 предыдущих дней)) ещё один. Здесь используем 6 предыдущих дня для построения прогноза.
Ну вот и начинает проявляться снижение. Смотрим дальше.
пятница, 3 октября 2008 г.
Линейная регрессия методом "гусеница" (5 предыдущих дней)
В добавок к проведённым экспериментам (см. Линейная регрессия методом "гусеница", Линейная регрессия методом "гусеница" (2 предыдущих дня), Линейная регрессия методом "гусеница" (3 предыдущих дня) и Линейная регрессия методом "гусеница" (4 предыдущих дня)) ещё один. Здесь используем 5 предыдущих дней для построения прогноза.
Таким образом можно и до доходной модели добраться. Хотя по Газпромнефти скорее всего количества угаданных знаков уже достаточно для положительной доходности.
Начинает проявляться некоторое новое свойство модели. Хорошее качество модели получается при малых лагах - до 100. При увеличении лага качество падает.
Пока есть время проведем эксперименты с разным количеством предыдущих дней. Да и вычислительных мощностей пока достаточно. Компьютер считает за приемлемое время.
Таким образом можно и до доходной модели добраться. Хотя по Газпромнефти скорее всего количества угаданных знаков уже достаточно для положительной доходности.
Начинает проявляться некоторое новое свойство модели. Хорошее качество модели получается при малых лагах - до 100. При увеличении лага качество падает.
Пока есть время проведем эксперименты с разным количеством предыдущих дней. Да и вычислительных мощностей пока достаточно. Компьютер считает за приемлемое время.
Линейная регрессия методом "гусеница" (4 предыдущих дня).
В добавок к проведённым экспериментам (см. Линейная регрессия методом "гусеница", Линейная регрессия методом "гусеница" (2 предыдущих дня) и Линейная регрессия методом "гусеница" (3 предыдущих дня)) ещё один. Здесь используем 4 предыдущих дня для построения прогноза.
Интересно - долго ли это будет продолжаться. рост по прежнему продолжается. Пика пока не видать, хотя в литературе упоминается об ограничениях при увеличении лагового пространства. Смотрим дальше.
Интересно - долго ли это будет продолжаться. рост по прежнему продолжается. Пика пока не видать, хотя в литературе упоминается об ограничениях при увеличении лагового пространства. Смотрим дальше.
Линейная регрессия методом "гусеница" (3 предыдущих дня).
В добавок к проведённым экспериментам (см. Линейная регрессия методом "гусеница" и Линейная регрессия методом "гусеница" (2 предыдущих дня)) ещё один. Здесь используем 3 предыдущих дня для построения прогноза.
Изменения стали слабее, но движение в положительную сторону сохраняется.
Изменения стали слабее, но движение в положительную сторону сохраняется.
Линейная регрессия методом "гусеница" (2 предыдущих дня).
В предыдущем эксперименте (см. Линейная регрессия методом "гусеница".) прогноз строился на одном предыдущем дне. В настоящем эксперименте осуществляем попытку строить прогноз из двух предыдущих дней. Смотрим результаты.
Наблюдаем повышение качества в основном по корреляции.
Наблюдаем повышение качества в основном по корреляции.
Линейная регрессия методом "гусеница".
В предыдущем эксперименте (см. Простая линейная регрессионная модель.) рассказывалось о проблеме забегания вперёд при получении данных для построения рекомендации (прогноза). В настоящем эксперименте данная проблема устранена. Здесь моделируется построение прогноза в каждом дне по данным которые известны только на расчётную дату. Т.е. берутся только предыдущие дни. В такой ситуации появляется вопрос - "Какую глубину выборки необходимо брать для расчёта корреляций и прочих параметров?". Для этого проведён эксперимент в котором брались разные глубины (кажется это называется лагом). Итак тестирование по-прежнему на диапазоне в 1 год по сегодняшнее число. Для каждого из расчётов получены по две характеристики: корреляция прогноза с реальными относительными изменениями и процент угадывания знака. Результаты ниже.
По результатам испытаний вычислены границы в виде максимумов, минимумов и среднего от корреляций и вероятности угадывания знака.
Полученные результаты можно сравнить с предыдущим экспериментом (см. Простая линейная регрессионная модель.). Скажем так, что результаты моделей отличаются в разных направлениях. Хотя настоящая модель более реальная. По угадыванию знака весьма не плохой результат (по крайней мере в максимумах). Если поставить оптимизирующую систему, то можно иметь неплохую модель. Но в рамках построения 23 модели мы ищем более сложную схему нежели чем линейная. И все эти эксперименты - лишь закладывание фундамента под мощную нелинейную модель.
Таким образом варьируя лагом можно получать модель с более лучшим качеством.
По результатам испытаний вычислены границы в виде максимумов, минимумов и среднего от корреляций и вероятности угадывания знака.
Полученные результаты можно сравнить с предыдущим экспериментом (см. Простая линейная регрессионная модель.). Скажем так, что результаты моделей отличаются в разных направлениях. Хотя настоящая модель более реальная. По угадыванию знака весьма не плохой результат (по крайней мере в максимумах). Если поставить оптимизирующую систему, то можно иметь неплохую модель. Но в рамках построения 23 модели мы ищем более сложную схему нежели чем линейная. И все эти эксперименты - лишь закладывание фундамента под мощную нелинейную модель.
Таким образом варьируя лагом можно получать модель с более лучшим качеством.
Простая линейная регрессионная модель.
Прошу прощения за предыдущую редакцию. Поспешил. В расчёты закралась ошибочка. Теперь печатаю точный вариант.
В рамках исследований для 23 модели проведён эксперимент по исследованию линейной регрессионной модели. В предыдущем эксперименте были даны оценки для корреляций с предыдущими значениями. На основе полученной матрицы корреляций проведено регрессионное восстановление ряда данных простым линейным преобразованием из относительных изменений предыдущего дня. Диапазон был прежним - 1 год. Таким образом в восстановлении ряда каждого инструмента участвовали все 7 рядов. Для востановленых рядов были получены оценки - корреляция и процент угадывания знака. Результаты представлены на графиках ниже.
Результаты обнадёживают. Но так модели не строятся. Рекомендации полученные в начале ряда тестирования в этой модели уже имели данные (корреляцию, среднее,...) за весь период. В реальности такое не известно. В следующем эксперименте будет использован метод гусеницы и такой проблемы не будет.
Все равно результаты этой модели будем использовать в дальнейшем для сравнения.
В рамках исследований для 23 модели проведён эксперимент по исследованию линейной регрессионной модели. В предыдущем эксперименте были даны оценки для корреляций с предыдущими значениями. На основе полученной матрицы корреляций проведено регрессионное восстановление ряда данных простым линейным преобразованием из относительных изменений предыдущего дня. Диапазон был прежним - 1 год. Таким образом в восстановлении ряда каждого инструмента участвовали все 7 рядов. Для востановленых рядов были получены оценки - корреляция и процент угадывания знака. Результаты представлены на графиках ниже.
Результаты обнадёживают. Но так модели не строятся. Рекомендации полученные в начале ряда тестирования в этой модели уже имели данные (корреляцию, среднее,...) за весь период. В реальности такое не известно. В следующем эксперименте будет использован метод гусеницы и такой проблемы не будет.
Все равно результаты этой модели будем использовать в дальнейшем для сравнения.
Прогноз курсов акций на 03.10.2008
Нынче пятница 3 октября. Смотрим, что компьютер нам спрогнозировал на сегодня.
Сбербанк Пр. и Газпромнефть должны подняться. Сбербанк, Норникель, Лукойл и Ростелеком должны упасть.
Прогноз в табличном виде и детальный отчёт в виде PDF файла смотреть ниже.
Сбербанк Пр. и Газпромнефть должны подняться. Сбербанк, Норникель, Лукойл и Ростелеком должны упасть.
Прогноз в табличном виде и детальный отчёт в виде PDF файла смотреть ниже.
четверг, 2 октября 2008 г.
Прогноз курсов акций на 02.10.2008
Сегодня четверг, 2 октября. Смотрим, что компьютер нам спрогнозировал на сегодня.
Сбербанк, Сбербанк Пр., Лукойл и Газпромнефть должны подняться. Норникель и Ростелеком должны упасть.
Прогноз в табличном виде и детальный отчет в виде PDF файла смотреть ниже.
Сбербанк, Сбербанк Пр., Лукойл и Газпромнефть должны подняться. Норникель и Ростелеком должны упасть.
Прогноз в табличном виде и детальный отчет в виде PDF файла смотреть ниже.
среда, 1 октября 2008 г.
Корреляция с предыдущими относительными изменениями
Проведён очередной эксперимент (модель № 23) по анализу корреляционной зависимости от относительных изменений в предыдущем дне. Результаты находятся в таблице ниже. Каждая строка из таблицы соответствует корреляционным коэффициентам выбранного инструмента к соответствующим инструментам в предыдущем дне обозначенным в столбцах. Для большей наглядности таблица продублирована в виде столбчатой диаграммы ниже.
Как видно из таблицы корреляционная связь очень низкая и находится в пределах 0,25. Это очень мало для построения регрессионной модели.
Сбербанк | Сбербанк Пр. | Норникель | Лукойл | Ростелеком | Сургутнефтегаз | Газпромнефть | |
Сбербанк | -0,11 | +0,06 | -0,13 | +0,06 | +0,06 | +0,00 | -0,04 |
Сбербанк Пр. | -0,10 | +0,07 | -0,09 | +0,09 | -0,01 | +0,03 | -0,03 |
Норникель | +0,04 | +0,12 | +0,07 | +0,13 | -0,03 | +0,09 | +0,09 |
Лукойл | -0,23 | -0,11 | -0,09 | +0,01 | -0,01 | -0,11 | -0,11 |
Ростелеком | +0,05 | -0,00 | -0,19 | +0,02 | -0,03 | +0,03 | +0,03 |
Сургутнефтегаз | -0,10 | +0,08 | -0,03 | +0,11 | +0,04 | +0,03 | -0,01 |
Газпромнефть | +0,05 | +0,15 | +0,07 | +0,18 | +0,11 | +0,15 | +0,13 |
Как видно из таблицы корреляционная связь очень низкая и находится в пределах 0,25. Это очень мало для построения регрессионной модели.
Анализ корреляции (совместной связанности) курсов акций.
В рамках 23 модели проведены исследования линейных корреляций относительных изменений курсов 7-и бумаг из нашего списка. Данные рассчитаны на периоде в один год по сегодняшнее число. Результаты представлены в таблице ниже и продублированы на графике.
Нетрудно увидеть высокую скоррелированость некоторых инструментов. Значит в большом количестве случаев они ведут себя одинаково. Но есть отдельный инструмент (Ростелеком) который показывает низкую связь с другими бумагами.
Нетрудно увидеть высокую скоррелированость некоторых инструментов. Значит в большом количестве случаев они ведут себя одинаково. Но есть отдельный инструмент (Ростелеком) который показывает низкую связь с другими бумагами.
Сбербанк | Сбербанк Пр. | Норникель | Лукойл | Ростелеком | Сургутнефтегаз | Газпромнефть | |
Сбербанк | +1,00 | +0,93 | +0,52 | +0,76 | +0,20 | +0,82 | +0,63 |
Сбербанк Пр. | +0,93 | +1,00 | +0,53 | +0,78 | +0,18 | +0,86 | +0,65 |
Норникель | +0,52 | +0,53 | +1,00 | +0,56 | +0,29 | +0,54 | +0,46 |
Лукойл | +0,76 | +0,78 | +0,56 | +1,00 | +0,21 | +0,88 | +0,69 |
Ростелеком | +0,20 | +0,18 | +0,29 | +0,21 | +1,00 | +0,12 | +0,19 |
Сургутнефтегаз | +0,82 | +0,86 | +0,54 | +0,88 | +0,12 | +1,00 | +0,69 |
Газпромнефть | +0,63 | +0,65 | +0,46 | +0,69 | +0,19 | +0,69 | +1,00 |
Линейные статистические характеристики
В рамках исследований 23 модели публикую результаты расчёта статистических характеристик. Результаты даны для периода в 1 год по сегодняшний день и представлены в таблице ниже. Результаты для относительных изменений продублированы в графиках ниже таблиц.
Инструмент | Абсолютные значения | Относительные изменения | |||||
Максимум | Минимум | Среднее | Максимум | Минимум | Среднее | Отклонение | |
Сбербанк | 109,90 | 32,55 | 83,08 | 35,15% | -21,72% | -0,29% | 3,82% |
Сбербанк Пр. | 76,15 | 14,72 | 53,13 | 47,73% | -30,73% | -0,31% | 4,68% |
Норникель | 7620,50 | 3051,00 | 6161,27 | 8,45% | -15,47% | -0,17% | 3,17% |
Лукойл | 2686,00 | 1366,00 | 2045,90 | 27,05% | -12,83% | -0,06% | 3,30% |
Ростелеком | 301,49 | 182,51 | 271,05 | 5,58% | -16,29% | -0,12% | 2,01% |
Сургутнефтегаз | 34,15 | 14519,00 | 25,03 | 45,34% | -19,21% | -0,28% | 4,18% |
Газпромнефть | 190,10 | 95,00 | 141,46 | 16,85% | -9,40% | 0,10% | 2,89% |
Анализ доходности
Как уже анонсировалось ранее публикую результаты анализа теоретической и практической доходности модели.
Анализ теоретической доходности [PDF]
Анализ практической доходности [PDF]
В отчётах хорошо видно какой уровень доходности можно получить на разном качестве модели. Показан разрыв между теоретической и практической доходностью.
Изучайте.
Анализ теоретической доходности [PDF]
Анализ практической доходности [PDF]
В отчётах хорошо видно какой уровень доходности можно получить на разном качестве модели. Показан разрыв между теоретической и практической доходностью.
Изучайте.
Прогноз курсов акций на 01.10.2008
Сегодня среда, 1 октября. Первый день октября. Смотрим, что компьютер нам спрогнозировал на сегодня.
Лукойл и Ростелеком должны подняться. Сбербанк, Сбербанк Пр., Норникель и Газпромнефть должны упасть.
Прогноз в табличном виде и детальный отчет в виде PDF файла смотреть ниже.
Лукойл и Ростелеком должны подняться. Сбербанк, Сбербанк Пр., Норникель и Газпромнефть должны упасть.
Прогноз в табличном виде и детальный отчет в виде PDF файла смотреть ниже.
вторник, 30 сентября 2008 г.
Оценка попадания закрытия в окно следующего дня.
Сегодня проведен эксперимент в рамках 23 модели по изучению попадания курса закрытия в окно максимума и минимума следующего дня. Данные расчитаны для 7 бумаг торгуемых на ММВБ за период в один год с 26 сентября 2007 года по 29 сентября 2008 года (250 рабочих дней). Подсчитывали в каком количестве дней закрытие предыдущего дня попадет в окно следующего дня. Результаты в таблице.
Как видно из таблицы таких дней более 60%. В среднем по всем бумагам результат вышел за 70%. Наиболее сложная ситуация у Сбербанка. Там ниже 65%. Сразу видно, что по наиболее активной бумаге самые большие движения курса. Наиболее лучшая ситуация у Ростелекома. Но по этой бумаге и самые слабые доходности.
Таким образом имеем оценку попадания курса закрытия в окно между максимумом и минимумом в следующем дне.
Инструмент | Попал в окно | Процент |
Сбербанк | 160 | 64,0% |
Сбербанк Пр. | 165 | 66,0% |
Норникель | 185 | 74,0% |
Лукойл | 164 | 65,6% |
Ростелеком | 210 | 84,0% |
Сургутнефтегаз | 180 | 72,0% |
Газпромнефть | 191 | 76,4% |
В среднем | 179,29 | 71,7% |
Как видно из таблицы таких дней более 60%. В среднем по всем бумагам результат вышел за 70%. Наиболее сложная ситуация у Сбербанка. Там ниже 65%. Сразу видно, что по наиболее активной бумаге самые большие движения курса. Наиболее лучшая ситуация у Ростелекома. Но по этой бумаге и самые слабые доходности.
Таким образом имеем оценку попадания курса закрытия в окно между максимумом и минимумом в следующем дне.
Анонс. Анализ отличий теоретической и практической доходности модели.
Ранее поднимался вопрос о моделировании реальной игры (см. ОБСУЖДЕНИЕ). Дело в том, что в существующей модели не учитываются такие риски, как невозможность реализоваться в следующем дне по курсу закрытия предыдущего. Т.е окно максимума и минимума курса в следующем дне зачастую уходит за пределы курса закрытия в предыдущем. Кажется биржевики это называют "гэпом". А в существующей модели заявки ставятся по курсу закрытия предыдущего дня. Кроме того в существующей модели не учитывается комиссия. Все эти риски могут оказать существенное влияние на игру при использовании данной технологии прогнозирования направления изменения курса.
На днях проведены два эксперимента.
В первом эксперименте анализировалась теоретическая доходность модели при разном качестве (вероятности угадывания знаков). Теоретическая доходность - это та доходность которая может быть получена от модели при отсутствии рисков не реализоваться в следующем дне и при отсутствии комиссии. Именно такие теоретические выкладки представлены в ежедневных отчетах прилагаемых к прогнозам. Расчет производился для всех прогнозируемых бумаг. Результаты оказались очень интересными.
Во втором эксперименте в модель был добавлен учет рисков по невозможности реализоваться в следующем дне в связи с уходом окна максимума-минимума курса и добавлен учет комиссии. Результаты в виде графиков были наложены на теоретические, полученные в предыдущем эксперименте. В итоге прояснилось насколько риск нереализации в следующем дне снижает доходность модели и какой уровень качества должен быть у модели, чтобы эффективно играть.
В обоих экспериментах моделировалась игра на разных уровнях качества на отрезке в один год.
В настоящее время отчеты по двум этим экспериментам находятся на оформлении. Скорее всего завтра выставлю оба этих отчета в блоге.
На днях проведены два эксперимента.
В первом эксперименте анализировалась теоретическая доходность модели при разном качестве (вероятности угадывания знаков). Теоретическая доходность - это та доходность которая может быть получена от модели при отсутствии рисков не реализоваться в следующем дне и при отсутствии комиссии. Именно такие теоретические выкладки представлены в ежедневных отчетах прилагаемых к прогнозам. Расчет производился для всех прогнозируемых бумаг. Результаты оказались очень интересными.
Во втором эксперименте в модель был добавлен учет рисков по невозможности реализоваться в следующем дне в связи с уходом окна максимума-минимума курса и добавлен учет комиссии. Результаты в виде графиков были наложены на теоретические, полученные в предыдущем эксперименте. В итоге прояснилось насколько риск нереализации в следующем дне снижает доходность модели и какой уровень качества должен быть у модели, чтобы эффективно играть.
В обоих экспериментах моделировалась игра на разных уровнях качества на отрезке в один год.
В настоящее время отчеты по двум этим экспериментам находятся на оформлении. Скорее всего завтра выставлю оба этих отчета в блоге.
Прогноз курсов акций на 30.09.2008
Сегодня четверг, 30 сентября. Последний день сентября. Смотрим, что компьютер нам спрогнозировал на сегодня.
Сбербанк и Сбербанк Пр. должны подняться. Норникель, Лукойл, Ростелеком и Газпромнефть должны упасть.
Прогноз в табличном виде и детальный отчет в виде PDF файла смотреть ниже.
Сбербанк и Сбербанк Пр. должны подняться. Норникель, Лукойл, Ростелеком и Газпромнефть должны упасть.
Прогноз в табличном виде и детальный отчет в виде PDF файла смотреть ниже.
понедельник, 29 сентября 2008 г.
Подписаться на:
Сообщения (Atom)