понедельник, 11 июня 2007 г.

Бинарный поиск зависимостей

Проблема:

Есть большое количество входов и один выход. Необходимо найти наиболее значимые входы для добавления в модель.

На сегодняшний день одним из самых мощных методов для оценки значимости входов являетсы метод boxcounting.

Предложение 1:

Если представлять все входы и выходы в виде рядов со значениями +1 и -1, то скалярные произведения между отдельными рядами дадут по числа по модулю соответсвующие корреляции рядов. Чем больше абсолютное значение этой оценки, тем больше связанность рядов. Если оценка положительна, то ряды работают в одном направлении. Если число отрицательно, то ряды работают в противоположных направлениях. Можно отбирать такие входные ряды, где модуль оценки максимален. Таким образом можно подобрать хорошие входы. Процедуру можно реализовать простым векторным умножением матрицы входов на вектор выхода с взятием абсолютных значений. В полученой строке оценок отбираем максимальные.

Предложение 2:

Предложеным методом можно находить наиболее связанные между собой входы. Матричным перемножением двух матриц входов вычисляем модернизированную матрицу корреляций входов. Эту матрицу можно использовать для сжатия пространства входов.

Комментариев нет: