Восканян Е.С., Тараканов М.В.
ООО «ДБС», г. Санкт-Петербург
тел. (812) – 159-8918,
E-mail: [email protected],
WWW: http://dbsys.narod.ru
Введение.
Темой статьи является описание программы динамической визуализации многомерных
данных. Программа реализует преобразование числовой информации об объектах с
большим количеством параметров в наглядные графические динамические образы.
Данный программный продукт призван упростить проблему разведочного
статистического анализа многомерных данных в условиях априорной неопределённости
в отношении объектов и условий наблюдения.
Постановка проблемы.
Существует большое количество программных средств, нацеленных на аналитическую
работу с многомерными структурами данных. Однако при использовании подобных
программ пользователь наталкивается на целый ряд проблем.
Во-первых, процедуры обработки данных налагают определенные требования на
выборку (например, независимость, однородность, случайность, вид распределения).
Несоответствие исходной выборки этим требованиям, вообще говоря, приводит к
недостоверным результатам обработки.
Во-вторых, пользователь – специалист в определенной области знаний - зачастую
плохо понимает аппарат многомерного анализа, а при отсутствии образного
визуального представления результатов с трудом их воспринимает.
И, наконец, значительная часть задач в астрономии, биологии, медицине,
экономике и др. науках просто не поддается чисто аналитическому описанию и
требует дополнительного описания на качественном образном уровне.
Всё это говорит о необходимости создания простых, удобных в использовании
средств визуализации данных.
Решение проблемы.
Суть визуализации состоит в проецировании многомерных данных на заданную
определённым образом двумерную плоскость.
Рассмотрим пространство объектов с размерностью, равной числу параметров
исходного множества и мощностью равной количеству объектов.
В многомерном пространстве зададим двумерную плоскость проекции. Нормаль
плоскости проекции задаётся своими направляющими косинусами. Исходное множество
объектов образует в пространстве параметров так называемое облако объектов или
облако точек, которое и проецируется на заданную плоскость проекции вдоль
направления нормали.
В результате такого проецирования на плоскости проекции (а для пользователя
на экране дисплея) возникает образ проекции исходного множества объектов.
Однако, это пока ещё только статичная картинка.
Подобные методы статичного проецирования уже давно широко используются в
статистических программах. Они являют собой пример традиционной машинной
графики, не затрагивающей образное интуитивное мышление пользователя. Говоря
другими словами, данные методы статичного проецирования не являются
когнитивными.
Принципиальным же отличием разработанных в данном проекте средств визуализации,
является то, что используются алгоритмы, обладающие свойством когнитивности.
Основная идея описываемого метода заключается в том, что заданную плоскость
проекции предлагается вращать в многомерном пространстве. При этом, естественно,
образ проекции облака точек по мере вращения плоскости будет неким образом
видоизменяться. И пользователь сможет наблюдать его в динамике. Но, что самое
главное, у пользователя при этом будет создаваться ощущение того, что он видит
просто вращение обычного трёхмерного образа!
Т.о. исходные данные преобразуются в удобный для восприятия графический
образ, который, с другой стороны, отражает объективные количественные
многомерные свойства и природу объектов, с которыми работает пользователь.
Одним из аспектов визуального представления данных является нормировка
значений исходного множества объектов по каждому из параметров (т.е. по осям
многомерного пространства). В программе предусмотрен режим ранжирования исходных
значений, т.е. переход по всем осям от реальных значений к ранговым. Благодаря
использованию этой процедуры достигается статистически естественная нормировка,
которая обеспечивает сохранение свойств выборки.
Еще раз отметим, что единственным требованием к исходной выборке является
ограничение снизу ее размерности (ограничение количества параметров): не менее
3-х. Никаких других предположений (о виде распределения, однородности,
независимости выборки и пр.) не выдвигается.
Заключение.
Описанные выше идеи реализованы в программе SpaceWalker. Исходные данные могут
быть импортированы из Excel-файла или получены на основании SQL-запроса к базе
данных Interbase/Firebird.
Демо-версия программы доступна на нашем сайте в Интернете.
|