|
|
Краткое изложение теоретических основ и методов, реализующих уникальные функции системы TWINS
Елашкина Анна (elashkina@noolab.ru), 12.08.2008
Содержание
Назначение системы TWINSПри реализации проекта TWINS предполагается получить систему с элементами искусственного интеллекта, предназначенную для поиска информации в Internet. Основными функциями системы являются: семантический анализ текстов на русском и английском языках, анализ запросов пользователя (на этих же языках), аналитические действия по поиску интересующей пользователя информации.
По сравнению с существующими поисковыми системами Internet проект TWINS имеет следующие функциональные достоинства: - анализ текстов по смыслу имеющейся в них информации,
- синтаксический, грамматический и лексический анализ текстов,
- контекстный поиск информации (в накопленной базе данных или непосредственно в Internet) по запросу, сделанному в свободном формате,
- возможность целенаправленного обучения и автоматического самообучения системы,
- диалоговый режим взаимодействия пользователя с системой.
Теоретические предпосылкиОсновной теоретической предпосылкой к созданию данной системы послужило создание оригинальной логико-теоретической модели работы живого мозга. Некоторые основные положения изложены в работе [1]. В модель заложены унаследованные от нейронных сетей свойства, такие как возможность организовать выделение общего на массиве данных (абстрагирование), построение ассоциативных связей между элементами массива данных, рекурсивное разворачивание информации, восстановление целого по его части.
Взятая за основу модель постоянно развивается и в последнее время получены некоторые результаты, недостижимые в большинстве существующих моделей нейронных сетей.
Применение теории к программированиюИз используемой теоретической модели можно получить важные следствия в контексте применения ее к программированию. Основным выводом теории является признание нецелесообразности попыток смоделировать на цифровых компьютерах реальные физические процессы и структуры живого мозга. Но вместо этого возможна реализация на компьютере некоторых основных принципов работы живого мозга. Это позволит приблизиться к решению таких задач как:
- Переход от принципа "сущность-связь" (или "сущность-атрибут-связь") к основанному на объектном подходе принципу "объект-субъект-след", отражающему причинно-следственную связь, имеющую место в природе. А также реализация принципа описания знаний "объект-субъект-аспект-базис-след", являющегося ключевым в логике работы живого мозга.
- Пополнение (развитие) базы данных со свободой, характерной для естественных языков. При этом исчезает необходимость в предварительном проектировании логической и физической структуры для каждого применения базы данных, как этого требуют классические модели. В новой модели физическая, логическая и семантическая структуры БД совпадают и могут пополнятся (развиваться) в любой момент.
- Разбор (анализ) информации на глубоком семантическом уровне, при этом информацией могут являться записи на естественных языках, языках программирования, таблицы, графики, изображения и т.п.
- Выделение общего и частного на произвольных объемах информации.
- Восстановление и воспроизводство информации, т.е. получение в результате "обратной сборки" как исходных порций информации, так и новых, никогда не появлявшихся на входе.
- Развитие и изменение базы данных без переиндексации, в новой модели данных вместо физических индексов записей действуют логические ссылки (отношения) между объектами, произвольно задаваемые для каждого объекта в отдельности.
- Хранение информации в виде образов: относительно любого объекта за пределами базы данных (файлы на компьютере, ресурсы Intrnet, либо объекты реального мира) формируется образ (знание об объекте), которое логически соответствует образу, формирующемуся у человека в процессе познания.
- Обработка плохо формализуемой информации: к такому виду информации относятся тексты на естественных языках, их разбор и анализ невозможно описать строгими алгоритмами, вместо этого предлагается описание данных с применением механизма самообучения, что снимает ограничения по форматам представления входных данных.
Реализация семантического анализа текстовМетод, разработанный для семантического анализа текстов, кратко можно описать следующим образом.
Все тексты, поступающие в систему, преобразуются в векторную форму (вектор в предлагаемой модели - запись с пятью полями, в философском аспекте представляет собой акт познания). Векторная форма представления данных сохраняется на всех уровнях системы: от физического до уровня абстрактных образов.
В процессе разбора текст проходит синтаксический, грамматический, лексический и другие виды анализа. По результатам анализа создаются динамические деревья разбора, которые также составляются из векторов. Деревья доступны для анализа наряду с любыми другими данными в системе. В процессе разбора предложений текста (побуквенного, по слогам, по словам, по словосочетаниям) анализируются род, падеж, определяются части речи, фразеологические обороты и налаживаются ассоциативные связи слов с имеющимися в системе знаниями. При этом возникает уровень метаданных, возведенных над исходным текстом. На этом этапе заканчивается так называемый формальный анализ текстов. Результатом его является структурированный набор лексем, при этом каждая лексема существует в контексте исходного текста, а также сохраняется информация о связи между любыми разобранными частями. Сохраняется также информация об их родстве (характере родства) между собой и по отношению к ранее полученной (разобранной) информации.
Следующим уровнем обработки информации является семантический анализ. На этом уровне строятся такие вектора (акты познания), которые описывают каждый объект, встречающийся в текстах, через взаимодействие его с другими объектами. Метод построения акта познания предусматривает существование контекстов и рекурсивное представление знаний, описание причинно-следственных связей. Семантический анализ текста заключается в выделении новых знаний из полученной в текстовом виде информации. Из фразы выделяются объекты, отношения между ними, определяется контекст, связи между обнаруженными во фразе объектами, а также отношения их к объектам, имеющимся в системе.
Полученная в результате структура векторов представляет собой набор понятий.
На последнем этапе производится встраивание (запись, сохранение) полученных понятий в системе с тем, чтобы они могли в дальнейшем использоваться для разбора последующих текстов, либо для поиска тех текстов, в которых эти понятия фигурировали. Кроме этого, решается проблема существования противоречивых понятий с устранением противоречий в процессе обучения (выявление истинных и ложных понятий, либо разделение их по аспектам, где все они истинны). Родственной является проблема уточнения понятий (переоценка), которая также решается ориентированной на описание знаний векторной моделью.
Конкретные алгоритмические решенияВ процессе развития векторной модели представления знаний и в ходе исследований по реализации этой модели на компьютере получен ряд алгоритмических решений. Наиболее важными из них являются следующие: - усовершенствованная обработка списков, разбор и преобразование в дерево,
- построение вложенных словарей на пересекающихся небинарных деревьях, образующих сложный граф,
- рекурсивная организация участков графа,
- сетевая модель базы данных на пятимерных элементах,
- хранение формальных данных с наложением семантики (ссылок на семантическую информацию о формальных данных),
- наложение семантических индексов (информация о взаимосвязях объектов в различных качествах - объект, субъект, аспект, базис, след),
- статистическая сортировка данных с устранением образованной избыточности,
- построение самообучающегося формального анализирующего агента на основе классической нейронной сети,
- пятимерная векторная семантическая модель (семантическая сеть),
- рекурсивная организация семантической сети с графовидной структурой,
- наложение ассоциативных связей, охватывающих семантическую сеть и словари, использующиеся для формального разбора (синтеза) текстов - то есть связь семантики с текстовым представлением.
Все ключевые алгоритмы основаны на базовых операциях над векторами и множествами векторов. Такими операциями являются операции теории множеств, подстановка и комбинаторика с сохранением связности и рекурсивного представления операндов.
Дополнительно об особенностях предложенной векторной моделиВ многочисленных работах по ИИ (искусственному интеллекту) подчеркивается отсутствие общей теории представления знаний, адекватно отражающей человеческое мышление. Подобной моделью по мнению сотрудников NooLab может являться предложенная В.Н.Елашкиным модель построения нейронной сети на основе рекурсивного представления знаний.
В работах [7], [8] упоминается возможность и перспективность использования для представления знаний таких моделей, которые построены на семантических сетях с фреймовой организацией. Предложенная рекурсивная сетевая модель (пятимерные вектора и подобная им низкоуровневая структура атомов) является существенным принципиальным развитием классических сетевых и фреймовых моделей, в первую очередь это достигается внесением рекурсивности.
Важным является тот факт, что, в отличие от Пролога, в новой логической модели исчисление рассматривает каждое значение, получающееся в результате операций (выводов, расчетов и т.п.), как новый объект, а точнее - след, выступающий в качестве объекта в некотором новом акте познания. В этом преодолевается принципиальное расстояние между операциями и операторами (на логическом уровне).
Для осуществления нечетко задаваемых отношений между объектом и множеством в классических ассоциативных моделях (и исчислениях) вводятся более или менее сложные кванторы, работающие тем не менее достаточно определенно. Новая модель допускает реализацию кванторов, но при этом у них появляются параметры: как минимум, "аспект" и "базис". Это ставит запись квантора в один ряд с записями актов познания и, следовательно, оформляется пятимерным вектором.
Отличие создаваемой модели от других просматривается и в том, что в ней нет фиксированных иерархических, видо-родовых, наследственных и т.п. отношений между объектами. Открытость к описанию произвольных комбинаций и сочетаний объектов, их свойств и отношений с другими объектами позволяет ближе подойти к описанию модели мышления и снижает ограничения по реализации данной модели для накопления семантических данных и построения ассоциаций между ними.
Литература- Елашкин В. Н. "Концептуальное описание модели нейронной сети". Труды ВЦ СО РАН. Информатика. Новосибирск, 1994г., с. 122-137.
- Гуков Л.И., Ломако Е.И., Морозова А.В. Макетирование, проектирование и реализация диалоговых информационных систем. - М.: Финансы и статистика, 1993.
- Таунсенд К., Фохт Д. Проектирование и программная реализация экспертных систем на персональных ЭВМ. - М.: Финансы и статистика, 1990.
- Гриф М.Г. Применение объектно-ориентированного подхода к оптимальному проектированию человеко-машинных комплексов. Научные основы высоких технологий: труды международной научно-технической конференции, том 2. - Новосибирск, 1997.
- Головаченко В.Б. Имитационное моделирование на основе экспертной информации. Научные основы высоких технологий: труды международной научно-технической конференции, том 2. - Новосибирск, 1997.
- Гаврилов А.В., Канглер В.М., Катомин М.Н. Обнаружение ассоциативных взаимосвязей между полями в базах данных с использованием нейронной сети. Научные основы высоких технологий: труды международной научно-технической конференции, том 2. - Новосибирск, 1997.
- Соловьева Н.С., Сомин Н.В. Представление знаний в ассоциативной модели. Системы и средства информатики, выпуск 3. - М. Наука, 1992.
- Соловьева Н.С., Сомин Н.В. Принципы реализации ассоциативной модели. Системы и средства информатики, выпуск 3. - М. Наука, 1992.
- Бабенко В.Э., Егорышева О.Н., Кулешова Г.Л. Экспертная система качественного контроля знаний. Системы и средства информатики, выпуск 3. - М. Наука, 1992.
- Барсуков А.В., Гаврилов А.В. Распределенная система баз знаний в среде Internet. Труды 6го междунар. семинара "Распределенная обработка информации", Новосибирск, июнь, 1998. - С. 353-356.
- Барсуков А.В., Гаврилов А.В., Олейник Е.В. Представление знаний в системе распределенных баз знаний и данных в Internet/Intranet. Труды международной научно-технической конференции"Научные основы высоких технологий", Т. 2, стр. 212-217, Новосибирск, сентябрь, 1997 г.
- Гаврилов А.В. Проблемы обработки символьной информации в нейронных сетях. Международная конференция "SCM-98", С.-Петербург, июнь, 1998.
- Дорогов А.Ю. Алексеев А.А. Структурные модели и топологическое проектирование быстрых нейронных сетей. УДК 681.322:517.444.
- Короткий С. Нейронные сети: алгоритм обратного распространения. Опубликовано в Internet.
- Короткий С. Нейронные сети: основные положения. Опубликовано в Internet.
- Короткий С. Нейронные сети: обучение без учителя. Опубликовано в Internet.
- Короткий С. Нейронные сети Хопфилда и Хэмминга. Опубликовано в Internet.
- Уоссермен Ф. Нейрокомпьютерная техника: теория и практика. Перевод на русский язык, Ю. А. Зуев, В. А. Точенов, 1992. Опубликовано в Internet.
- Борисов Ю., Кашкаров В., Сорокин С. Нейросетевые методы обработки информации и средства их программно-аппаратной поддержки. НТЦ "Модуль", Москва, опубликовано в Internet.
- Макагонов П.П. Технология автоматического анализа текстов. Опубликовано в Internet.
Елашкина Анна (elashkina@noolab.ru), 12.08.2008
руководитель отдела исследований компании NooLab (Новосибирск)
|