Обработка разнородной информации на основе структур знаний в виде расширенных семантических сетей - davaiknam.ru o_O
Главная
Поиск по ключевым словам:
страница 1
Похожие работы
Название работы Кол-во страниц Размер
Использование семантических сетей, расширенных деревьями И/или для... 1 126.44kb.
Лекция №1. Введение в архитектуру компьютерных сетей. 2 Лекция №2. 1 219.84kb.
Примерные билеты 1 48.13kb.
Мбоу «Европейский лицей» п. Пригородный 1 61.25kb.
Условия и порядок получения информации Федеральной информационной... 1 14.88kb.
Билеты по информатике 9 класс (теория кратко) 3 395.76kb.
Нейрокомпьютинг, нейросети и нейрокомпьютеры 3 516.97kb.
И методы поиска информационных ресурсов с использованием семантических... 1 238.29kb.
Соколовская Т. Б., вед библиотекарь хнтусх им. П. Василенко Лингвистическое... 1 31.58kb.
Билеты по информатике для сдачи экзамена по выбору выпускниками 9... 1 53.01kb.
Проект Система стандартизации 1 61.98kb.
Лекции 68 час экзамен 1 29.4kb.
Направления изучения представлений о справедливости 1 202.17kb.

Обработка разнородной информации на основе структур знаний в виде расширенных семантических - страница №1/1

ОБРАБОТКА РАЗНОРОДНОЙ ИНФОРМАЦИИ НА ОСНОВЕ СТРУКТУР ЗНАНИЙ В ВИДЕ РАСШИРЕННЫХ СЕМАНТИЧЕСКИХ СЕТЕЙ
Рабинович Борис Ильич
ЗАО «Делойт и Туш»

Москва, Россия

eagman@mail.ru
Многие задачи пользователей связаны со сбором и обработкой информации из различных источников. Такая информация достаточно разнородна. Например, в криминальной милиции это тексты на естественном языке (сводки происшествий, обвинительные заключения, справки по уголовным делам), информация из различных справочников (телефоны, адреса), биллинги телефонных переговоров и др. Информация может храниться в виде файлов, в различных БД или извлекаться из сети Интернет. Обработка должна быть максимально автоматизирована, что предполагает решение сложных логико-аналитических задач (поиск объектов, анализ их связей и др.). Сказанное относится и к другим областям. Перспективным является разработка технологий и систем, позволяющих осуществить на единой основе агрегацию, хранение и аналитическую обработку разнородной информации достаточно унифицированными средствами.
Такая система, ориентированная на обработку текстов естественного языка (ЕЯ), разработана в ИПИ РАН в рамках проектов «Аналитик» [2] и связанных проектов «Диес», «Икс», «Поток». Созданная система «Аналитик» нашла широкое применение в различных предметных областях. Уровень полученных результатов сопоставим с передовыми научными исследованиями за рубежом [1].
Необходимо обеспечить на единой основе обработку различного рода текстовой информации на естественном языке, биллингов телефонных переговоров, информации из БД. В этом случае пользователь-аналитик будет получать из одного источника полную информацию в наиболее удобном виде. Кроме этого на сегодняшний день актуальной задачей в государственных органах и бизнес структурах является задача создания электронных хранилищ и библиотек, позволяющих помимо обработки перечисленных типов данных выявлять информацию из статических и динамических изображений (графические образы рукописных текстов, фотографии, видео файлы и т.п.), звуковых файлы. Актуальный пример – «Государственная автоматизированная система управления приоритетными национальными проектами» [3]. В данной работе раскрыты некоторые аспекты решения указанных проблем.

ЛИТЕРАТУРА


FASTUS:a Cascaded Finite-State Trasducerfor Extracting Information from Natural-Language Text. AIC, SRI International. Menlo Park. California, 1996.
Кузнецов И.П., Мацкевич А.Г. Особенности организации базы предметных и лингвистических знаний в системе АНАЛИТИК. Труды международной конференции Диалог'2003 - М.: Изд-во «Наука», 2003.
ФЦП «Электронная Россия». – Режим доступа: http://www.elrussia.ru/ – Загл. с экрана. – Яз. рус., англ.




Любознательность — та же суетность. Чаще всего люди стремятся приобрести знания, чтобы потом ими похваляться. Блез Паскаль
ещё >>