Воспользуйтесь поиском к примеру Реферат        Грубый поиск Точный поиск
Вхід в абонемент


Интернет реклама УБС






Реферат

на тему

"Использование фреймов и семантических сетей для обработки естественного языка"

Содержание

Обеспечение взаимодействия с ЭВМ на естественном языке (ПМ) является важнейшей целью исследований по искусственному интеллекту (ИИ). Базы данных, пакеты прикладных программ и экспертные системы, основанные на ИИ, требуют оснащения гибким интерфейсом для многочисленных пользователей, не желающих общаться с компьютером на искусственном языке. В то время как многие фундаментальные проблемы в области обработки ПМ (Natural Language Processing, NLP) еще не решены, прикладные системы могут иметь интерфейс, понимает ПМ при определенных ограничениях.

Существуют два вида и, следовательно, две концепции обработки естественного языка:

  • для отдельных предложений
  • для ведения интерактивного диалога.

Обработка естественного языка

Обработка естественного языка - это формулирование и исследование компьютерно-эффективных механизмов для обеспечения коммуникации с ЭВМ на ЕЯ. Объектами исследований являются:

  1. собственно естественные языки
  2. использования ПМ как для коммуникации между людьми, так и для коммуникации человека с ЭВМ.

Цель исследований - создание компьютерных-эффективных моделей коммуникации на ПМ. Именно такая постановка задачи отличает NLP от задач традиционной лингвистики и других дисциплин, изучающих ПМ, и позволяет отнести ее к области ИИ. Проблемой NLP занимаются две дисциплины: лингвистика и когнитивная психология.

Традиционно лингвисты занимались созданием формальных, общих, структурных моделей ПМ, и поэтому отдавали предпочтение таким моделям, позволявшие выявлять больше языковых закономерностей и делать обобщения. Практически никакого внимания не уделялось пригодности моделей с точки зрения компьютерной эффективности их применения. Таким образом, оказалось, что лингвистические модели, характеризуя собственно язык, не рассматривали механизмы его порождения и распознавания. В этом случае, хорошим примером возникает породжуяча грамматика Хомского, оказавшуюся совершенно непригодной на практике в качестве базы для компьютерного распознавания ПМ.

Для когнитивной психологии целью является не моделирование структуры языка, а ее использование. Специалисты этой области также не уделяли большое значение проблеме компьютерной эффективности

Выделяют общую и прикладную NLP. Метою.загальнои NLP является разработка моделей использования языка человеком, которые при этом условии оставались компьютерно-эффективными. Базовым для этого является общее понимание текстов, как это определяется в работах Чарняка, Шенка, Карбонелла и др.. Несомненно, общая NLP требует огромных знаний о реальном мире, и большая часть работ сосредоточена на представлении таких знаний и их применения с целью распознавании сообщения, поступающего на ПМ. На сегодняшний день, ИИ еще не достиг такого уровня развития, когда для решения подобных задач в большом объеме использовались бы знания о реальном мире, а с тех пор существующие системы можно называть лишь экспериментальными, поскольку они работают с ограниченным количеством тщательно отобранных шаблонов на ЕЯ.

Прикладная NLP занимается обычно не моделированием, а непосредственно возможностью коммуникации человека с ЭВМ на ЕЯ. В этом случае уже не так важно, как введен выражение будет понятно с точки зрения знаний о реальном мире, а важным является получение информации о том, чем и как может быть полезной для пользователя ЭВМ (примером может быть интерфейс экспертных систем). Кроме понимания ПМ, в таких системах важ также распознавания ошибок и их коррекции.

Семантические сети.

Семантическая сеть - это структура для представления знаний в виде узлов, соединенных дугами. Первые семантические сети были разработаны в качестве языка-посредника для систем машинного перевода, а многие современные версии даже сейчас подобные по своим характеристикам к естественному языку. Однако, последние версии семантических сетей стали более мощными и гибкими и составляют конкуренцию фреймовым системам, логическому программированию и другим языкам представления.

Начиная с конца 50-ых годов, на практике были созданы и применены десятки вариантов семантических сетей. Несмотря на то, что их терминология и структура отличаются, однако существуют сходимости, присущие практически всем семантическим сетям:

1. узлы семантических сетей представляют собой концепты предметов, событий, состояний

2. различные узлы одного концепта относятся к различным значениям, если они не пизначени как такие, что они относятся к одному концепту

3. дуги семантических сетей образуют отношения между узлами-концептами (пометки над дугами указывают на тип отношения)

4. некоторые отношения между концептами представляют собой лингвистические падежи, такие, как: агент, объект, реципиент и инструмент (другие означают временные, пространственные, логические отношения и отношения между отдельными предложениями

5. концепты организованы по уровням в соответствии со степенью обобщенности. Например, сущность, живое существо, животное, хищник

Но существуют и видминости: понимание значения с точки зрения философии, методы представления кванторов общности и существования и логических операторов, средства манипулирования сетями и правила вывода, терминология. Все это меняется от автора к автору. Несмотря не некоторые предшествовавшие различия, сети удобно читаются и обрабатываются компьютером, а также достаточно мощными для того, чтобы представить семантику естественного языка.

Историческая заметка

Фреге представил логические формулы в виде деревьев, которые, однако, слабо напоминают современные семантические сети. Еще одним пионером стал Чарльз Сандерз Прис, который использовал графические записи в органической химии. Он сформулировал правила вывода из использованием экзистенциальный графов.

В психологии Зельц использовал графы для представления наследственности некоторых характеристик в иерархии концептов. Научные исследования Зельца имели огромное влияние на изучение тактики шахмат. Он, в свою очередь, повлиял на таких теоретиков, как Саймон и Ньюэлл.

Что касается лингвистики, то первым ученым, который занимался разработкой графических описаний, стал Теньер. Он использовал графическую запись для своей грамматики зависимостей. Теньер оказал огромное влияние на развитие лингвистики в Европе.

Впервые семантические сети были использованы в системах машинного перевода в конце 50-х - начале 60-х годов. Первая такая система, которую создала Мастерман, содержала около 100 примитивных концептов таких, как, например, НАРОД, ВЕЩЬ, ДЕЛАТЬ, БЫТЬ. С помощью этих концептов она сделала описание словаре объемом 15000 единиц, в котором также существовал механизм для переноса характеристик с гипертипу на подтип. Некоторые системы машинного перевода базировались на корреляционных сетях Цеккато, представляющих собой набор из 56 различных отношений, некоторые из которых - падежные отношения, отношения подтипа, частиц, части и целого. Он использовал сети, состоящие из концептов и отношений, для управления действиями парсера и разрешения неоднозначностей.

В системах искусственного интеллекта семантические сети используются для получения видповедей на различные вопросы, изучение процессов обучения, запоминания и рассуждений. В конце 70-х сети стали широко распространенными. В 80-х годах граница между сетями, фреймовымы структурами и линейными формами записи постепенно исчезали. Сила выразительности больше не является решающим аргументом в пользу выбора сетей


Страницы: 1 2 3 4 5 6 7 8 9