Компьютерный морфологический разбор слов русского языка
Категория реферата: Рефераты по информатике, программированию
Теги реферата: реферат синдром, 5 баллов
Добавил(а) на сайт: Полиевкт.
1 2 3 4 | Следующая страница реферата
Компьютерный морфологический разбор слов русского языка.
Ермолаев Д.С., Москва
Применение данной статьи важно для тех, кто хочет сделать интерфейс к своей программе на естественном языке или сделать интеллектуальный поиск информации. Для этого нужно в первую очередь сделать морфологический анализ слов текста. Тогда не нужно будет иметь обширный словарь слов в разных словоформах. Достаточно запомнить основное слово в словаре, а входной поток слов подвергать морфологическому анализу, с тем, чтобы все слова преобразовать к начальным словоформам.
Пример. пользователь ввел в базу знаний свою информацию "фирма РиК. наша фирма продает тару картонную". Модуль морфологического разбора преобразует эту информацию к следующему виду: "фирма. РиК. мой фирма продать тара картонный". С точки зрения смысла получилась бессмыслица. Но для компьютера - самый раз, это будет видно дальше. Теперь, другой пользователь вводит для поисковой системы запрос "продает тару картонную". Этот запрос будет так же преобразован в "продать тара картонный". И теперь исполнив простой поиск по совпадению, система поиска выдаст ранее запомненную информацию: "фирма Рик. продать...". Однако здесь было бы лучше запомнить первоначальную информацию клиента с правильными словоформами и выдать только её.
Морфология слов русского языка определяется по аффиксу - окончанию и суффиксу слова. Назовем это правило правилом морфологического разбора. Однако есть слова, которые имеют окончание, подходящее для некоторой формы слова, но являются совершенно другой формой. Например, "-ать" говорит что слово есть глагол (прыгать, бежать). Но есть слово "кровать", которое есть существительное. Значит, из правила морфологического разбора есть исключения. Так же есть слова, которые не изменяют свою форму. Например, предлоги, "не", наречия, "столь" и т.д. Значит, есть дополнения к правилу морфологического разбора. Эти дополнения можно представить как исключения из правила. Таким образом мы пришли к определенному логическому описанию морфологического разбора слов. Для создания компьютерной программы здесь лучше всего подойдет логический язык программирования. Рассмотри два из них.
Пример программы морфологического разбора слов на логическом языке программирования ПРОЛОГ.
------------------------------------
/* программа по распознаванию морфологии слов русского языка */
/* по окончанию слова */
/* язык программирования ПРОЛОГ */
domains
Слово = string
predicates
морфология(Слово,Слово Основа)
nondeterm исключение(Слово,Слово Основа)
nondeterm правило(Слово Аффикс, Слово АффиксОсновы)
nondeterm аффикс(Слово Корень, Слово, Слово Аффикс)
clauses
/* база знаний */
/* исключения из правила разбора слова для "неправильных" слов */
исключение("рек","река").
исключение("сел","сесть").
/* правила разбора для правильных слов */
/* для глаголов */
правило("нули","ать").
правило("нул","ать").
Рекомендуем скачать другие рефераты по теме: смс сообщения, договор реферат.
1 2 3 4 | Следующая страница реферата