Разработка программных средств конвертирования HTML-текстов в семантические сети
Категория реферата: Рефераты по информатике, программированию
Теги реферата: характеристика реферата, шпаргалки по химии
Добавил(а) на сайт: Lobza.
Предыдущая страница реферата | 1 2 3 4 5 6 7 8 9 10 11 | Следующая страница реферата
----------------------------------------
TextAnalyst
Получите бесплатную версию
TextAnalyst
Системные требования
Intel-based PC
Windows 9X, NT, 2000, Me
Технические характеристики/tr>
Средняя скорость анализа текста около 1Мбайт/мин (при использовании Pentium-II).
Максимальный объем анализируемой подборки не ограничен и зависит от объема ресурсов компьютера и настройки TextAnalyst.
Собственный объем TextAnalyst не превышает 5Мб.
Форматы обрабатываемых файлов:
*.txt (ANSI, DOS), *.rtf
Экспорт информации в форматы: *.txt,
*.csw (электронные таблицы).
-----------------------------------
TextAnalyst 2.0 персональная система автоматического анализа текста
TextAnalyst разработан в качестве инструмента для анализа
содержания текстов, смыслового поиска информации, формирования электронных
архивов, и предоставляет пользователю следующие основные
возможности: анализа содержания текста с автоматическим формированием
семантической сети с гиперссылками - получения смыслового портрета текста в
терминах основных понятий и их смысловых связей; анализа содержания текста с автоматическим формированием
тематического древа с гиперссылками - выявления семантической структуры
текста в виде иерархии тем и подтем; смыслового поиска с учетом скрытых смысловых связей слов
запроса со словами текста; автоматического реферирования текста - формирования его
смыслового портрета в терминах наиболее информативных фраз; кластеризации информации - анализа распределения
материала текстов по тематическим классам; автоматической индексации текста с преобразованием в
гипертекст; ранжирования всех видов информации о семантике текста по
«степени значимости» с возможностью варьирования детальности ее
исследования; автоматического/автоматизированного формирования
полнотекстовой базы знаний с гипертекстовой структурой и возможностями
ассоциативного доступа к информации;
Не пугайтесь обилия возможностей!
Работа с TextAnalyst покажется Вам неожиданно простой и приятной, а его аналитические способности сэкономят массу полезного времени...
----------------------------------
Сравнив приведенные экранную форму и HTML-текст, видим, что
семантически значимыми элементами данного документа являются:
- ключевые слова, относящиеся к данному документу: Microsystems,
TextAnalyst, text mining, knowledge discovery, textmining, e-commerce, classification, semantic analysis, neuro networks, natural linguistc, text processing, Микросистемы, анализ текстов, база знаний, документооборот, классификация, семантический анализ, нейронные сети, натуральные языки, текст процессор (тег );
- все меню организованы в виде таблиц (тег ), в ячейках которых
(тег ) расположены ссылки (тег ), с помощью которых можно перейти к другой интересующей информации. Например, можно получить информацию о продуктах данной компании, выбрав их название из левого меню.
- текст описания возможностей программы TextAnalyst организован в виде списка (тег ).
Т.о. можно видеть, семантически значимые характеристики документа могут быть разбросаны по разным частям документа или по разным документам. Это сильно затрудняет семантический анализ Интернет – документов.
Рекомендуем скачать другие рефераты по теме: тезис, дипломы бесплатно.
Предыдущая страница реферата | 1 2 3 4 5 6 7 8 9 10 11 | Следующая страница реферата