LAP Lambert Academic Publishing ( 19.05.2011 )
€ 79,00
Данная работа посвящена проблемам разработки лингвистического и алгоритмического обеспечения, служащего для создания современной системы извлечения ключевой содержательной информации посредством применения широкого класса математических и лингвистических методов логико-аналитической обработки больших символьных массивов. В рамках данного исследования разработана обобщенная схема обработки массива публицистических текстов для подъязыка СМИ, выявлены тенденции с учетом соответствия результатов обработки естественно-языкового текста, выполненной компьютером и человеком, предложена модель текста как композиция формальных моделей ее компонентов, в основе которой лежит интеграция статистических и формальных лингвистических методов, разработан алгоритм извлечения элементов смысла из массива текстов ограниченной тематики, включающий блок первичной семантической обработки, блок индексации и ранжирования понятий, блок установления связей, блок выявления тематического узла, блок установления попарной встречаемости, блок построения семантической сети, блок синтеза информации из сети.
Kitap detayları: |
|
ISBN-13: |
978-3-8433-1848-8 |
ISBN-10: |
3843318484 |
EAN: |
9783843318488 |
Kitabın dili: |
Russian |
Yazar: |
Ирина Николаева |
Sayfa sayısı: |
256 |
Yayın tarihi: |
19.05.2011 |
Kategori: |
Genel ve karşılaştırmalı dilbilim |