|
Методы статистического анализа литературных текстов
|
Автор: Орлов Ю.Н.
Жанр: Разное
Издательство: Либроком
Год: 2012 Количество страниц: 312
Формат:
PDF (15.60 МБ)
Дата загрузки: 10 октрября 20152015-02-26
|
Аннотация
В настоящей книге излагается новый подход к решению некоторых задач математической лингвистики, основанный на использовании кинетических уравнений, описывающих эволюцию выборочных функций распределения текста по буквам. Этот подход сочетает в себе методы традиционной математической статистики и статистической механики, модифицированные для применения их к нестационарным временным рядам, каковыми являются последовательности букв в тексте. Центральной задачей, решаемой в данной работе, является идентификация автора и жанра «условно неизвестного» литературного текста в библиотеке известных текстов. Построен высокоточный метод идентификации, использующий функционал близости текстов как распределений пар букв в определенной норме. Анализируются также статистические свойства распространенных европейских языков. Для них установлено полуэмпирическое распределение алфавитных символов по частоте встречаемости, которое оказалось зависящим от двух параметров — количества букв в алфавите данного языка и их соответствия звуковому ряду. Рассмотрены конкретные примеры статистического решения некоторых спорных вопросов об авторстве того или иного текста. Книга будет полезна лингвистам и литературоведам, а также математикам, специализирующимся в области прикладной математической статистики.
Скачать с нашего сайта
|
|
Комментарии
Посетители, находящиеся в группе Гости, не могут оставлять комментарии к данной публикаци.
|
|