+7 499 196 95 39
Программа предназначена для подготовки данных интернет-текстов с целью их последующей разметки средствами краудсорсинга для настройки инструментов решения задач эмотивно-тонального анализа. В алгоритме реализован механизм отбора предложений из текстов различных интернет-источников и их представление в формате краудсорсинговой платформы для дальнейшей разметки. Функциональные возможности: предварительный отбор эмотивных предложений, реализованный на базе словарей эмотивно-тональной лексики; разбиение входного текста на слова и предложения; выделение именованных сущностей из текста; расчёт коэффициента сходства двух предложений; отбор эмотивных предложений с использованием словарей эмотивно-тональной лексики из различных источников; сохранение подготовленных данных. Входными данными для программы являются: текст документов из рассматриваемых источников; словари эмотивно-тональной лексики. Результатом работы программы являются подготовленные наборы предложений для последующей разметки на эмотивно-тональные классы. Тип ЭВМ: IBM PC-совмест. ПК; ОС: Linux. Python