+7 499 196 95 39
Программа предназначена для обработки полученных результатов краудсорсинговой разметки текстовых данных, а также агрегирования полученных меток для решения задач эмотивно-тонального анализа. Особенностью программы является реализация алгоритма агрегирования как для одноуровневой разметки (тональная разметка: нейтральный, позитивный, негативный), так и для двухуровневой разметки (эмотивная разметка: уровень - есть или нет эмоции; уровень - радость, страх, удивление, грусть, злость). Итоговая метка для текста выбиралась на основе агрегации проставленных аннотаторами меток методом голосования большинства. Итоговые метки получают только те тексты, которые размечены не менее 3 различными аннотаторами. Программа реализует следующий функционал: процедуру проверки размеченных текстов; процедуру подготовки размеченных текстов; процедуру агрегации размеченных текстов; процедуру расчета статистики размеченного набора данных. Входными данными для программы является таблица с результатами краудсорсинговой разметки текстов. Выходными данными является размеченный набор текстов с итоговыми аггрегированными метками и метрические данные о созданном наборе. Тип ЭВМ: IBM PC-совмест. ПК; ОС: Linux.  Python 3.5