октября 26, 2022 СОВРЕМЕННЫЕ ТЕХНОЛОГИИ ПОИСКА И ОБРАБОТКИ ИНФОРМАЦИИ. МЖФ-101. ПРАКТИЧЕСКОЕ ЗАДАНИЕ №5. ПРОСТОЙ SENTIMENT АНАЛИЗ

Я выбрала новость, в которой рассказывается, что в штате Огайо кто-то ворвался на ферму и открыл клетки, в которых содержалось от 25 000 до 40 000 норок. Большую часть норки нашли и загнали обратно, но еще около 10 000 норок пропали без вести. Многие из пропавших норок были убиты в результате дорожного движения. Люди опасаются заражения болезнями, в частности коронавирусом, и потерей домашнего скота.




Проанализировав графики, мы можем сделать вывод, что новость больше имеет негативный окрас, так как большинство слов преобладают синим окрасом. Это такие слова, как убийство, пандемия, вирус, мертвые, заболевание, ущерб и т.п. (правда, сюда отнесено и много таких слов, которые не имеют негативного окраса (например, опыт, действие), а некоторые слова при переводе совершенно не имеют отношения к статье (например, деканат). Возможно, это кривой переводчик. Но если программа учитывает контекст, тогда вопросов нет.

Нейтральные слова (от темно до светло-зелёных точек) четко отделены от негативных слов. Это такие слова, как захватить, загнанный в угол, собственность, предупреждение, инфицированный и т.п.

Нейтральные слова плавно переходят в позитивные (темно-желтые и желтые точки): животные, шериф, должностные лица, ферма, шоссе, люди, жители и т.п. 

Нейтрально-позитивных слов в тексте достаточно, но все же они не преобладают. 


Комментарии