Практика 10 (3 к)

Для анализа я взяла две сказки: "Красная шапочка" и "Подарки феи". Их объединяет один автор - Шарль Перро. 

Результаты анализа первой сказки "Красная шапочка":




На первом скриншоте программа показала слова в тексте по их частотности. Как мы видим, это слова: бабушка, шапочка, волк, красная, тебя, внучка, пирожки, дверь, горшочек. И часто употребляемые союзы и предлоги: и, в, с, к, у.

На втором скриншоте указаны основные темы, которым посвящен текст. Это: и, бабушка, в, волк, а, что, красная, тебя, шапочка, не.


Результаты анализа второй сказки "Подарки феи":





В результате анализа второго текста программа выявила наиболее часто употребляемые слова: девушка, мать, она, сказала, так, ее, дочка, только, воды, фея, старшая. И также часто употребляемые союзы и предлоги: и, с, в, а, не, то.

Основные темы, которым посвящен текст: и, в, что, с, она, на, девушка, же, так, мать.

ВЫВОД: Модель текста Word Cloud на мой взгляд наиболее точно и развернуто отражает содержание текста. Так как в ней показаны все используемые слова: и чем чаще использовано слово, тем оно крупнее выделено. Также удобно то, что сбоку показывает сколько раз в тексте использовалось то или иное слово. Глядя на эту модель, можно понять суть текста, но возникают сложности с тем, что программа учитывает союзы, предлоги и частицы, которые не несут какой-либо смысловой нагрузки.
Модель текста Topic Modelling не так точно отражает содержание текста. Так как она показывает лишь пару часто употребляемых слов, из которых темы текста выявить проблематично. По такому маленькому количеству сложно проанализировать текст. Здесь также учитываются союзы, частицы и предлоги, что тоже не очень удобно.
Следовательно, тематику текстов легче всего определять по методике Word Cloud.



Комментарии