Сообщения

Сообщения за апрель, 2025

Практика 15 (3 к)

Изображение
Для анализа я взяла статистику по средней месячной заработной плате в России и США по годам (от 2017 до 2023). Таблица: Эти данные связаны тем, что они являются суммами денежных средств. Отличаются они тем, что суммы в первом столбце написаны в рублях, а суммы во втором столбце - в долларах. Результаты анализа: Итог: Наиболее точную оценку на мой взгляд дает модель  Polynomial Regression  и  Scater Plot. В первой модели четко видно прогресс роста заработной платы с каждым годом. Удобно, что всего две линии, которые можно легко сопоставить и проанализировать данные. Во второй модели можно отследить взаимосвязь и различия двух компонентов (первого и второго столбца: в моем случае это зп в России и в США). Также есть линия, которая показывает прогресс.

Практика 14 (3 к)

Изображение
Для анализа я выбрала  файл данных о прослушивании альбомов (last.fm). Результаты анализа: Выводы: 1) Больше всего связаны rock и other (зеленый и серый цвет). Примерно в одинаковом соотношении выражены связи между rock и 80s, hardcore и classic rock. Доминирует здесь все-таки other. 2) Центральный элемент связей - rock (не считая конечно other). Он выделен зеленым цветом. Он связывает не только  other, но и  80s, hardcore, classic rock и emo. Следовательно он доминирует во всех моделях. 3) Для восприятия мне больше всего удобна модель  Network Explorer, так как там обозначено всё не только цветом, но и линиями, которые помогают понять, что и с чем связано. В  MDS модели затруднительно определить связи, так как они не соединены друг с другом. Но все же эта модель тоже довольно неплохая. А вот модель  Correlations для меня сложна и непонятна.

Практика 13 (3 к)

Изображение
Для анализа я выбрала 10 изображений на тему экологии. Модели  Image Grid  и  Hierarchical Clustering разделили изображения почти на одинаковые группы.  Первая группа (три изображения по вертикали) — один главный объект (планета) на белом фоне, нет ничего лишнего; вторая группа (два изображения) — объект находится по центру, однотонный фон, и там и там изображены ладони человека; третья группа (два изображения) — их объединяет планета, где изображены заводы, загрязнения и дым; четвертая группа (три изображения) — изображения, которые делятся на два контраста (справа — ужасная экология, слева — хорошая), также на этих изображениях присутствует луг. Модель Hierarchical Clustering наиболее приближена к  Image Grid. С данной логикой разделения я согласна. Модель t-SNE больше отл ичается от предыдущих моделей. Здесь три изображения находятся отдельно от других, здесь логика понятна, но остальные 7 изображений все рядом друг с другом. Классифицировать их проблематично...