# 4. ВИЗУАЛИЗАЦИЯ ДАННЫХ СОЦИАЛЬНЫХ СЕТЕЙ [назад](README.md) Анализ данных социальных сетей включает в себя, в том числе, корректное и удобное их представление. Визуальное представление данных часто может являться не тривиальной задачей, ввиду их разнообразия и большого объема. Рассмотрим наиболее распространенные способы визуализации данных социальных сетей. В конце второго раздела шла речь о различных числовых метриках произведённых сообщений, либо иного текстового контента, содержащего информацию о геолокации. Удобным инструментом визуализации данной информации являются картограммы. На картограмме может быть показано количество сообщений определенного заданного типа (например, содержащего то или иное слово, объект либо хештег) произведенных в течение заданного временного интервала (рис. 10). ![Рис. 10. Картограмма, содержащая информацию о частоте употреблений сообщений](images/2021-09-04_22-01-17.png) Рис. 10. Картограмма, содержащая информацию о частоте употреблений сообщений При этом размер кружков на картограмме соответствует количеству подобных сообщений. В визуализацию таких данных можно добавить и семантический окрас сообщений, например, положительный, отрицательный и нейтральный (рис. 11). ![Рис. 11. Картограмма, содержащая информацию о частоте употреблений сообщений и об их семантическом окрасе](images/2021-09-04_22-02-07.png) Рис. 11. Картограмма, содержащая информацию о частоте употреблений сообщений и об их семантическом окрасе Анализ данных социальных сетей может быть направлен и на определение частоты употребления слов, фраз, иных объектов. В данном случае одним из наиболее удобных способов представления данных может служить облако тегов. На рис. 12 приводится облако тегов наиболее употребляемых слов (за исключением местоимений, союзов и предлогов) в текстовых сообщениях социальной сети Twitter. Для визуализации различных аналитических выкладок и метрик полученных по социальным сетям могут использоваться стандартные способы визуализации: графики, диаграммы, таблицы и т.д. (примеры приведены на рис. 13, 14). ![Рис. 12. Облако тегов наиболее употребляемых слов в текстовых сообщениях социальной сети Twitter](images/2021-09-04_22-03-05.png) Рис. 12. Облако тегов наиболее употребляемых слов в текстовых сообщениях социальной сети Twitter ![Рис.13. Распределение употребления определенных тем в сообщениях сети Twitter по кластерам в группе стран ](images/2021-09-04_22-04-07.png) Рис.13. Распределение употребления определенных тем в сообщениях сети Twitter по кластерам в группе стран ![Рис. 14. Анимированное круговое представление сюжетов тем, затронутых в социальной сети ](images/2021-09-04_22-04-41.png) Рис. 14. Анимированное круговое представление сюжетов тем, затронутых в социальной сети При всем разнообразии вариантов визуализации данных социальных сетей самым распространенным инструментом, описывающим и представляющим связи в социальной сети, является граф. При этом основной проблемой представления в виде графа часто является его большая размерность (рис. 15). ![Рис. 15. Граф, описывающий сегмент социальной сети](images/2021-09-04_22-06-07.png) Рис. 15. Граф, описывающий сегмент социальной сети Граф большой размерности с точки зрения визуального представления крайне нечитабелен. Для решения данной проблемы используется выделение сегментов и кластеров (рис. 16) с возможным дальнейшим уменьшением размерности. ![Рис. 16. Граф большой размерности с выделенными отдельными кластерами](images/2021-09-04_22-07-42.png) Рис. 16. Граф большой размерности с выделенными отдельными кластерами Задача кластеризации графа большой размерности будет рассмотрена далее. [назад](README.md)