6.3 KiB
4. ВИЗУАЛИЗАЦИЯ ДАННЫХ СОЦИАЛЬНЫХ СЕТЕЙ
Анализ данных социальных сетей включает в себя, в том числе, корректное и удобное их представление. Визуальное представление данных часто может являться не тривиальной задачей, ввиду их разнообразия и большого объема.
Рассмотрим наиболее распространенные способы визуализации данных социальных сетей.
В конце второго раздела шла речь о различных числовых метриках произведённых сообщений, либо иного текстового контента, содержащего информацию о геолокации. Удобным инструментом визуализации данной информации являются картограммы. На картограмме может быть показано количество сообщений определенного заданного типа (например, содержащего то или иное слово, объект либо хештег) произведенных в течение заданного временного интервала (рис. 10).
Рис. 10. Картограмма, содержащая информацию о частоте употреблений сообщений
При этом размер кружков на картограмме соответствует количеству подобных сообщений. В визуализацию таких данных можно добавить и семантический окрас сообщений, например, положительный, отрицательный и нейтральный (рис. 11).
Рис. 11. Картограмма, содержащая информацию о частоте употреблений сообщений и об их семантическом окрасе
Анализ данных социальных сетей может быть направлен и на определение частоты употребления слов, фраз, иных объектов. В данном случае одним из наиболее удобных способов представления данных может служить облако тегов. На рис. 12 приводится облако тегов наиболее употребляемых слов (за исключением местоимений, союзов и предлогов) в текстовых сообщениях социальной сети Twitter.
Для визуализации различных аналитических выкладок и метрик полученных по социальным сетям могут использоваться стандартные способы визуализации: графики, диаграммы, таблицы и т.д. (примеры приведены на рис. 13, 14).
Рис. 12. Облако тегов наиболее употребляемых слов в текстовых сообщениях социальной сети Twitter
Рис.13. Распределение употребления определенных тем в сообщениях сети Twitter по кластерам в группе стран
Рис. 14. Анимированное круговое представление сюжетов тем, затронутых в социальной сети
При всем разнообразии вариантов визуализации данных социальных сетей самым распространенным инструментом, описывающим и представляющим связи в социальной сети, является граф. При этом основной проблемой представления в виде графа часто является его большая размерность (рис. 15).
Рис. 15. Граф, описывающий сегмент социальной сети
Граф большой размерности с точки зрения визуального представления крайне нечитабелен. Для решения данной проблемы используется выделение сегментов и кластеров (рис. 16) с возможным дальнейшим уменьшением размерности.
Рис. 16. Граф большой размерности с выделенными отдельными кластерами
Задача кластеризации графа большой размерности будет рассмотрена далее.