You cannot select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

6.3 KiB

4. ВИЗУАЛИЗАЦИЯ ДАННЫХ СОЦИАЛЬНЫХ СЕТЕЙ

назад

Анализ данных социальных сетей включает в себя, в том числе, корректное и удобное их представление. Визуальное представление данных часто может являться не тривиальной задачей, ввиду их разнообразия и большого объема.

Рассмотрим наиболее распространенные способы визуализации данных социальных сетей.

В конце второго раздела шла речь о различных числовых метриках произведённых сообщений, либо иного текстового контента, содержащего информацию о геолокации. Удобным инструментом визуализации данной информации являются картограммы. На картограмме может быть показано количество сообщений определенного заданного типа (например, содержащего то или иное слово, объект либо хештег) произведенных в течение заданного временного интервала (рис. 10).

Рис. 10. Картограмма, содержащая информацию о частоте употреблений сообщений
Рис. 10. Картограмма, содержащая информацию о частоте употреблений сообщений

При этом размер кружков на картограмме соответствует количеству подобных сообщений. В визуализацию таких данных можно добавить и семантический окрас сообщений, например, положительный, отрицательный и нейтральный (рис. 11).

Рис. 11. Картограмма, содержащая информацию о частоте употреблений сообщений и об их семантическом окрасе
Рис. 11. Картограмма, содержащая информацию о частоте употреблений сообщений и об их семантическом окрасе

Анализ данных социальных сетей может быть направлен и на определение частоты употребления слов, фраз, иных объектов. В данном случае одним из наиболее удобных способов представления данных может служить облако тегов. На рис. 12 приводится облако тегов наиболее употребляемых слов (за исключением местоимений, союзов и предлогов) в текстовых сообщениях социальной сети Twitter.

Для визуализации различных аналитических выкладок и метрик полученных по социальным сетям могут использоваться стандартные способы визуализации: графики, диаграммы, таблицы и т.д. (примеры приведены на рис. 13, 14).

Рис. 12. Облако тегов наиболее употребляемых слов в текстовых сообщениях социальной сети Twitter
Рис. 12. Облако тегов наиболее употребляемых слов в текстовых сообщениях социальной сети Twitter

Рис.13. Распределение употребления определенных тем в сообщениях сети Twitter по кластерам в группе стран
Рис.13. Распределение употребления определенных тем в сообщениях сети Twitter по кластерам в группе стран

Рис. 14. Анимированное круговое представление сюжетов тем, затронутых в социальной сети
Рис. 14. Анимированное круговое представление сюжетов тем, затронутых в социальной сети

При всем разнообразии вариантов визуализации данных социальных сетей самым распространенным инструментом, описывающим и представляющим связи в социальной сети, является граф. При этом основной проблемой представления в виде графа часто является его большая размерность (рис. 15).

Рис. 15. Граф, описывающий сегмент социальной сети
Рис. 15. Граф, описывающий сегмент социальной сети

Граф большой размерности с точки зрения визуального представления крайне нечитабелен. Для решения данной проблемы используется выделение сегментов и кластеров (рис. 16) с возможным дальнейшим уменьшением размерности.

Рис. 16. Граф большой размерности с выделенными отдельными кластерами
Рис. 16. Граф большой размерности с выделенными отдельными кластерами

Задача кластеризации графа большой размерности будет рассмотрена далее.

назад