Святослав Зборовский

Thank you points: социальные связи внутри IT компании.

Датасет

Описание

1. Источник данных – внутренняя база данных компании DataArt.

2. С помощью Select SQL запроса была выведена таблица направленных связей. Где узлы – люди, которые дарили и получали Thank you points (далее – типсы), а ребра – факт дарения thank you points. Таблица была скачена в файл формата csv. В результате получилась выборка из 46896 строк (фактов дарения типсов).

3. Период выборки – с 2011 по 2020 годы, так как именно в 2011 году появились типсы.

4. Данные были импортированы в программу для сетевого анализа Gephi (скачать программу можно с официального сайта: https://gephi.org/ ) в формете Edges table. Формат графа – направленный.

4.1 Создаем новый проект в Gephi

4.2. В разделе File выбираем опцию import spreadsheet.

4.3 Выбираем нужный файл с датасетом на рабочем столе: typs edges.csv

4.4 Импортируем как таблицу связей с разделителем запятая

4.5. Нажимаем next и finish и сохраняем как направленный граф. Сохраняем в текущий воркспейс.

5. Первоначальный граф выглядел очень запутанным, а поэтому я применил фильтр degree >= 50 для удаления несущественных связей. Затем была применена укладка Fruchterman Reingold для лучшей видимости связей.

Первоначальный граф: (не черный квадрат (: )

Отфильтрованный граф с укладкой :

6. К отфильтрованному графу добавился расчет статистики модулярности для последующего выявления кластеров.

6.1 В разделе статистика выбираем расчет модулярности

7. Цвет узлов и ребер соответствует кластеру по статистике модулярности. Этот алгоритм запускает поиск кластеров в сети.

7.1 Настройка цвета узлов и ребер:

Результат:

8. Размер узлов соответствует метрике in-degree (наиболее популярным коллегам, другими словами тем, кто получает наибольшее количество типсов) (минимальный размер 10, максимальный 250).

Результат:

9. Готовый обезличенный граф был импортирован в формате png.

10. Для объяснения сообществ была подгружена таблица узлов с именами и фамилиями коллег, чтобы можно было понять природу их связи. Из соображений конфиденциальности данная таблица не может быть опубликована вне компании, так как она содержит личные данные сотрудников.

11. Соответствие кластеров.

Фиолетовый(20.6% всех наблюдений) – коллеги из небольшого офиса, который находится в провинциальном городе. В этом городе компания DataArt является сильным игроком на рынке труда, а поэтому для коллег офис – это отдельный мир, где они сильно взаимодействуют. Это и отображается в частых «спасибо». Лидеры – HRы, сис админы, Бухгалтера и сеньорные коллеги, которые выращивают практикантов и активно участвуют в жизни офиса.

Зеленый (18.88%) – удивительно, но это коллеги из самого большого офиса, который также находится в провинциальном городе. Однако, здесь люди меньше дарят типсы друг другу и здесь нет ярко выраженных «любимчиков». Скорее всего, у коллег просто хорошие горизонтальные отношения.

Голубой (18.88%) – менеджеры, которых часто благодарит определенная категория людей. Дело в том, что эти менеджеры помогают правильно подбирать командировки и правильно считать расходы, а поэтому у них есть определенная категория – проектные менеджеры, деливери менеджеры и сеньорные коллеги.

Черный (15.45%) – это «хорошие коллеги» - люди, которых много благодарят абсолютно все. Центральная черная точка – системный администратор. Другие люди, которые попали в это категорию – это офис менеджеры или учителя английского.

Оранжевый (11.59%) – объединяет в себе высший менеджмент, HRов и тех, кто занимается HR PRом. Все эти люди работают над нашим брэндом работодателя, а поэтому, несмотря на то, что они работают в разных департаментах, они часто благодарят друг друга (причем все 9 лет) и поэтому они объединены в один кластер.

Розовый (6.87%) – и снова небольшая локация в провинциальном городе! Самые большие точки – два системных администратора и главный HR, который объединял всех в кофейне по вечерам.

Темно-зеленый (3.86%) – тоже сис админы, но не привязанные к определенной локации. Эти люди – помогают настраивать виртуальные окружения и налаживают работу в компании в целом. Поэтому у них нет определенной группы тех, кто их благодарит. Им благодарна вся компания – за это они в отдельном кластере.

Желтый (3.86%) – внутри компании есть рабочая система. В ней мы следим за активностями людей, за динамикой работы в проектах, в ней у нас собраны обучающие курсы, там мы общаемся, одним словом, в ней собрана вся жизнь компании. Желтый кластер состоит из команды разработчиков этой системы. Мы благодарим их за каждодневный труд и за то, что эти данные можно вообще собрать 🙂

Комментарии