Гайды

Гид по Yandex DataLens: что это за сервис и как он устроен

Как работать с Яндекс Даталенс

Yandex DataLens — это сервис визуализации и анализа данных от Yandex Cloud. В нем можно рисовать диаграммы, строить таблицы и объединять несколько визуализаций в один дашборд. Затем на дашборде можно отслеживать выбранные показатели бизнеса.

Сервис предоставляется всем пользователям бесплатно, без ограничений на количество участников и запросов.

Эта статья для владельцев компаний и менеджеров, которые хотят лучше узнать своих клиентов и положение дел в компании.

Статья не подойдет Data-Science специалистам и опытным аналитикам — мы расскажем только общие принципы использования сервиса.

Статью проверили: Роман Бунин, аналитик и автор Telegram-канала «Reveal the data»; Антон, маркетолог и автор Telegram-канала «Пытаюсь посчитать».

Разбираемся в интерфейсе Yandex DataLens

Сначала познакомимся с интерфейсом в общем, а потом начнем собирать статистику, строить графики и собирать дашборды.

Но чтобы обзор был понятнее, разберемся в основных терминах:

Подключение — набор параметров для доступа к источнику данных. Источником может быть база данных ClickHouse, Excel-таблица, Google-таблица, счетчик Яндекс.Метрики и др.

Датасет — описание набора данных из источника. То есть это какая-то статистика: количество и сумма продаж, возраст клиентов, распределение по полу и т.д.

Чарт — визуализация информации из источника данных, датасета в виде таблиц, диаграмм и карт.

Дашборд — набор чартов, селекторов для фильтрации информации и текстовых блоков. Дашборд — лист с расположенными на нём визуальными элементами или виджетами. Он может содержать заголовок, графики, объединённые по смыслу, фильтры для изменения представления данных и поясняющие тексты.

Когда зарегистрируетесь в сервисе, попадете на главную. Слева вы увидите панель управления с различными вкладками:

  • «Все сервисы» — здесь можно перейти в другие сервисы Яндекса.
  • «Все объекты» — здесь хранятся ваши папки, таблицы, базы данных и диаграммы. Под каждый новый проект рекомендуем создавать отдельную папку и хранить информацию по каждой визуализиации отдельно.
  • «Избранное» — здесь лежат избранные проекты.
  • «Подключения» — здесь можно посмотреть, к каким базам вы подключились или какие таблицы загрузили.
  • «Датасеты» — здесь собраны все ваши значения.
  • «Чарты» — здесь лежат построенные диаграммы.
  • «Дашборды» — здесь хранятся все ваши дашборды.
  • «Личная папка» — здесь хранятся именно ваши проекты, с которыми вы работали.
  • «Marketplace» — здесь лежат готовые чарты, диаграммы, дашборды и другие полезные файлы, которые вы можете бесплатно установить и использовать как шаблон отчета или визуализации.
  • «Настройки сервиса» — здесь можно добавлять новых пользователей в команду и настраивать цвета чартов.

По сути все эти вкладки нужны потом, когда у вас уже будет несколько подключений, чартов и дашбордов, чтобы переключаться между ними. Если вы работаете с данными в первый раз, через все этапы создания можно пройти через главную страницу. Вернемся к ней.

Главная страница DataLens
Главная страница сервиса

Идти по вкладкам нужно по порядку: от подключения к дашбордам.

Как работать с вкладкой «Подключения»

Здесь вы можете выбрать источник данных.

Источники данных в Яндекс Даталенс
Доступные подключения

Проще всего работать с вкладкой «Файлы и сервисы» и «Партнерские подключения» — там достаточно загрузить таблицу или вписать OAuth-токен и можно будет работать с цифрами. Например, чтобы загрузить Excel-таблицу, нужно в блоке «Файлы и сервисы» выбрать пункт «Файлы», в открывшемся окне кликнуть на «Загрузить файл» (выбрать таблицу только в CSV-формате), а затем — «Создать подключение».

Важно! Сейчас DataLens поддерживает только CSV-формат таблиц, но в будущем будет и прямое подключение из Excel.

Как добавить таблицу в DataLens
Чтобы ячейки первой строки стали заголовками, отметьте ползунок в правом верхнем углу

В «Базах данных» придется порт HTTP-интерфейса, кластер, имя хоста и другую информацию. Если вы новичок — проще работать с первым вариантом.

Как работать с вкладкой «Датасет»

В этой вкладке можно формировать наборы данных из тех файлов, которые вы загрузили в подключении.

Для этого нужно выбрать подключение (в нашем случае это таблица, которую мы загрузили на прошлом этапе).

Как создать новое подключение в Даталенс
Создаем новое подключение

На вкладке «Таблицы» автоматически появится файл с вашей информацией, а внизу — предпросмотр будущего датасета.

Предпросмотр датасета в Даталенс
Так выглядит предпросмотр датасета

Работать с разделом нужно так: в разделе «Таблицы» первой выбираете главную таблицу (если их несколько) и переносите ее в рабочую область. А затем на иконку первой таблицы перетягиваете другие, данные из которых хотите отразить в отчете.

Важно! Между таблицами автоматически установится связь по первому совпадению имен и типами данных полей. Установить связь можно только по полям с одним и тем же типом данных. Например, если в одной таблице у вас собран возраст клиентов, а в другой — количество покупок каждого за год.

Чтобы проверить, по каким полям создавалась связь, нужно нажать на два пересекающихся круга. Откроется диалоговое окно, в котором можно изменить поля связи.

6

Как выстраивать связь между данными таблицы

Есть четыре типа связи таблиц. Они влияют на то, что попадет в итоговый набор данных:

  • Inner. Строки из обеих таблиц, содержащие совпадения по выбранным столбцам.
  • Left. Все строки из левой таблицы и совпадающие с ними по выбранным полям строки из правой таблицы.
  • Right. Все строки из правой таблицы и совпадающие с ними по выбранным полям строки из левой таблицы.
  • Full. Все строки из обеих таблиц, вне зависимости от наличия совпадений по выбранным столбцам.

Важно! Если вы попробуете связать таблицы, в которых не совпадает никаких данных, DataLens выдаст ошибку в правом нижнем углу экрана. 

Также вам нужно сохранять датасет после каждого изменения, потому что сервис не сохраняет изменения автоматически. А ещё у датасета есть ограничение в 32 таблицы и 500 полей.

Объединять таблицы можно и по нескольким полям одновременно. Для этого нажмите в диалоговом окне «Добавить связь» и выберите из выпадающих списков нужные столбцы. Затем нажмите «Применить».

Добавляем несколько связей в датасет
Добавляем несколько связей в датасет

В разделе «Датасеты» есть и другие вкладки:

  • поля;
  • параметры;
  • фильтрация.

На вкладке «Поля» можно выбрать, как агрегировать данные. При этом поля могут быть двух типов:

  • «Измерения». Это качественные данные. Например, клиенты, товары, модели, заказы. Они нужны для создания фильтров и группировок. В интерфейсе обозначаются зелёным цветом.
  • «Показатели». Это количественные данные. Например, число или сумма продаж. В интерфейсе отображаются синим цветом.

Для всех полей данных можно задавать тип:

  • целое число;
  • дробное число;
  • строка — текстовая строка, которая задается с помощью одинарных или двойных кавычек;
  • дата — информация о дате без учета времени;
  • дата и время — информация о дате с учетом времени;
  • логический — предусматривает значения TRUE или FALSE;
  • геоточка — координаты по широте и долготе;
  • геополигон — множество геоточек;
  • массив — последовательность значений одного типа: строчного, целочисленного или дробного.

Суть в том, что для одних и тех же полей данных можно настраивать разные типы. Например, у вас в таблице есть адрес магазина. Такой тип данных лучше указать геоточкой, потому что так можно будет построить карту с отображением количеством продаж в определенной точке города. А если у вас есть строка «количество продаж», то ей лучше присваивать значение «целое число».

Но! У Yandex DataLens нет встроенного генератора полигонов и геоточек. Чтобы строить такие чарты нужно, нужно изначально создать подключение к таблице или базе с геопоинтами.

Главное — присваивать данным соответствующие типы. Правила соответствия читайте в справке DataLens.

Как изменить тип данных в Даталенс
Меняем тип данных таблицы

В работе с типом данных есть еще одна фишка — одно и то же поле можно представить и как измерение, и как показатель. Например, можно построить отчет по каждому покупателю — это измерение. А можно агрегировать данные по покупателям — так вы узнаете, сколько людей взаимодействовали с магазином и это уже будет показатель.

Параметры и фильтрацию разбирать не будем, потому что подробнее поговорим о них в следующих разделах.

Если с таблицей все ок, в правом верхнем углу нужно кликнуть на «Сохранить».

Сохраняем таблицу
Сохраняем таблицу

Как работать с вкладкой «Чарты»

После того, как вы сохранили таблицу, рядом с кнопкой «Сохранить» можно кликнуть на «Создать чарт» и вас автоматически перенаправит на создание диаграммы.

Создаем диаграмму
Создаем диаграмму

В новом окне вы увидите все содержимое таблицы под названием «Измерения» и «Показатели».

Выбираем данные, которые хотим визуализировать
Выбираем данные, которые хотим визуализировать

Чтобы собрать диаграмму, нужно перетаскивать значения из столбцов «Измерения» и «Показатели» в соседний столбец. При этом названия полей, в которые можно переносить что-то из области измерений, отличаются для каждой диаграммы.

Например, у линейной диаграммы есть секции X и Y, которые принимают разные данные:

  • Секция X принимает на вход одно поле и чаще всего это поле — измерение.
  • Секция Y принимает на вход как минимум один показатель.

Начнем строить. Мы для примера сделаем столбчатую диаграмму и узнаем объем выручки компании по разным категориям.

12

Так выглядит столбчатая диаграмма

Дальше диаграмму можно улучшать и делать более удобной. Например, можно сделать разбивку по цвету. Для этого нужно перетащить нужное измерение в раздел «Цвет», дальше система сделает все сама. В нашем случае мы можем увидеть, какой менеджер отвечал за продажу товаров в разных категориях.

13

Добавляем на диаграмму деление по полу

Еще диаграмму можно сортировать по тем измерениям, которые мы в нее добавили. Например, можно оставить продажи только за определенный период (в нашем случае с 2018 по 2019 год).

14

Сортируем данные по параметрам

Потом можно добавить дополнительные подписи на диаграмму. Выбирать можно любые из столбца «Измерения». Мы для примера добавили на диаграмму количество продаж по каждой категории.

15

Добавляем подписи на диаграмму

Затем созданную диаграмму нужно сохранить, кликнув на кнопку «Сохранить» в правом верхнем углу экрана. Название у нее будет такое же, как название у датасета.

Кроме диаграмм в DataLens можно строить таблицы или просто выводить какие-то числа на экран. Это удобно, если у вас обновляемая база данных — вы сможете нарисовать все нужные диаграммы, таблицы и др. в DataLens и следить за изменениями.

Мы для примера построим таблицу по категории товара и количеству продаж.

16

Сводная таблица по покупкам

Важно! В настройках форматирования показателей таблиц можно включать линейные индикаторы, чтобы делать таблицу похожей на линейчатую диаграмму.

17

Добавляем линейные индикаторы в таблицу

А еще выведем на экран количество продаж. Для этого нужно выбрать отображение значений в виде «Индикатор» и в строку «Показатель» перенести информацию о количестве продаж.

Показатель «Индикатор» в Даталенс
Столько денег мы заработали с продаж

Важно! Настраивать тип полей можно и на стадии чартов. Это лучше делать, если нужно изменить тип данных для одного чарта — так вы не перегрузите список полей датасета. Но если новый тип данных нужен и для других чартов, лучше менять его на этапе создания датасета. Так не придется менять его в каждом чарте.

Чарты строить научились, теперь повторим, какая визуализация нужна в разных ситуациях.

Задача Что лучше подходит
Отследить динамику. Например, проверить продажи на сезонность или понять, как растут продажи по дня. Графики, потому что они лучше всего отображают изменение во времени. Например, линейный график.
Увидеть конкретные числа или сравнить их между собой. Например, как отличается конверсия по разным клиентам или как менеджеры справляются в планом. Линейчатые или столбчатые графики.
Протестировать гипотезу. Например, проверить корреляцию между количеством заказов и затратами на рекламу. Точечные и столбчатые графики.
Найти долю от целого. Например, понять, какой процент от планируемого выполнили менеджеры или какой процент продаж приходится на конкретные товары. Круговая или кольцевая диаграммы, которые показывают процентное отношение.
Получить конкретное значение или выгрузить данные. Например, сколько продаж было или какой тип оплаты выбирали клиенты. Таблица.
Если необходимо показать одно ключевое значение. Индикатор

Следующий этап — создать полноценный дашборд с разными диаграммами.

Как работать с вкладкой «Дашборды»

Для этого нужно выбрать вкладку «Дашборды» в панели управления слева → «Создать дашборд». Назовите его и кликните на «Создать».

Затем нажмите на «Добавить» по центру экрана и выберите одну диаграмму.

19

Вы можете называть диаграммы по своему в поле «Название»

Чтобы добавить остальные чарты, в правом верхнем углу кликайте на «Добавить» и добавляйте информацию по очереди.

20

Настраиваем дашборд

Важно! Не нужно выбирать сразу все диаграммы — сервис добавит только первую выбранную.

У нас в итоге получился такой дашборд:

Наш вариант дашборда
Наш вариант дашборда

А если у вас будет больше информации о компании, то собрать можно будет более информативный и полезный дашборд:

20

Такой дашборд есть в демо-версии Даталенс

Еще одно дополнение — размеры чартов можно менять. Для этого нужно кликнуть левой кнопкой мыши на треугольник в правом углу каждого чарта, зажать клавишу и потянуть мышь в сторону.

Кроме чартов к дашбордам можно добавлять селекторы — инструмент для передачи информации из запроса чартам, параметрам датасета или дашборда (или другим селекторам). По сути это кнопка, которая позволяет переключаться между разными данными.

22

Вот так селектор помогает фильтровать данные

А еще можно добавлять текст, картинки, цитаты, формулы, код и подзаголовки.

Как добавить текст и заголовки в DataLens
Добавляем текст и заголовки

Важные особенности дашбордов:

  • Виджет всегда добавляется в левый нижний угол.
  • Виджеты приклеиваются к верхней части дашборда и не могут «висеть» в воздухе. Но есть лайфхак: использовать пустые текстовые поля для красивой верстки. С помощью них можно закрепить чарт не сверху, а чуть ниже, или, например, справа снизу.
  • Виджеты не могут пересекаться и наслаиваться друг на друга.
  • Размер виджета меняется только вручную.
интерфейс дашборда в Даталенс

Весь интерфейс дашборда в одном скриншоте. Источник

Делимся дашбордом с другими участниками

Когда подготовите дашборд, можете опубликовать его в интернете и показывать кому угодно. Для этого нажмите на «…» в левом верхнем углу экрана → «Публичный доступ» → перетащите ползунок напротив «Текущий объект». Затем настройте доступ для чартов, датасетов и подключений, которые используются в этом дашборде.

После этого копируйте ссылку на дашборд и жмите «Применить».

22

Сам дашборд будет доступен по ссылке

Добавляем остальных участников команды и настраиваем доступы

Добавлять пользователей в DataLens можно только по адресу Яндекс Почты.

Чтобы добавить человека, перейдите в раздел «Настройки сервиса» и «Управление пользователями» кликните на «Добавить пользователей».

Как добавить пользователей в DataLens
Добавляем пользователей в команду

В открывшемся окне впишите адрес почты человека и нажмите «Добавить».

Добавляем пользователей в DataLens
Все еще добавляем

Дальше можно настроить права доступа. Разграничение прав доступа в DataLens реализовано на уровне объектов и папок. Это значит, что на каждый объект или папку можно настроить права доступа, которые разрешат пользователю определенные действия. Если вы создадите или скопируете папку или объект, то у них будут те же права, что и у родительской папки, в которой они будут размещены.

Вот, на что можно настраивать права:

  • подключение;
  • датасет;
  • чарт;
  • дашборд.

Всего есть 4 права доступа:

  • Исполнение. Такой доступ разрешает делать запросы к базам данных и датасетам, но запрещает редактировать чарты и создавать датасеты.
  • Просмотр. Такой доступ разрешает только просматривать дашборды, виджеты, датасеты и папки.
  • Редактирование. Такой доступ позволяет изменять дашборды, виджеты, подключения, датасеты и папки.
  • Администрирование. Такой доступ разрешает изменять доступные объекты и папки, изменять права доступа.

Как настроить права доступа

Для этого нужно выбрать в панели управления вкладку с нужным объектом (папкой, чартом, датасетом и т.д.). А затем навести мышь на строку с нужным объектом и нажать на «…» в правом конце строки. Появится всплывающее окно, в котором нужно выбрать «Права доступа».

В правах доступа в правом верхнем углу надо кликнуть на «Права на …» и в строке «Добавить участников» вписать адрес почты или никнейм нужного человека.

27

Настраиваем права доступа

Изучаем Yandex DataLens подробнее

В статье мы рассказали о базовых моментах работы с сервисом. На самом деле возможностей у DataLens инструмента, но на рассказ обо всем уйдет не одна статья. Поэтому проще будет посмотреть курсы по анализу данных в Yandex DataLens от Яндекса — там обо всем рассказывают подробно и наглядно:

Основы работы с DataLens. Это базовый курс по основам работы с DataLens.

Yandex DataLens Festival. В курсе вы изучите особенности анализа в облаке: хранилище, ETL, безопасность.

Построение корпоративной платформы данных. Курс о том, как свести статистику вашей компании в одно защищенное облачное хранилище и использовать его как источник для анализа. После прохождения курса вы научитесь выбирать архитектуру проекта и подходящие для его реализации инструменты, настраивать нужные сервисы и интегрировать их между собой.

DataYoga: марафон по DataLens. Это бесплатный марафон с практическими задачами по визуализации. Марафон также доступен в формате книги.

Визуализация данных: бесплатный курс-симулятор в Нетологии. Бесплатный курс, в котором вы почувствуете себя в роли аналитика в крупной ритейл-компании и поможете принять решения об открытии новых точек продаж.

Инженер облачных сервисов. Базовый курс от Yandex Cloud для тех, кто хочет изучить инструменты визуализации и аналитики данных, а также основы облачной инфраструктуры.

Также вам может пригодиться наша подборка 20+ классных курсов по веб-аналитике и работе с данными.