NDA
DataFlow / Новые пресеты для операций (job's)
Eastwind • B2B • data science-комбайн • 2023-2025
Роль: Product Designer
Команда: Product Manager, Tech Lead, Product Designer, Backend Developer, Frontend Developer, QA Engineer, DevOps Engineer
Целевая аудитория:
Дата-сайентисты и аналитики
Маркетологи и продуктовые менеджеры
Телеком-операторы
Финансовые организации и ритейл
Фреймворки: JTBD, Ui/Ux-аудит, Ux-исследования, Качественные исследования
Контекст
DataFlow — это набор созданных операций (jobs). Каждая операция (job) имеет множество настроек, одна из которых — пресеты. Пресеты отвечают за конфигурацию CPU и RAM (физической и оперативной памяти).
Проблематика
Пользователи часто создают операции (job’s), используя пресет по умолчанию, для всех типов (import, Calculation, Model, Export) Это приводит к повышенной нагрузке на кластер, в результате чего такие операции часто завершаются с ошибкой из-за нехватки ресурсов (RAM, CPU).
Боль пользователей
Пользователям сложно понять, почему у них не сработала операция. Им приходится исследовать код и искать причину, а причиной может быть что угодно.
Исследование №1.
Анализ необходимых настроек для пресетов
Я изучил принципы работы кластера и необходимые настройки для всех типов операций:
Export
Calculation
Import
Model
На основе этого подготовил черновые конфигурации и провёл их валидацию с пользователями.
Исследование # 2
Скрининг конфигураций
Совместно с аналитиком мы собрали конфигурации для каждого типа операций, однако столкнулись с тем,
что даже операции одного типа могут потреблять разное количество ресурсов.
Поэтому возникла необходимость
в более гибкой системе пресетов.
Я предложил использовать европейскую размерность (S / M / L) для каждого типа пресета.
Мы сформировали оптимальные конфигурации, после чего пресеты были запущены в продакшн.
Результат и аналитика использования фичи #1
Количественные исследования
Страница операции (job)
Выбор подходящего пресета
При создании или редактировании операций (job)
Только выбор из набора, созданного админом
Admin menu
Таблица конфигураций для Calculation
Admin menu
Выбор типа конфигурации
Создание и редактирование пресетов в Admin menu
Редактирование пресета
Промежуточный вывод
Я ежедневно собирал статистику по использованию фичи. Выяснилось, что в старых операциях (jobs) её почти не используют, тогда как новые операции пользователи создают уже с применением новой системы пресетов.
Гипотеза и новые решения
На основании полученных данных была сформулирована гипотеза:
«Если автоматически применять подходящие пресеты к старым операциям, количество и скорость их выполнения увеличатся.»
Гипотеза # 1
Применить новый пресет можно только в двух случаяx:
1. Когда операции переходят в состояние Failed или Successful
(но это редкие кейсы и не у всех операций. Чаще всего джобы
перманентно запущены и останавливать их не желательно
Применить новый пресет можно только в двух случаяx:
Когда операцию перезапустили (Проблема в том что сейчас нет функционала групповых действий над операциями )
Гипотеза # 2
Присвоить ID каждому типу операции. И во время очередного релиза произвести миграцию пресетов в соответствующие ID.
Итог реализации данного функционала
Повысилась скорость обработки на 63% у старых операций, на 88% обработка новых операций
В ходе исследований были сформулированы несколько новых гипотез и фич для Беклога
Был разработан новый способ автоматизации
Получены артефакты для базы данных, описывающие процесс распределения ресурсов в системном кластере












