О компании

ООО ДиджиталБайт — аудит данных, DWH и BI для финансового сектора

2+
года
4
банка
11
проектов
41
специалистов
15
направлений
86
модулей

Направления экспертизы

🤝 Вход в проект
От встречи до Quick scan — начните без обязательств.
Установочная встреча (E0)
Вопросная сессия (E1)
Quick scan — бесплатная диагностика (E2)
3
модулей

Наша команда

41 специалистов · 7 ролей

🏗 Архитекторы данных
Проектирование DWH, ревью архитектуры, миграции между платформами
2
чел.
• Greenplum: MPP-архитектура, distribution keys, партиционирование
• ClickHouse: ReplacingMergeTree, Distributed tables, materialized views
• Oracle: RAC, Exadata, partitioning, AWR
• Data Vault 2.0, Kimball, Medallion Architecture
• Capacity planning, sizing, DR-стратегии

Как мы находим проблемы

8 методов · инструменты · примеры из практики

🎯 Интервью стейкхолдеров
Выявляем боли, ожидания и контекст у ключевых людей: DWH lead, BI lead, бизнес-заказчики, ops.
2–3 дня
длительность
👥 Интервьюируем
• Head of DWH / Data Platform
• BI Lead / Head of Analytics
• Бизнес-заказчик (CFO / CRO / COO)
• DevOps / Infrastructure Lead
• Владелец данных (Data Owner)
❓ Ключевые вопросы
• Какие отчёты чаще всего врут?
• Сколько времени тратится на ручные сверки?
• Когда последний раз DWH не справился?
• Какие данные вы не доверяете?
• Что сломается, если уволится ключевой человек?
🔧 ИНСТРУМЕНТЫ
Miro — визуализация карты болейConfluence — фиксация результатовСтруктурированный шаблон интервью (30 вопросов)
💡 ПРИМЕР ИЗ ПРАКТИКИ
В банке топ-50 за 5 интервью выявили: 3 витрины с ручными корректировками, отсутствие lineage для 2 форм ЦБ, bus factor=1 на ETL.
📦 DELIVERABLE
Карта болей + матрица приоритетов + scope аудита

Как выглядит результат

6 типов отчётов · SQL-доказательства · roadmap

📋 Полный список артефактов по всем 86 модулям →
🔴 Findings Report
Главный deliverable — все findings с приоритетами
PDF/HTML · 30–80 стр. · структурированный
📋 СОДЕРЖАНИЕ
Executive Summary (1-2 стр.) — для CTO/CDO
Scope и методология
Findings по категориям (Critical / High / Medium / Low)
Каждый finding: описание, SQL-доказательство, impact, рекомендация, effort
Heatmap: модули × severity
Roadmap устранения (Quick wins → Medium term → Long term)
🔍 ПРИМЕРЫ FINDINGS
CRITICALРасхождение 340M ₽ между управленч. балансом и формой 101 из-за некорректного ку...
SELECT SUM(amount_rub) FROM mart.balance WHERE dt='2024-01-01' -- 45.2B
SELECT SUM(amount_rub) FROM reg.form_101 WHERE dt='2024-01-01' -- 44.86B
DELTA: 340M ₽ (0.75%)
HIGH15 витрин без единого DQ-теста — ошибки обнаруживаются пользователями в дашборда...
SELECT table_name FROM information_schema.tables
WHERE table_schema='mart' AND table_name NOT IN (SELECT DISTINCT table_name FROM dq.test_results)
-- 15 rows
HIGHBus factor=1 на ETL: весь код в голове одного разработчика, 0 комментариев, 0 до...
SELECT author, COUNT(*) FROM git.commits GROUP BY 1
-- developer_a: 847 commits (94%)
-- developer_b: 53 commits (6%)

Кейсы

7 реальных проектов: проблема → что сделали → результат в цифрах

Все кейсы подробно →
КЕЙС #1
Расхождение управленческого баланса и формы 101 ЦБ на 340M ₽
Банк ТОП-50 · Универсальный банк, 1200 таблиц в DWH, Greenplum, 8 форм ЦБ
6 недель (PKG-F)
PKG-F
⚠ Проблема
Расхождение обнаружено аудиторами Big4. Банк не мог объяснить причину 8 месяцев. Под угрозой — предписание ЦБ. Ручные корректировки перед каждой отправкой формы.
🛠 Что сделали
Построили матрицу сверок (50 пар показателей). Параллельный расчёт обоих контуров. Трассировка SQL через 4 слоя DWH. Обнаружили: курс ЦБ берётся на T-1 вместо T для валютных переоценок.
✓ Результат
Расхождение устранено. 0 ручных корректировок. Автотест: ежедневная сверка с порогом 0.01%. Время расследования любого расхождения: 30 мин вместо 5 дней.
47
findings
3
critical
4
нед. fix
~12M ₽
экономия/год
регуляторнаяreconciliationЦБ
КЕЙС #2
Bus factor = 1. Единственный DWH-инженер уволился, ETL упал на 3 дня
Цифровой банк · Необанк, 400 таблиц, PostgreSQL, 15 аналитиков, нет регуляторки
4 недели (PKG-S + PKG-GOV)
PKG-S
⚠ Проблема
Весь код (47 витрин) написан одним человеком без комментариев. Git есть, но 0 документации. Деплой через pgAdmin. При уходе инженера — 3 дня простоя, бизнес без отчётов.
🛠 Что сделали
За 2 недели: парные сессии с оставшейся командой для документирования бизнес-логики. Data dictionary для 200 таблиц. Настройка CI/CD (GitHub Actions + sqlfluff). dbt tests для 20 критичных витрин. Менторинг junior-разработчика.
✓ Результат
Bus factor = 3. Онбординг нового человека: 3 дня вместо 2 недель. 0 production-инцидентов за 6 мес. после аудита. CI/CD: автодеплой за 5 мин вместо ручного copy-paste.
31
findings
5
critical
3
нед. fix
~8M ₽
экономия/год
bus factorCI/CDдокументация
КЕЙС #3
ECL-модель IFRS 9 в Excel. Аудиторы Big4 дали замечание о невоспроизводимости
Банк ТОП-30 · Розничный банк, 2000+ таблиц, Oracle → Greenplum миграция, МСФО
10 недель (PKG-F + PKG-IFRS)
PKG-F+
⚠ Проблема
ECL для портфеля 50K+ кредитов считается в Excel с VBA (20 вкладок). Один человек знает формулы. Нет version control, нет backtesting. Big4 поставили замечание: 'результат невоспроизводим'.
🛠 Что сделали
Параллельный расчёт ECL в SQL/Python vs Excel — выявили 12 расхождений в формулах. Перенесли модель в DWH (PostgreSQL). Git для version control. Автотесты: PD backtesting, stage migration consistency. Dual-run 3 месяца.
✓ Результат
ECL в DWH: воспроизводимый, версионированный, с audit trail. Замечание Big4 снято. Время расчёта: 45 мин вместо 8 часов. Backtesting PD: автоматический, ежемесячный.
62
findings
8
critical
8
нед. fix
~25M ₽
экономия/год
МСФОECLIFRS 9Big4
КЕЙС #4
PII 2M клиентов в открытом виде. Нет маскировки, нет audit trail
Региональный банк · 200 таблиц, PostgreSQL, 3 формы ЦБ, команда 2 человека
3 недели (PKG-SEC)
PKG-SEC
⚠ Проблема
ФИО, паспорта, СНИЛС, ИНН в 23 таблицах без маскировки. 47 ролей с доступом, включая 15 аналитиков. Нет pgaudit. Проверка Роскомнадзора ожидается через 6 мес.
🛠 Что сделали
PII-сканирование всех таблиц (regex по 10 паттернам). Классификация: обязательные vs избыточные PII. Column-level masking (SHA-256). View-based security. Пересмотр RBAC: revoke excessive privileges. pgaudit для логирования.
✓ Результат
100% PII замаскированы в непроизводственных средах. RBAC: с 47 до 12 ролей. Audit trail: полный. Проверка Роскомнадзора пройдена без замечаний.
28
findings
4
critical
3
нед. fix
~18M ₽
экономия/год
PII152-ФЗбезопасностьRBAC
КЕЙС #5
DQ = 0. Ноль автоматических проверок. 15-20 часов/неделю на расследование ошибок
Банк ТОП-20 · Корпоративный банк, 3000+ таблиц, Greenplum, 50 витрин, 30 аналитиков
6 недель (PKG-DQ)
PKG-DQ
⚠ Проблема
Типичный цикл: аналитик видит аномалию в дашборде → Slack → DWH-команда расследует 2-4 часа. 3-5 раз в неделю. Бизнес не доверяет данным — перепроверяет вручную в Excel.
🛠 Что сделали
DQ Maturity Assessment (Level 1 → target Level 3). Профилирование 50 витрин. 200 DQ-правил в dbt tests. Reconciliation framework (source↔staging, staging↔ODS, ODS↔mart). DQ-дашборд в Grafana. Runbook для каждого типа нарушения.
✓ Результат
DQ score: с 0% до 87% покрытие. Инциденты от бизнеса: с 15/нед до 1/нед. Время расследования: с 3 часов до 15 мин (благодаря lineage). Бизнес начал доверять данным.
54
findings
6
critical
6
нед. fix
~15M ₽
экономия/год
DQreconciliationdbtGrafana
КЕЙС #6
Дашборды грузятся 30-60 секунд. 20 аналитиков теряют по 30 мин/день
Банк ТОП-100 · Универсальный, 600 таблиц, MS SQL, миграция на PostgreSQL
3 недели (PKG-S + PKG-BI)
PKG-S
⚠ Проблема
BI на Superset поверх MS SQL. Full table scan на 500M строк (нет партиций, нет индексов). SELECT * в 12 витринах. CROSS JOIN в 3 чартах. Аналитики ждут, бизнес раздражён.
🛠 Что сделали
pg_stat_statements: ТОП-20 slow queries. EXPLAIN ANALYZE каждого. Индексы на WHERE/JOIN поля. Partitioning (monthly) для 3 таблиц >100M строк. Materialized views для 5 тяжёлых агрегаций. Замена SELECT * на явные списки.
✓ Результат
Среднее время запроса: с 45с до 2.3с (в 20 раз). 0 запросов >10с. Аналитики экономят 200 часов/мес. VACUUM FULL: таблицы уменьшились на 40%.
35
findings
2
critical
2
нед. fix
~6M ₽
экономия/год
performanceBIиндексыпартиционирование
КЕЙС #7
CTO подозревает проблемы, но нет конкретики для обоснования бюджета
Экспресс-диагностика · Банк ТОП-70, 800 таблиц, Greenplum, CTO хочет понять масштаб проблем
2 недели (PKG-QUICK)
PKG-QUICK
⚠ Проблема
CTO пришёл с запросом: 'У нас что-то не так с DWH, но я не могу аргументировать бюджет на полный аудит перед правлением. Нужны конкретные цифры за 2 недели.'
🛠 Что сделали
Quick scan: установочная встреча + интервью с 5 ключевыми людьми + экспресс-анализ архитектуры и SQL. За 10 рабочих дней: 12 findings (3 critical), карта рисков, рекомендация по scope полного аудита.
✓ Результат
CTO получил presentation для правления с конкретными цифрами. Бюджет на полный аудит (PKG-F) утверждён за 1 неделю. Экономия 2 месяца на согласованиях.
12
findings
3
critical
2
нед. fix
Аргумент для бюджета 8.9M ₽
экономия/год
quick scanCTOбюджетправление

Мы vs альтернативы

Digital ByteBig 4ФрилансIn-house
Стоимость аудита DWH2–5M ₽8–20M ₽1–3M ₽ФОТ команды
Срок (типовой аудит)4–8 нед3–6 мес2–4 неднет дедлайна
Экспертиза в банкахСпециализацияШирокаяЗависитСвою знают
Greenplum / ClickHouse / dbtГлубокоеOracle-центричны1–2 технол.Свой стек
ОтветственностьDeliverable по ТЗDeliverableНа словахНет внешн.
NDA + изолированный контурслабыйвнутренний
Замена специалистаБыстроБюрократияИскать новогоДолгий найм
Свежий взгляд

Отраслевой benchmark

Выберите тир — покажем профиль и наш fit

ИНФРАСТРУКТУРА
Greenplum / Oracle Exadata / Teradata, 200TB–2PB, 5+ кластеров
КОМАНДА
DWH: 50–150 чел, DBA: 10–25, выделенные команды DQ и DataOps
ИСТОЧНИКИ
15–40 систем-источников (АБС, процессинг, CRM, казначейство, риски, AML, HR, 1С, SWIFT, БККИ и др.)
БЮДЖЕТ
Аудит: 5–15M ₽/проект
5 000–30 000
Таблиц
500–3 000 jobs
ETL
50–200 форм ЦБ
Отчётов
1 000–5 000 BI
Users
ТИПОВЫЕ FINDINGS
Расхождение РСБУ↔МСФО на сотни миллионов, ECL-модели не согласованы между подразделениями, lineage отсутствует для 40%+ витрин, FTP-кривая stale, дублирование логики в 5+ системах
НАШ FIT
PKG-FULL или точечные модули (R1–R6, F1–F6). Субподряд: Architect для архитектурного ревью.

Как мы работаем

Кликните шаг для деталей

1
Заявка
Вы описываете задачу — по почте, Telegram или на встрече.
1 день
2
E0: встреча
Знакомство, уточняем scope. Бесплатно.
1–2 ч
3
E2: quick scan
Смотрим 3–5 витрин, находим первые findings. Бесплатно.
3–5 дн
4
ТЗ и договор
Фиксируем scope, deliverables, сроки. NDA.
3–5 дн
5
Работа
Команда работает. Статус каждую неделю.
по модулю
6
Результат
Презентация findings. Передача deliverables.
1–2 ч
7
Приёмка
Проверка по checklist. Акт.
1–3 дн

Риски, гарантии и SLA

Quick scan: без обязательств
Quick scan (E2) — бесплатная экспресс-диагностика: 3–5 витрин, 5–10 findings за 3–5 дней
Если по результатам мы рекомендуем дальнейшие модули, а вы решаете не продолжать — никаких обязательств
Quick scan создан, чтобы вы приняли информированное решение на основе реальных данных
Мы не продаём «кота в мешке» — вы видите качество работы ДО заключения договора

Частые вопросы

Можно начать с одного модуля, а не с пакета?
Да, любой модуль можно заказать отдельно. Пакет — это скидка 15–20% при заказе связанных модулей. Начните с Quick scan (E2, бесплатно) → мы порекомендуем оптимальный набор. Часто клиенты начинают с 1–2 модулей и расширяют scope по результатам.

Что нового

Март 2026 v3.2
Февраль 2026 v3.1
Январь 2026 v3.0
2025 v2.x
💼
Кейсы
7 проектов в цифрах
🔎
ТОП-20 проблем
Findings + методология
Подбор пакета
Визард + ROI + сравнение
📄
Артефакты
86 модулей: IN/OUT
🎓
Аттестация
8 компетенций + грейды

Бесплатная диагностика

3–5 витрин · 5–10 findings · за 3–5 дней · без обязательств

📩
Оставьте заявку
Имя, компания, задача — 30 секунд
🤝
Встреча с архитектором
30 минут онлайн — обсуждаем боли и стек
🔎
Quick scan 3–5 витрин
Подключаемся read-only, находим реальные проблемы
📋
Отчёт с SQL-доказательствами
5–10 findings + рекомендации. Без обязательств.
contact@dgbyte.ru
Ответим в течение 4 часов
Quick scan: 5–10 findings за 3–5 дней
Бесплатно · без обязательств
contact@dgbyte.ru