ENGINEERING
データエンジニアリンググループ
事業部門/共通部門におけるデータドリブンな意思決定をエンジニアリングによって支える、データエンジニアリンググループについてご紹介いたします。データエンジニアリンググループに所属するデータエンジニアは全社の各部門を横串で支援しており、各部門のデータ活用水準の向上に努めています。
事業/サービスの成長に伴い、データの量・種類・データを要求する仕事は日々増え続けています。我々データエンジニアは、データパイプラインの開発・運用やそれを支えるインフラ、分析関連ツールの提供などを通じて、全社のデータ活用がより便利で安全になるような取り組みをしています。 我々の取り組みによりデータドリブンな意思決定をより効率的に行うことが可能となったり、機械学習や AI 技術を応用した、ユーザーにとって魅力的で便利な機能の開発も効率化されます。
データの利用者
- 経営層や各事業/サービスの責任者などの意思決定者
- 意思決定を強力に後押しするデータアナリスト
- 機械学習を用いてより高度な分析を行うデータサイエンティスト
- 管理会計やカスタマーサービス、HR など共通部門として全社を支えるメンバー
などがあげられます。
我々データエンジニアはデータの利用者を良く理解し、最適なデータアーキテクチャを設計。データパイプラインの開発・運用やそれに付随する様々な業務を行っています。
データ活用の各フェーズでの取り組みと主な利用技術
データ生成
要件定義
- ビジネス要件の理解
- KPI設計
データソース選定/ログ設計
- データソースの選定
ログ、DB、
外部調査データ - ログ設計
マスターデータ
トランザクションデータ
データ収集・蓄積・加工
データレイクへのデータ取り込み
- テーブルスキーマの管理
- 定期的な取り込み
中間集計処理の開発/運用
- DWH/データマートの設計
- 中間集計処理の開発
- 安定的なデータの提供(運用)
その他
- インフラの管理
- データマネジメント(品質、セキュリティなど)
データ活用
BI
- KPIダッシュボードの提供
- メール/slack でのレポーティング
- 探素的な分析
ML活用
- 予測、分類などより高度な分析
- プロダクト価値の向上(レコメンドなど)
- 施策の実現
主な利用技術
fluentd/embulk
BigQuery/GCS/GKE などのGCPサービス
digdag(ワークフローエンジン)
SQL、Python
主な利用技術
Looker (BIプラットフォーム)
データポータル/スプレッドシート
(通知先としての)メール/Slack
内製ML活用基盤
チームカルチャー
事業やサービス、データの利用者を理解する姿勢
我々はデータエンジニアの Vision を以下のように定めています。
事業やデータの利用者を理解し、より便利で安心なデータプラットフォームと、より快適なデータ活用の体験を提供する
良い仕事をするために、事業やサービス、データの利用者の理解を大切にしています。
事業やサービスによって取り扱うデータの性質やデータパイプラインに求められる要件は異なります。また、データの利用者の業務を理解することで各データの重要度や障害発生時の影響度を把握し、監視の仕組みや運用体制を構築しています
OKR による目標管理
四半期ごとに OKR を策定しています。メンバーにも策定プロセスにも関わっていただくことで、目標の納得感を醸成しながらコトに向かうことができます。
何でも相談し合える雰囲気
面倒見の良いメンバーが多く所属しています。勉強会なども積極的に行われています。
働き方
リモートワークも取り入れながらチームを運営しています。地方・遠隔地に住居しているメンバーも居ます。 不定期ですが、本社に通勤しランチやチームビルディングなど行うことで関係性の構築も行っています。