ENGINEERING

データエンジニアリンググループ

事業部門/共通部門におけるデータドリブンな意思決定をエンジニアリングによって支える、データエンジニアリンググループについてご紹介いたします。データエンジニアリンググループに所属するデータエンジニアは全社の各部門を横串で支援しており、各部門のデータ活用水準の向上に努めています。

事業/サービスの成長に伴い、データの量・種類・データを要求する仕事は日々増え続けています。我々データエンジニアは、データパイプラインの開発・運用やそれを支えるインフラ、分析関連ツールの提供などを通じて、全社のデータ活用がより便利で安全になるような取り組みをしています。 我々の取り組みによりデータドリブンな意思決定をより効率的に行うことが可能となったり、機械学習や AI 技術を応用した、ユーザーにとって魅力的で便利な機能の開発も効率化されます。

データの利用者

  • 経営層や各事業/サービスの責任者などの意思決定者
  • 意思決定を強力に後押しするデータアナリスト
  • 機械学習を用いてより高度な分析を行うデータサイエンティスト
  • 管理会計やカスタマーサービス、HR など共通部門として全社を支えるメンバー

などがあげられます。

 

我々データエンジニアはデータの利用者を良く理解し、最適なデータアーキテクチャを設計。データパイプラインの開発・運用やそれに付随する様々な業務を行っています。

データ活用の各フェーズでの取り組みと主な利用技術

要件定義

  • ビジネス要件の理解
  • KPI設計

データソース選定/ログ設計

  • データソースの選定
    ログ、DB、
    外部調査データ
  • ログ設計
    マスターデータ
    トランザクションデータ

データレイクへのデータ取り込み

  • テーブルスキーマの管理
  • 定期的な取り込み

中間集計処理の開発/運用

  • DWH/データマートの設計
  • 中間集計処理の開発
  • 安定的なデータの提供(運用)

その他

  • インフラの管理
  • データマネジメント(品質、セキュリティなど)

BI

  • KPIダッシュボードの提供
  • メール/slack でのレポーティング
  • 探素的な分析

ML活用

  • 予測、分類などより高度な分析
  • プロダクト価値の向上(レコメンドなど)
  • 施策の実現

主な利用技術
fluentd/embulk
BigQuery/GCS/GKE などのGCPサービス
digdag(ワークフローエンジン)
SQL、Python

主な利用技術
Looker (BIプラットフォーム)
データポータル/スプレッドシート
(通知先としての)メール/Slack
内製ML活用基盤

我々はデータエンジニアの Vision を以下のように定めています。

事業やデータの利用者を理解し、より便利で安心なデータプラットフォームと、より快適なデータ活用の体験を提供する

良い仕事をするために、事業やサービス、データの利用者の理解を大切にしています。

事業やサービスによって取り扱うデータの性質やデータパイプラインに求められる要件は異なります。また、データの利用者の業務を理解することで各データの重要度や障害発生時の影響度を把握し、監視の仕組みや運用体制を構築しています

四半期ごとに OKR を策定しています。メンバーにも策定プロセスにも関わっていただくことで、目標の納得感を醸成しながらコトに向かうことができます。

面倒見の良いメンバーが多く所属しています。勉強会なども積極的に行われています。

リモートワークも取り入れながらチームを運営しています。地方・遠隔地に住居しているメンバーも居ます。 不定期ですが、本社に通勤しランチやチームビルディングなど行うことで関係性の構築も行っています。

Keeps going and going and going. ずっと、ずっと、ずっと前進する