データの民主化推進のためのダッシュボード整備のススメ

インフラ基盤部データ分析チームの濱口です。最近わが家のキッチンにグリルが導入され、暇があれば魚ばかり食べています。
今回はグループ会社 Zaim での、データ民主化の推進のための Redash のダッシュボード整備に関してまとめていきます。

背景

現在 Zaim のデータ分析チームでは、分析環境の改善による分析効率向上やデータの信頼性向上に努めています。その中の活動の1つに「データ民主化の推進」があります。ここで挙げている「データの民主化」とは一般的に、一部の専門家のみが扱えていたデータの利活用を、データに関する詳細な知識を持たない人でも扱えるようにする環境を整備することを指します。
Zaim における「データ民主化の推進」の目的としては

  • データ分析チームへのデータ抽出依頼を減らしたい
  • 各チームやクライアントへデータや分析内容をより迅速に届けたい

などがあります。誰でも簡単にデータを使えるようにして、全体の分析効率を向上させたいということですね。

やっていること

現在、民主化の推進としては

  • Redash のダッシュボード整備
  • SQL勉強会の実施
  • BIサービスの導入の検討

などを行なっています。今回はその中でも Redash のダッシュボードの整備 についてまとめていきます。

Redash のダッシュボード整備

くふうグループでは、多くの会社がBIツールとして Redash を利用しています。Redash ではクエリでデータを抽出して、簡単に可視化まですることができ、可視化したグラフや表を組み合わせることでダッシュボードを作成できます。

f:id:da-vinci-studio:20211228112808p:plain
整備したダッシュボードの一例

ダッシュボードを整備する手順としては

  • ダッシュボードの目的や要件を利用想定ユーザーにヒアリングする
  • 必要なクエリを作成し、データを可視化する
  • ダッシュボードにまとめる
  • 利用想定ユーザーに実際に使用してもらい、フィードバックをもらう
  • フィードバックをもとに改善する

で進めています。

ダッシュボードの目的や要件をヒアリングする

目的や要件をヒアリングして、必要なデータを洗い出します。

  • データの切り口
  • どういう指標をみるか
  • 具体的な利用シーン
  • 利用発生頻度

などを確認し、要件をより具体的にしていきます。

必要なクエリを作成し、データを可視化する

目的や要件について具体的になったら、クエリを作成して必要なデータを集計していきます。日付など検索したい項目に関しては、以下のようにパラメーターにしておくことで任意の範囲でデータを集計できるようにします。

between '{{period_start}}' and '{{period_end}}'

追加するクエリ間で同じ属性がある場合、パラメータ名を揃えておくとダッシュボードに追加する際にパラメータをまとめることができて便利です。

また集計したデータは、必要に応じて適切なチャート表現で可視化します。棒グラフや折れ線グラフはもちろん、ピボットテーブルやヒートマップなど可視化の種類が豊富なので、用途に合わせて適切な表現を選びます。

ダッシュボードにまとめる

レイアウトにも気を配りつつ、表やグラフをダッシュボードに追加していきます。必要に応じて、使い方や注意点などをコメントとして残していきます。
またダッシュボードのパラメータ名なども分かりやすい名前に変更して追加します。クエリ上の表記のまま英語にしてしまうと、慣れていない人たちにとっては途端に使いづらくなってしまいます。

実際に使用してもらい、フィードバックをもらう

利用が想定されるユーザーに実際に使ってもらい、疑問点や使いづらい点などフィードバックをもらいます。作った側からすると使いやすい完璧なダッシュボードを作れたと思っていても、使う側からすると案外使いづらかったりします。これまでだと

  • 検索項目が分からない
  • どういうふうに日付を指定すればいいのか分からない
  • 指定しないといけないパラメーターが多すぎて、複雑でよく分からない

などのフィードバックがありました。1つのダッシュボードで色んなデータを出せるようにする(機能性を上げる)と、その分パラメーターが増えたり検索項目が複雑になったりして操作の難易度も上がります。利用想定ユーザーによっては、ある程度の機能性を保ちつつも、操作性を損なわないように気をつける必要がありそうです。

フィードバックをもとに改善する

上記のフィードバックをもとに改善していきます。例えば「パラメーターが多すぎて使いこなせない」という場合は、再度目的や要件をヒアリングし直して、データの切り口などを整理し、優先度の低いパラメータを削減したりします。

結果

結果として

  • 定期的に発生しているいくつかのデータ抽出依頼の工数がゼロになった
  • 分析チーム以外の人たちが、自分で Redash からデータを抽出する動きが増えてきた

などが見られました。まだまだ整備途中ですが、既に目に見える形で効果が出てきました。 ダッシュボードの整備以外の施策も進めることで、Zaim 全体のデータの民主化を進めていこうと思います。また Zaim で貯まった知見をくふうグループに展開することで、グループ全体のデータ民主化の推進にも繋げたいと思います。

最後に

Da Vinci Studio では一緒に働ける仲間を絶賛大募集中です!募集職種と詳細に関しては、以下のリンクからそれぞれ確認できます。

一緒にデータ分析してくれる方はもちろん、コードをゴリゴリ書いて開発したい、マネジメントでチームの成果を最大化したい、多種多様なサービスのインフラ構築に携わりたいなど興味のある方はお気軽にご連絡ください。
また、以下は弊社エンジニア・デザイナーのインタビュー記事になります。

kufu.co.jp

www.wantedly.com