Xicaとのマーケティングスペシャリスト・連携インタビュー第2弾は、YahooDeNAドリコムを経て独立し、データサイエンティストとして書籍も多数出版されている里洋平氏。エンジニア出身ながら、データサイエンティストとしてのスキルを持つ希少な人材である里氏のスキルがいかにして構築されてきたかについてお話を伺いました。

データが意思決定に直結していること、目的変数を明らかにしておくことなど、データを活用していくにあたって気をつけておくべきことは何でしょうか?

原点は、大学時代のガソリン価格共有サイト作り

-現在の専門分野に進んだきっかけはどこにあったのでしょうか?

里 洋平氏(以下、里):

大学時代は電気電子工学科というところで、電磁波や回路などについて勉強していました。大学3年の時に友達とガソリンの価格の共有サイトの作成をしました。その当時スタンドによって値段が結構違ったんですよね。プログラミングはやったことがなかったのですが、自宅サーバーと構築してサービスを作っていました。そこからWebサービスを作ることに興味を持って情報系の研究室を選びました。また、そのころにWebエンジニアのアルバイトもはじめましたね。

-社会人になった後に、データを活用するような業務が増えたのでしょうか?

里:

まず、新卒でYahooにwebエンジニアとして入りました。新規事業を作りたいと希望していたらそのとおりの部署に配属され、新規事業の立ち上げに従事していました。そこでは、動画のレコメンドや動画の番組表の生成ロジックなどにデータが活用されていました。

自分のいたチームが、リーダーのスキルが高かったため難易度の高い案件を受けることが多く、自然とデータを使ってアルゴリズムを組むというような、他のWebエンジニアの方がやりたがらない業務をやることができました。

エンジニアからスタートし、データ分析もできる希少な人材に

-その後に移ったDeNAではどのような経験を積まれましたか?

里:

当時いたYahooは徐々に体制が変わりつつあるタイミングで、思ったようにデータを使った業務ができなくなりそうだなと感じていました、そうしたら、タイミング良く声を掛けていただく機会があり、DeNAに入社しました。

当時DeNAではソーシャルゲームでのデータ分析がうまくいっており、プラットフォームでもデータを活用してビジネスを大きくしていこうという時期でした。そこで、データマイニング部という部署に入って、分析環境を構築していくフェーズから関わることができました。

Hadoopに蓄積された大規模なデータから、それらを分析しやすい形にデータを加工するといったデータ分析基盤の構築から、レポーティングやKPI分析、予測モデルの構築や異常検知など幅広いことをやらせてもらいました。

その中でも、特にTVCMの効果測定モデルは長くやらせてもらい、それがきっかけでマーケティング部門に配属され、これまでとはまた異なる領域の経験をすることが出来ました。

-エンジニアの経歴がありながらデータサイエンティストとしてのスキルもある方は希少だったでしょうね。

里:

ビッグデータの領域はエンジニアのスキルの中でも特殊で、できない人も多いです。また、データのハンドリングはできるけれど分析はできない、という人もいます。データ分析の領域は、コンサル出身の方が多いです。

データのハンドリングと分析の両方できる人は確かにほとんどいないのですが、私はたまたまエンジニアからスタートして、その後にデータ分析に興味を持ったといった経緯で、両方できるようになりました。

その後、ゲームの分析チームの立ち上げに関わりました。DeNAには、データ分析から意思決定をどのように導き出すかを学ぼうと思い入社したのですが、想像していたより分析が意思決定に直結する会社で、学べることが多かったです。

自社サービスの種を探しながら、データ活用のコンサルティングを提供

-独立のきっかけは?現在はどのような仕事をされていますか?

里:

DATUM STUDIO株式会社の社長の酒巻隆治さんと一緒に本を執筆する機会があって、それがきっかけで意気投合し、起業を決めました。

現時点では、最初の段階として、データ活用についてのコンサルティングの提供を開始しています。自社サービスの種探しをしつつ資金を貯めていくような方向性ですね。まだ1年くらいですが、現在までに約50社以上の取引があります。業種としては、広告会社や調査会社、人材などいろいろですね。大手銀行や一部上場している企業も結構あります。コンサルティングの内容としては、モデリングや機械学習関連が一番貢献できると感じています。

良い依頼の仕方は、目的変数をはっきりさせること

-仕事の依頼はどういったところから来ますか?

里:

新規顧客はイベントや有料セミナーで名刺交換させていただいた方や、著書を読んでいただいた方からの連絡が主ですね。知人紹介からの依頼だと、やりたいことがわかっている場合が多く、スムーズに開始できます。

顧客から依頼をいただく時に重視していることがあるのですが、それが「目的変数がわかっているかどうか」ということ。目的変数がなく、「いい感じにしてほしい」と言われると、大体うまくいかないです。目的変数がないと、何がこのプロジェクトの「成果」なのかを定義しにくく、やってもやっても「なんか違う」という形になり、お互い不幸になりやすいです。

また、「解なし」というアウトプットを許容出来るかどうかも一つのポイントになります。データ分析の場合、当たり前ですが、そのデータ上に因果関係がなければ、「解なし」になります。つまり、「今あるデータ」では、期待していた因果関係はない、という事です。こういった場合、今後どんなデータで分析すべきかを検討して、他のデータを集めたり、新たに蓄積したりする流れになると良いのですが、「いや、無いはずはない」と固執してしまうと前に進まなくなってしまいます。

-依頼も様々かと思いますが、どういった案件を受けているケースが多いのですか?

里:

受けている案件の内容としては、広告の効果測定は多いですね。どの広告がどの程度効いているのかを知りたいなどの案件です。通常マルチコ(※)ということが起こって、あまり効果測定がうまくいかないんですけど、その点を改善したサービスを提供すると喜ばれます。

※マルチコ=マルチコリニアリティmulticollinearityの略、多重共線性ともいう。独立変数間に非常に強い相関があったり,一次従属な変数関係がある場合には,解析が不可能であったり,たとえ結果が求まったとしてもその信頼性は低いこと。

また、意外とできていないのが、直接的な効果と間接的な効果の切り分けです。直接的な広告でどの程度効果があったのか、間接的ではSNSなどで拡散してどの程度効果があったのかなどを分解してみせています。

-データ分析での成功例は?

里:

テレビCMの効果測定は非常にうまくいきました。今までのやり方ではうまくいかないことがあって、金融工学で使われている手法と融合させて効果測定モデルを作り、その結果費用対効果が見られるようになった。これはほんとに、試行錯誤を重ねた結果うまくいきましたね。

うまくいったポイントとしては、分析の中身はもちろんですが、アウトプットが非常にシンプルだったことだと思っています。「どういうことをしているのか」をかみ砕いたんです。分析をやっていると、係数がどうだというように難しい言葉になりがちなのですが、その部分をわかりやすくしました。

-では、逆に失敗事例は?

里:

先ほどいったように、依頼の内容に目的変数がなかったときは、大体うまくいかないです。

また、データ分析のアウトプットは、大きく意思決定に使うものと、システムに組み込み自動化するものと二つあるのですが、その区別がはっきりしていないと結局、何をすればよいのかわからなくなる。クロス集計で意思決定出来るような領域でも、高度なモデルで精度を求めてきたりすることもあり、そういった案件は失敗しましたね。

極論を言えば、データ分析が何にも使われなかったっていう状態になってしまったのは失敗ですね。

「データ分析が意思決定に使われている」が、最大の成果

-目的変数が重要というお話でしたが、データ分析自体の成果についても出るときと出ないときがありますね。

里:

本当の成果は、わかりやすく結果が出るということの前に、データ分析からのPDCAが回っている状態を実現することです。ただ成果で判断すると、データ分析による貢献なのかわからない。そのため重要なのは、データ分析が意思決定に使われたか・使われてないかによる違いが、成功と失敗の違いといえます。

結局データ分析のむずかしさはそこにあります。ビジネス的な成果は出ても、それが実際にデータ分析に基づく意思決定でなければ、それはそれで意味がないんですよね。

「その分析によって、どれくらいインパクトのある意思決定がされるか?」を意識するのが大事だと思っています。

未来予測・経営改善のスペシャリストに聞いた、データの可能性とは

データから未来のヒントを得るとはどういうことなのか? 多様なキャリアの中でデータ分析に向き合ってきた里氏と、「すべてのデータに示唆を届ける」統計分析ツールを提供するサイカ社の平尾社長の対談では、プロフェッショナルのデータ分析への向き合い方について語られています。

※インタビューは、サイカのサイトから読めます。


専門家:里 洋平

R言語の東京コミュニティTokyo.Rの主催者。Yahoo株式会社で推薦ロジックや株価の予測モデル構築など分析業務を経て、株式会社DeNAで大規模データマイニングやマーケティング分析業務に従事。その後、株式会社ドリコムにて、データ分析環境の構築やソーシャルゲーム、メディア、広告のデータ分析業を経て、DATUM STUDIO株式会社を設立。
著書に、「データサイエンティスト養成読本 機械学習入門編」(技術評論社)、「データサイエンティスト養成読本 R活用編」(技術評論社)、「データサイエンティスト養成読本」(技術評論社)、「ビジネス活用事例で学ぶデータサイエンス入門」(ソフトバンククリエイティブ)、「Rではじめるビジネス統計分析」(翔泳社)「戦略的データマイニング (シリーズ Useful R 4)」(共立出版)、「Rパッケージガイドブック」(東京図書)
ノマドジャーナル編集部
専門家と1時間相談できるサービスOpen Researchを介して、企業の課題を手軽に解決します。業界リサーチから経営相談、新規事業のブレストまで幅広い形の事例を情報発信していきます。