2017-09-05

『機械脳の時代(加藤エルテス)』脚本から興行収入を事前に予測できる?

機械脳の時代を読んでみました


人工知能、データサイエンス、機械学習等の話題が絶えないですが、今回は「機械脳の時代」という方を読んでみました。ちなみに著者の加藤さんは、NewsPicksのプロピッカーでもあります。


機械脳の時代―――データサイエンスは戦略・組織・仕事をどう変えるのか?
加藤 エルテス 聡志
ダイヤモンド社
売り上げランキング: 28,820


加藤エルテス 聡志

コンサルティングファーム(McKinsey)・米系メーカー等を経て、2014年に(社)データサイエンス研究所を創設。代表理事に就任。同年RISU Japan (risu-japan.com) 共同創業者・取締役に就任。 著書「機械脳の時代」(ダイヤモンド)、「日本製造業の戦略」(ダイヤモンド社・共著)、「プログラミングはロボットから始めよう」(小学館)、編集協力に「日本の未来について話そう」...


例のように書評を書いていこうと思います。

目次

  • 本書の概要
  • 統計学と機械学習の違い
    • 統計学
    • 機械学習
  • 機械学習でできること
    • 可視化
    • 分類
    • 予測
  • 機械学習が可能にした、驚くべき事例
    • 大手映画製作会社は英国のエパゴギクス社の事例
    • ギャンブル企業シーザーズ・エンターテインメントの事例
    • ポリフォニックHMI:ノラジョーンズを掘り当てる
    • Match.comの事例




本著の概要


本著は、以下のような構成となっていました。
  • 機械学習 / データサイエンスを用いることで企業価値を高めた成功事例の紹介
  • 実際に価値創出を図ろうというときに、陥りがちな罠に触れつつ、抑えるべきステップをプロジェクト例と合わせて解説
  • データサイエンティストのキャリアパスについて

対象としてはデータサイエンスに興味がある人、人工知能領域ではどのような行われているかを包括的に知りたい人にとってはとても面白い内容となっていました。


個人的に面白かったところについてまとめていきます。


機械脳の時代とは


機械脳の時代では、人間の代わりに人が考えてくれると著者は言います。確かに今までは人間の力の延長線上でしたが、これからは機械が考えるようになるのですね。

医療データも、機械が処理することが増えてきました。米保険会社のアンセムは、人間の医師の診察に加え、アルゴリズムによる「セカンドオピニオン」を一部義務化しています

ハリウッドの大手映画製作会社は英国のエパゴギクス社な、まだ1秒も映画を撮影しない段階で興行収入を予測させ、ヒット作になるように筋書き・俳優の修正提案を受け入れています。より世界中の人を感動させ、熱中させるためには物語をどう変えるべきかも、アルゴリズムが提案しています

現在、人類が歴史上初めて経験しているのは、「考えること」そのものを機械が代替するようになるという革命的な変化です。この時代を、筆者は産業革命期になぞらえ「機械脳の時代」と呼んでいます。

統計学と機械学習の違い


少しでも機械学習を勉強したことがある人がぶち当たる疑問でしょう。
統計学と機械学習の違いはなんでしょうか。


統計学は多様なデータの平均的な特徴を分析する学問なのに対し、機械学習はすべてのデータを学習し適切なアルゴリズムを作成することにあると著者は言います。


「機械脳の時代」と認識すべき理由の第1は、今まで活用されてきた統計学と、現在主流になりつつある機械学習は、根本的に異なる要素技術であるからです。

統計学は、平均や分散、相関などの観点でデータの特徴を人が把握したり、人が予想するのを手助けするための学問です。一方、機械学習は、人間が機械に「この場合はこう」「あの場合はこう」という命令を出すことなしに、全てのデータを渡して後は「機械自身に学習させる」ことが名前の由来となっている技術であり、そもそもまったく違う概念です

データが複雑になるほど、人間が個別の命令を網羅するのは不可能になります。統計学では多様なデータの平均的な特徴しかわかりません。多数の特徴だけを残し、少数の特徴は捨ててしまう、と言い換えることもできます。一方で、機械学習は全ての特徴を残したまま計算をおこなうことができます。少数派の特徴は、数は少なくても種類がとても多いのです。その結果、機械学習のほうが、ケタ違いに高度で複雑な判断をおこなうことができるようになっています。

機械学習ができること


さて、機械脳の時代で、機械脳ができることはなんでしょうか。それは可視化、分類、予測だそうです。

しかし機械脳がおこなっている処理は、実は3種類しかありません。「可視化する」「分類する」「予測する」の3つです。一見魔法のような機械脳の働きも、この3つの組み合わせでしかないのです
①可視化する……人間が感覚的に把握できる形式に、データを加工・翻訳する機能
②分類する……同じ性質を持つものと、そうでないものに区別する機能
③予測する……過去のできごとから、将来どうなる可能性が高いか推計する機能

機械学習が可能にした、驚くべき現実


さて、この本は実際に機械脳が可能にしてきた実例を紹介しています。個人的に非常に面白いと思った事例をまとめてみます。

米保険会社アンセムの事例:予防可能性を予測


1つ目は、アメリカの保険会社の事例です。保険会社のビジネスモデルとしては、定期的な保険料から、一時的な払戻し金でなりたっています。機械学習を使って、お金を払わなくても済むような予防可能性に注目をしました。


もう1つ、ヘルスケア領域での事例を紹介します。アンセム(旧ウェルポイント)はアメリカの大手保険会社の1つです。保険ビジネスは、加入者から支払われる保険料と、保険会社が支払う払戻金の差額で成り立っています。そのため、保険会社としてはなるべく多く保険料を集め、支払う払戻金が少ないほど利益を得られることになります
アンセムはそもそも払戻金を払わなければならない事象(つまり健康状態の悪化や、高額な治療が必要な状態の発生)の予防可能性に着目しました


大手映画製作会社は英国のエパゴギクス社の事例:脚本から興行収入を予測


今回読んでて一番インパクトが大きかったのは、この事例です。まだ未公開の映画の脚本から、機械学習で興行収入をかなり正確に予測できるという事例です。


 ハリウッドでは、6つのメジャースタジオが年間に約20本の映画を製作しています。広告費を除いても、1本の映画製作コストは平均6000万ドルにものぼります。さらに、ある程度見込みのある脚本が現実味を帯びるまでにも1400万ドルのコストがかかると言われています。日本の映画製作費が平均3・5億円であることに比べると、実に20倍近くの初期投資がかかります。


創業直後の2004年、ある大手映画会社が未公開の映画の脚本9本をエパゴギクスのアルゴリズムが解析しました。9本の映画が全て公開され、上映が終了した後、エパゴギクスがはじき出した各映画の興行収入予測と、実際の結果とを比べたところ、9本のうち6本の予測が的中していました


著者は、以下のような重みづねで予測したのではないかと予測しています。


・ヒーローの葛藤:10ポイント中7・0 → 700万ドル相当を加算 ・赤毛の魅力的な女の子の登場:10ポイント中6・5 → 300万ドル相当を加算 ・ヒーローと4歳の男の子が共演するシーン:10ポイント中9・0 → 200万ドル相当を加算 という具合に、Mr.ピンク&ブラウンが付けた採点すべてに値付けがされていった

ギャンブル企業シーザーズ・エンターテインメントの事例:顧客満足度の予測


また、ギャンブル企業でも、よりお客さんがリピートしてくれるように、負けて「もう来たくない」と思う閾値をデータから予測することに成功しているそうでふ。



ギャンブルの事業モデルは、より多くの顧客を惹きつけ、データを見て初めにわかったのは、満足度が高かったユーザーが、次からさらに大きな金額を使う、というシンプルな法則でした。 そのため、ラブマン氏はさまざまな経営システムを顧客満足に紐付けて導入することにしました。顧客満足度を上げることを従業員の評価・給与体系に含めることは当然のものとして、そもそもどうすればより顧客満足度を上げられるかを検討しました。ここまでのアプローチは、企業アプローチとして何の変哲もない標準的な打ち手で

ラブマン氏のアプローチのユニークさは、ここから際立ってきます。カジノ業界では、VIPは例外として、その他の一般顧客を、人によって違う扱いをすることは厳禁と考えられてきました。ラブマン氏はその方針を覆し、顧客によってオファーを変え始めたのです。 具体的には、プレイのために利用するカードの登録時に得られた「人種」「年齢」「居住エリアの経済水準」などの顧客属性を勘案し、どれほど損失を出すと「不満足」になってしまう人なのか、個人ごとにグループに振り分け、打ち手を変え
です。 たとえば、「白人」「40歳」「女性」「居住エリアの平均所得が○○ドル」であれば、1日の損失で我慢できる金額は○○ドルまでと決め、その顧客の損失額がその金額に到達する前に従業員がプレイをやんわりと止め、代わりにレストランやアルコールのフリーチケットを配る、といった個別最適化手法が知られています


顧客ごとの満足度と収益性を最大化するアプローチの期待収益性は高く、カジノに限らず、個別判断が得意な機械脳の普及に伴い、確実に増えるでしょう


Match.comの事例:


出会い系サイトでも、使われているようですね。


珍しい領域では、米出会い系サイト大手のマッチ・ドットコムが、利用者が過去に付き合っていた恋人の顔のパターンから、似た顔立ちの恋人候補を探し出すサービスなどがあります

調べてみたら面白いですね。USだと出会い系にかなり機械学習の知識を取り入れているようです。

Love, Sex and Predictive Analytics: Tinder, Match.com, and OkCupid

"Have we got a girl for you" Some very sophisticated machine learning and predictive analytics models are powering the online dating or hookup world. A lot of innovation is taking place around real-time, geo-location based matching services. Coinciding with the trend toward mobile, there is a meaningful shift of usage from desktop to mobile devices.



また、オンライン結婚相談サイトでも、どの会員とどの会員が「成約」、要はカップルになりやすいか予測し、その予測に基づいて推薦がおこなわれています。イー・ハーモニーの取り組みはその一例です

最後に


興行収入の予測など、至って一部の人間でしかできないような、ある意味直感じみたことを、機械脳は正確に予測できる。これってすごいことなんじゃないかと思いました。今回の書評ではレビューにフォーカスしましたが、ほとんどが実践にフォーカスしているので、データサイエンスに興味がある人にはオススメでした。

機械脳の時代―――データサイエンスは戦略・組織・仕事をどう変えるのか?
加藤 エルテス 聡志
ダイヤモンド社
売り上げランキング: 13,476


注目の投稿

 PythonのTweepyを利用して、Twitter APIを利用している。 その中で、ハマったポイントをメモしておく。 まず、Searchに関して。 Twitter検索は、クライアントアプリ側では、全期間の検索が可能になっている。 一方で、APIを利用する際は、過去1週間しか...