クイックガイド「機械学習とは何か?」

機械が人間に与える影響については、過去数十年にわたり、さまざまな議論がなされてきました。映画やテレビ、書籍などのポップカルチャーの中で語られているものは、その典型とも言えます。

中でも「機械学習」という概念は幅広く、その用途も多岐にわたるため、未だに「よく知らない」「理解していない」という人も多く、一部には恐怖さえ感じている人もいます。

そもそも、機械学習とは何なのでしょうか?なぜ今、これほど話題になっているのでしょうか?

このクイックガイドでは、機械学習が私たちの実生活の中でどのように役立っているのか、さらにさまざまな業界でどのように捉えられているかについて見ていきます。

人気SF映画の中のロボット

ロボットや人工知能の持つイメージは実にさまざまです。たとえば映画では、ターミネーターやマトリックス、ブレードランナーのようにロボットや人工知能のダークサイドを描いた作品もあれば、エクス・マキナ、ウエストワールド、ブラック・ミラーのようにポジティブな側面とネガティブな側面が入り混じる作品もあります。

いずれの作品にも共通するのは、人工知能を助けた人間の主人公が、自身の行為が果たして正しかったのか、あるいは間違ったことだったのか、という判断の間で板挟みになる姿が描かれていることでしょう。

現実世界の中の人工知能

インテリジェントな機械は、すでに私たちの暮らしに欠かすことのできない存在として、日常生活に深く浸透しています。実際、私たちは自宅でAmazon EchoやGoogle Homeなどの音声アシスタントと会話し、Siriが私たちのランダムな質問に答えたり、またGPSが現在位置を教え、目的地まで案内したりします。

こうした機械は、不気味な赤い目の付いたチタン製の骨格、あるいはカバーの裏側がワイヤーやマイクロチップで埋め尽くされた人間の模型ではなく、表からは見えない周囲のいたるところ、つまりスマートデバイスの中に隠れており、たとえばGoogle検索の原動力となって、私たちの行動や暮らしをかつてないほど強力に支えています。

Criteoが先ごろ公開した2018年版デジタルコマース&マーケティングの展望レポート(英語)でも紹介している通り、マーケターは今、音声アシスタントを使ったショッピングがもたらすであろう大きなチャンスを手にしています。 たとえば57%のマーケターが、AmazonのAlexaやAppleのSiriのような音声認識デバイスを、今後2年間の内に活用することになるだろうと考えています。

そもそも機械学習とは?

機械学習とは、人工知能技術の1分野で、明確なプログラミングなしにコンピュータが自動学習できるようにする技術のことを指します。

機械学習は、作業の実行に必要な情報や知識のすべてを人間がコンピュータに教えなくても、コンピュータ自らがデータを使って学習・理解することができます。そのため、与えられるデータが多ければ多いほどコンピュータはますます賢くなり、時間とともに作業の精度や能力が向上していきます。

(追加情報: 「テクノロジーレス」の世界で生き残れるか?Criteoのインタラクティブクイズ(英語)で試してみましょう

最近のニューヨークタイムズの記事では、次のように説明しています。

「最先端の人工知能研究には、ディープニューラルネットワーク(DNN)と呼ばれる数学的手法が用いられている。 これはデータを分析することによってコンピュータ自らがタスクを学習する数学アルゴリズムであり、たとえば数百万の犬の写真を解析させることで、ネットワークがそれらを「犬」として認識するようになる。この数学的概念はすでに1950年代に提唱されてはいたものの、5年ほど前までは一部の学者や業界内のみで扱われていた分野であった」

Googleの人工知能研究プロジェクトであるGoogle Brainは、機械学習を使って対象(この場合は猫の画像)の識別に成功した最初のプロジェクトの1つでした。

Googleのデータセンター内に設置されたサーバー(Image by Google)

この研究チームでは、16,000個のCPUコアで構成されたニューラルネットワークを構築して、YouTubeからランダムに抽出した1,000万枚の画像を解析する実験を行いました。その後、コンピュータに20,000個の異なるアイテムを見せたところ、人間が猫の定義を教えなくても、システムは猫の画像すべてを正確に識別するようになったのです。

ここで重要な点は、各データには特にラベルが付けられていたわけではないということです。「猫」というラベルが付いた画像はなく、猫がどのような外見をしているかを説明するプログラムもありませんでした。システムはこうしたプログラミングを必要とせずに、猫の特定に成功したのです。

膨大なデータを解析して、人間には太刀打ちできないスピードと精度で作業をこなすことができる機械学習は、非常に魅力的かつ将来有望な技術であることは間違いありません。 ミリ秒単位での入札/トランザクションを実行したり、あるいは1,000万枚の写真の中から猫の写真を識別したり…、機械学習は、まさに無限の可能性を秘めたテクノロジーなのです。

なぜ、それほどデータが重要なの?

機械学習を成功させるには、システムを「訓練」するための膨大なデータが必要になります。

赤ちゃんが自分の周りの世界を学習するのと同様に、機械学習システムもデータを受け取ることによって学習します。そして、データが多ければ多いほど、より多くを学習していきます。近年では、新たなテクノロジーや膨大なデータセットのおかげで機械学習が格段に進歩し、今やサーバの処理能力はかつてないほどに向上しています。

以下は、Google Brainが猫の識別に利用した情報です。

  • CPUコア:16,000個
  • 人工ニューラルネットワーク内のノード:10億
  • YouTubeからの画像:1,000万枚
  • 学習期間:3日

それでもなお、人間の脳の処理能力には到底及びません。

  • 人間のニューロン:~860億
  • 人間のシナプス:~100兆

ここでマーケティングのパーソナライゼーションを例にとって、データの重要性を見てみましょう。

Criteoは先ごろ、機械と機械の創造性についてIDCと共同でレポートを作成しました。 このレポートでは一般的にパーソナライズが可能な7つの広告クリエイティブ要素(画像、タグライン、名前、フォーマット、カラー、文章、行動の喚起(CTA))について触れています。

また、広告はデスクトップ、モバイル、タブレットなど異なるデバイスをはじめ、数千のパブリッシャーやアドエクスチェンジ、さらには1人ひとり好みが異なる数十億人規模の買物客に合わせて作成される必要があり、これらすべての要素を総合すると、数兆におよぶ広告のバリエーションが考えられます。

こうした途方もない数のパーソナライゼーションを実際に人が行うことは不可能ですが、機械学習ならば、これを実現できます。Criteoが保有する買物客に関するさまざまなデータを機械学習システムが分析して、その分析結果を特定のデバイスおよびパブリッシャーのフォーマット要件/ブランドガイドラインに統合することにより、買物客1人ひとりに最適化された広告を、わずか数ミリ秒で生成することができるのです。

小売業者やブランドが機械学習を活用するメリットは?

機械学習を活用すれば、面倒なデータの準備や分析作業を省くことができるので、マーケターはクリエイティブなアイデアの創出に、より多くの時間をかけられるようになります。これを支えるのが関連性の高いリアルタイムの行動データです。 小売業者やブランドのマーケティングチームは「ベース」となるクリエイティブコンテンツの作成に集中できるようになると同時に、関連性の高いパーソナライズされたコミュニケーションをしっかりと行うことによって、顧客とのエンゲージメントを向上させることができるようになるのです。

機械学習がもたらすメリットについてさらに詳しく知りたい方は、CriteoのEブックをぜひダウンロードしてご利用ください。