リクルートによるAI活用のリアル、華やかさの裏に潜む試行錯誤

リクルートが人工知能(AI)関連の技術に力を入れています。

2015年には、リクルートホールディングスとして人工知能研究所を設立。米カーネギーメロン大学のトム・ミッチェル教授をはじめ、AI分野の世界的権威を招いて技術開発に乗り出しています。

さらにこのたびホールディングス傘下のグループ会社からもAI関連の取り組みが出てきました。

それが機械学習技術を活用した各種サービスのAPI群「A3RT」(アート)。リクルートテクノロジーズが3月にリリースしたソリューションです。

2

リクルートテクノロジーズは、数年前からAI関連のソリューションを開発し、グループ会社向けに展開。業務の効率化や付加価値の増大などに取り組んできました。

たとえば機械学習によって文章の誤字脱字を自動で検出できる機能や、画像検索機能などが一例です。

こうした機能を外部の企業や個人も使えるよう、リクルートテクノロジーズがAPIとして無料で一般公開したのがA3RT。

これによってAI関連のサービスを開発できるリソースがなくても、より手軽に各種のAIサービスを利用できるようになるというもの。現状公開されているAPIはこちらの6種類になります。

Proofreading API
文章の誤字脱字を検知するAPI。

Talk API
チャットボットを作成するためのAPI。

Listing API
リスト作成のためのAPI。Webサイトでのレコメンド機能やターゲティングメールなどに使える。

Image Influence API
ある画像がどれだけユーザーに受け入れられるか、点数で表してくれるAPI。

Text Classification API
文章をカテゴリごとなどによって自動で分類できるAPI

Text Suggest API
ユーザーが入力した単語や文章に対して、次に続く適切な文章を表示してくれるAPI。

GoogleやMicrosoft、IBM、AmazonなどのITジャイアントが相次いで自社によるAI技術をAPIという形で一般公開する中、リクルートも同じ流れに乗り出した形です。

そもそもリクルートはなぜAI技術に力を入れているのか?どのような経緯でA3RTの開発や一般公開に至ったのか?

今回、丸の内にあるリクルートテクノロジーズさんのオフィスにお邪魔して、こういった点についてお話を伺ってきました!

リクルート社内に眠る膨大なデータを活かせ、AI活用の原点

1

AIを含む新技術をいち早く取り入れ、リクルート全体に展開する役割を持つリクルートテクノロジーズ。今回話を聞いたのは、同社の石川信行氏(左)と白井祐典氏(共にITソリューション統括部ビッグデータ部)のお二人です。

石川氏はA3RTを発案して開発を主導。白井氏はA3RTの各種APIの中でも、画像解析関連の開発を手がけた人物です。

そもそもリクルートが人工知能、つまり機械学習を中心とするAI技術に注力するきっかけから聞いてみました。

「事の発端はデータ解析です。リクルートの各事業会社に眠るデータを使って、ビジネスに貢献しようという動きが5、6年前から始まっていたんです」(石川氏)。

従来のリクルートによる主な分析対象は、Web上での行動ログといった数値データが中心だったといいます。いわゆる構造データと呼ばれる類です。

しかし非構造データと呼ばれるテキストや画像、動画、音声などは、従来の技術では扱いが難しく、十分に活かすことができていませんでした。

美容や旅行、就職、住まいなどあらゆる領域でビジネスを展開するリクルートには、原稿や商品・店舗の画像、社員による営業日報など、膨大な非構造データが溜まっています。これらを整理・分析して何らかのビジネス価値を引き出すことが、長らく課題だったといいます。

「まずは画像の解析から始めよう、うまく解析できれば何か用途もあるはずだと考えました」(石川氏)。

こうして非構造データを活かしてビジネス貢献につなげるための取り組みが、石川氏主導によるボトムアップで始まりました。

まだいわゆる「AI」と呼ばれる機械学習技術が、今のように一般的になる前の話です。

難航する解析作業、効果的な手法もなく

当初の解析作業は難航したといいます。「ディープラーニングすら使っていませんでした。商用利用に堪えられるような、利用が多いフレームワークがなかったんです」(白井氏)。

石川氏「最初はスパースコーディングという特徴量抽出の手法を使って画像を判別しようとしましたが、精度はすごく低かったです。45%くらい。これじゃ人が見たほうが早いよねとなってしまいました(笑)」。

画像に映る物体を判別するためには、物体の特徴をうまく抽出することが必要。当初精度が上がらなかった主な要因は、その手法にあったといいます。

「SIFT特徴量などを用いた従来の手法では、何を特徴として抽出するか人が設定する必要がありました。たとえば『ヒゲがあって耳がここにあって輪郭はこうだったら猫です』みたいな。人が決めた特徴なのでバイアスがかかりやすく精度が上がりませんでした」(石川氏)。

ただ取り組みを始めて半年ほどたったころ、より優れた特徴量抽出の手法であるディープラーニングを一般に使える環境が整ってきます。

ディープラーニングを実装するためのフレームワーク「Caffe」が2014年に登場したのです。さらに実際にディープラーニングを動かすためのより安価な基盤が、クラウドなどで手に入るようになってきたことも活用を後押ししたといいます。

「ディープラーニングだと、画像に映る物体を一番よく表す特徴を勝手に抽出してくれます。人が介在しないので、飛躍的に精度が上がったんです。いよいよ実用で使えそうだと思いました」と石川氏は言います。

ディープラーニングの課題、学習データの用意が手間

とはいえディープラーニングを使った画像解析にも、難しい点が多々あります。まず直面した課題の一つが、AI施策につきまとう学習データの用意です。

ディープラーニングが「勝手に特徴量を抽出してくれる」といっても、そうなるためには、まず元となるデータを人がニューラルネットワークに入れ学習させる必要があります。

画像解析施策の第1号として選ばれた、ホットペッパービューティーでもそれは同じでした。

白井氏らは、ユーザーがネイル画像を閲覧すると、デザインや色が似ている他のネイル画像を表示してくれる機能を開発しようとしていました。

類似ネイル画像検索機能。類似のネイルが「関連デザイン」として表示されている
類似ネイル画像検索機能。類似のネイルが「関連デザイン」として表示されている

そのためにはユーザーが入力したネイル画像を認識できる判別モデルを開発する必要があり、それに向けたネイルの学習データが不可欠です。

同メディアを運営するリクルートライフスタイルには、当然ながらネイル画像が数多くありました。しかしそれらがデザインごとに適切に分類されていなかったため、そのまま学習データとして活用するとネイルの判別精度が非常に低くなってしまったといいます(18%程度)。

そこで学習データとして適した分類に整理し直すことになりました。約20人のメンバーで、約4万枚ものネイル画像を分類していったといいます。ネイルに詳しくない男性メンバーばかりでしたが、作業が終わるころには「ピーコック」と「マーブル」と「プッチ」の違いを即座に判別できてしまうエンジニア男性が誕生することに。

「ディープラーニングといっても、基本的に人が判別できる精度より高くなることはありません。人が用意した学習データが元になるので。より高い精度を求めるのであれば、データをきれいに整備しないといけないんです」(石川氏)。

実装した結果、成果はどうだったのでしょうか?

「類似のネイル画像を表示することによって、ユーザーの回遊率が上がりました。ただそれよりも画像データをビジネス価値につなげられるんだという認識を、リクルート内で広められたというのが大きいですね」(石川氏)。

AIへの過剰な期待、コミュニケーションで解消

リクルートグループ内でのAI施策導入を推進してきた石川氏と白井氏。技術的な部分以外で難しかった点を尋ねると、白井氏がこう答えました。

「一番難しいのは期待値の調整ですね。AIへの期待が高いがゆえに、事業からは高い精度を求められる。理想と現実はズレてくるので課題も多いです。ただ基本的なスタンスとしては、事業の『こうやりたい』に対して、全力で考えて実現するということですね」。

類似ネイル検索機能を開発した時は、週1回のペースで事業担当者との進捗確認会を実施。課題や現実的な実装範囲を共有しながら、ステップバイステップで進めたといいます。

白井氏「今でこそ少しノウハウが溜まってきたので、機械学習によってどれくらいの判別精度が見込めるか、ということが以前よりは事前に予測できるようになってきました。ただ当初は全然読めなかった。ということは事業担当者と一緒に試行錯誤していくしかない。毎週毎週ありのままの結果を共有しながら進めました」。

石川氏「今は『AI』という言葉がかなり一人歩きして魔法の技術のように言われているので、僕らはそこを否定していくというか、現実に引き戻す役割を担っていると思っています」。

A3RTとして結実したAI施策、一般公開の狙いとは?

こうしてホットペッパービューティー以外の各種サービスでも、様々なAI機能が実装されていきました。

中古車情報サービス「カーセンサー」では、ユーザーが撮影した自動車画像から車種を判定する機能、婚活支援サービス「ゼクシィ縁結び」ではチャットボットによる顧客サポート機能、といった具合です。

石川氏らが社外での講演でこれらのサービスを紹介したところ、外部のエンジニアから「ぜひ使ってみたい」という要望が出てきたことが、API公開のきっかけだったといいます。

APIとして公開した狙いについて、石川氏は次のように話します。

「それぞれのAI機能について、使い方の提案・相談などのフィードバックを得たいと思っています。それを受けて新しいAPIを作って展開することもあるかもしれない。A3RTというプロダクト自体をより進化させていきたいという思いがあります」。

またより多くのユーザーが使えば使うほど、学習データがたまるため精度の向上も期待できるといいます。

ユーザーからのフィードバックはどのように得ているのでしょうか?

「Twitterはずっと見ています。あと問い合わせ画面経由や、講演の後に直接フィードバックをいただくこともありますね」(石川氏)。

3月の公開以来、APIの利用数は順調に伸びているとのこと。現状のユーザー層としては、法人よりも個人が比較的多いそうです。「コール数の多いAPIは日によって異なりますが、(チャットボットを作成できる)Talk APIの利用数が総じて多いですね」(石川氏)。

今後の方針、3つのポイント

A3RTに含まれるAPIのラインナップは、今後も増えるといいます。ラインナップを決めるにあたって、基準のようなものはあるのでしょうか?

「リクルートの業務でよく使用されたことで洗練され始めた機能は出したいです。それといち早くユーザーのフィードバックを得たい、新しい技術も優先的に公開していきます。また3つ目の基準として、GoogleやAmazon、Microsoftさんなどが出しているAPIと差別化できるということも重要です。彼らと同じことをやって争う理由はないので。より多くのフィードバックを得るためにも、そこはむしろ避けたいです」(石川氏)。

そのためにはこんな方向性を想定しているそうです。

「汎用性を失わせて専門領域に特化したAPIにしたい。たとえば自動車の分類に特化したAPIといった具合です。また他のAPI群は基本的に課金モデルですが、A3RTは無課金というのもポイントですね」(石川氏)。

A3RTの一般公開によって、特別なリソースがなくても、誰もがAI機能をより手軽に使えるようになりました。いわゆる「AIの民主化」につながる動きであり、今後の動向が楽しみです。