たとえば雑誌やネットのファッション写真を目にして、掲載されている服が欲しくなったとする。しかし値段が高い、もしくは手に入りにくい。そうなった場合、次に思うことはこのような感じだろう。
「これと似たようなスタイルの服をもっと探したい」。
「これと似たようなスタイルの」という定性的かつ抽象的な目的を達成するには、今のところ自分の目と判断に頼るしかない場合が多いだろう。とても時間と手間がかかる作業になりそうだ。そして結局お目当ての商品を見つけられず終わる可能性もある。
そうしたファッション好きの悩みが、AI技術によって解決される日が来るかもしれない。
韓国のインターネットサービス大手SK planetは、ファッションAIシステムを年内にリリースする予定だという。ユーザーが欲しいと思うファッションの参考画像を数枚入力するだけで、同様のスタイルの商品情報を表示してくれるというのだ。SK planetが運営する韓国最大のECサイト「11Street」にて公開する。
同システムの仕組みはこうだ。
人間による「見る」という行為をコンピューターで実現するための技術であるマシンビジョンによって、入力されたファッション画像を識別。そして大量のファッション画像を読み込ませることで訓練したAIシステムによって、適切な商品情報を表示するのだという。
ちなみに同システムによる学習には、ディープラーニング(深層学習)関連の技術であるLong short-term memory(LSTM)というニューラルネットワークアーキテクチャが採用されている。
ファッションデザイナーの知見取り入れる
サービスとして実用化に耐えうる精度を実現するためには、実際のユーザーニーズに即して学習させることが重要になる。服の色や丈の長さといった単純な属性を学習させるだけでは、ファッション好きが求める細かなニュアンスを識別できるようにならない。
そこで同システムでは、学習の元となる写真を、実際のファッションデザイナーたちが考案した属性に沿って分類した。その数は90以上に上るという。
このプロジェクトに携わる開発者のほとんどが、ファッションについては専門外。リーダーのSang-Il Na氏は「こうした分類があること自体知りませんでした」と驚く。
彼らは、約1年をかけてこうした精緻な分類作業を行った上で、「11Street」上にある数百万枚に上るファッション画像をシステムに読み込ませた。
一般的にマシンビジョンによって画像を識別するには、ある程度鮮明で高解像度の画像が必要になる。
そのため例えばプロが撮影したハリウッド女優の写真をもとに、服を検索するような場合であれば問題ないが、前の晩のクラブにてスマホで撮った友人の写真をもとに探そうとすると、精度がとたんに下がってしまう恐れがある。
しかしSang-Il Na氏によると、同システムはこうしたケースにも対応できるという。「(今回読み込ませた)11Streetにアップされているファッション画像のほとんどは、屋外で撮影されたものです。ファッジョン雑誌の写真とは違います」。
典型的なファッション雑誌の画像は、プロのカメラマンがスタジオで撮影した鮮明かつノイズの少ない画像だが、11Streetにある画像は屋外のものが多いため、道路や公園といったあらゆるものが写り込んでいる。こうしたノイズの多い画像を学習させているため、スマートフォンによる比較的画質の荒い画像でも識別できるのだという。

ファッション画像を正確に認識することができれば、近い将来AIによるスタイリングといったクリエイティブなステップも視野に入ってくるかもしれない。