5年後の景色

画像認識の精度が最も高いのは? 【答えはGoogle】

AIの進化は止まる所を知りませんが、それは画像認識でも言えます。

これまではウェブサイト上に画像を加えても、検索エンジンにはそこに画像があることはわかっても、どんな画像かまでは認識できませんでした。

しかし今ではIT各社の画像認識の精度が非常に高まっているようです。

そこで今回は、画像認識の精度が向上していることについてお話したいと思います。

画像認識の精度が最も高いのは?

 
アメリカのデジタルコンサルティング会社『Perficient Digital』は、4つの画像認識エンジンにおける画像認識の精度を調査しました。

今回調査対象となったのは、以下の4つの画像認識エンジンです。
 

調査対象

Amazon AWS Rekognition(アマゾン)
Google Vision(グーグル)
IBM Watson(アイビーエム)
Microsoft Azure Computer Vision(マイクロソフト)

また今回の調査では、これらサービスとは別に、人間によってタグ付けを行っています。

つまり人間が画像を認識するのと比べて、AIである画像認識エンジンはどれくらい精度が高いのか?がわかるということです。

今回の調査では4つのカテゴリーから各500枚ずつ、合計2000枚の画像を使って行っています。
 

画像のカテゴリー

図表
風景
人物
モノ

この2000枚の画像を画像認識エンジンおよび人間の手によってタグ付けを行い、その精度を調査しています。

なお画像は2018年11月30日から2019年1月8日まで収集され、タグ付けされました。

イメージとしては以下のような感じです。

まずタグ付けをされた総数は以下のようになっています。

Perficient Digitalより転載

 

タグ付けされた総数

人間・・・1,400
Amazon・・・24,859
Google・・・16,629
IBM・・・19,398
Microsoft・・・16,874

当然ながら人の手によってタグづけされた数が最も少なく、一方でAmazonが最も多くタグ付けしています。

そして調査した画像認識エンジンのタグ精度の結果が以下のグラフです。

Perficient Digitalより転載

赤色・・・正確
灰色・・・不正確
黒色・・・わからない

このグラフを見ると、当然ながら一番左の人間が最も正確な数値を出しています。

画像認識エンジンではGoogleが最も精度が高く、人間の手にタグづけされた数値に近いレベルに迫っているのがわかります。

また2位のAmazon、3位のMicrosoftもGoogleには及ばないものの、画像認識においてはかなり高いレベルを示しています。

画像​​認識エンジンはまだ人間の思考には届かない

次の調査では、画像を最もよく表していると思うタグの上位5つを選択して、それをランク付けするように求めました。

これを再び同じ画像2000枚にわたって調査を行っています。

ここでわかることは以下のことです。

人間の思考に最も一致するのはどの画像認識エンジンなのか?

そしてその調査結果が以下のようになっています。

Perficient Digitalより転載

この調査結果を見ると、一番左側の人間はタグを正確に把握できるために最も高い数値を示しています。

そして人間だけが突出して高い数値を出しているところを見ると、画像認識エンジンはまだ人間の思考レベルまでは届いていないようです。

そんな中でもやはりGoogleが画像認識エンジンの中では最も高い数値を示しています。

今回の調査の結論は以下のようになります。
 

結論

AIには画像を見て人間と同じレベルで認識することはできない。しかし画像認識の精度は日々高まっていて、『その画像が何なのか?』を認識するだけなら近い将来実現できる。

画像認識の精度が上がると生活も変わる

 
画像認識技術が高まることで、私たちの生活にも様々な影響を及ぼす可能性があります。

例えば人間の認識がAIによって正確に行われることで、より精度の高いセキュリティが実現することになります。

ちなみに中国では、コンサートで5万人が集まる群衆の中から容疑者を1人を特定するために顔認識技術が使用されているようです。

よく刑事ドラマなどで、警察が事件の手がかりを見つけるために膨大な写真を照らし合わせるなんてシーンがあります。

そういったことも画像認識によって一瞬で解決することができます。

つまりAIが進化することで、ボクたちのムダな時間がどんどんなくなっていくことになります。

またこれまでブログの記事内に画像を貼っても、検索エンジンにはそれが何かを認識することはできませんでした。

そのためSEO対策としては、より長い文章の記事を書くことが重要視されてきました。

『上位表示されるためには何文字書けば良い?』

こういった質問が度々聞かれるほど、文字数はSEO対策において重要な位置付けとなっています。

しかしGoogleの画像認識精度が高まれば、SEO対策の一つとしてよりわかりやすい画像を加えることも大きな意味を持ってきます。

なぜなら文章よりも画像の方がより伝わることが多いからです。

さらに動画も認識されれば、SEO対策に大きな意味を持ってくる可能性もあります。

上位表示されるためには、記事内に画像を何枚加えれば良い?

近い将来こういったことが言われる時代が来るかもしれません。

まとめ

 
画像認識エンジンの開発は各社進められていますが、現時点ではGoogleが最も高い精度を誇っています。

またGoogleの画像認識精度が高まれば、生活や仕事におけるムダな時間がなくなり、より便利な世の中になります。

さらにGoogleの検索エンジンにもそれが活かされれば、今のSEO対策が大きく変わる可能性もあります。

ただしまだ現時点では人間の思考レベルには追いつけていないため、完全な画像認識技術が生まれるにはもう少し時間がかかるかもしれません。