画像認識技術について (1)

こんにちは、ONETECH河本です。今回は画像認識技術について5回に分けて書いていきます。

きっかけは、現在、ホロレンズを使って画像認識をするソフトウェアを開発しています。

mr-ホロレンズ-開発

きっかけは、現在、ホロレンズを使って画像認識をするソフトウェアを開発しています。

また、少し分野が外れるのですが、現在RPA(Robotic Process Automation、ロボティック・プロセス・オートメーション)もクライアントに導入しようとしているのです、業務をオートメーション化する過程でぶつかるのが、紙のドキュメントのデータ化です。こちらはOCR(Optical Character Recognition、光学式文字認識)ですが、

Pepperには人との生活ができるよう、最先端の技術が詰め込まれています。

Pepperには人との生活ができるよう、最先端の技術が詰め込まれています。

どちらも文字や物体をパターン処理や様々なライブラリを使ってベトナムの技術者がオフショアで研究開発してくれているので営業サイドとしても最低限の知識を整理しようと考えました。

 

  1. 画像認識とは
  2. AI 、機械学習、ディープラーニング
  3. 画像認識のフレームワーク
  4. 弊社の応用実績
  5. OCRとの違い

 

  1. 画像認識とは

画像認識 (Image Recognition)とは、画像および動画から文字や顔などのオブジェクトや特徴を認識し検出するパターン認識技術の一分野です。 … このため、コンピュータービジョンなどの関連技術では、画像認識は重要な研究対象になっています。

画像認識とは、画像や動画から特徴をつかみ、対象物を識別するパターン認識技術の1つです。

私たち人間は、目で捉えたものや写真などの画像に写っているものが何であるか、これまでの経験から「理解」して判別しています。それに対して、私の理解では、コンピューターがその対象物が何であるのか「理解」するロジックは以下のようです。

コンピューターはピクセル単位でその情報を捉えます。ピクセルには色や明るさの情報が付加されています。そのピクセルの集合体を一定の領域で切り出します。

その領域からノイズを排除したり、輪郭などを際立たせる画像処理を行います。

AI 、機械学習、ディープラーニング

AI 、機械学習、ディープラーニング

その後、共通パターンを割り出し、確率でその対象物がなんであるかを弾き出すそうです。例えば人間の顔は、目が二つで口が一つであるということで判別していくそうです。

また、上記の一連のフローで画像認識分野の革新的に進化させたのが、AI(人工知能)分野におけるディープラーニング(Deep Learning、深層学習)技術です。

ディープラーニングについては次回

VR/AR/MR

画像認識技術に関するお問い合わせはこちら

https://onetech.jp/service/vr