自動運転の実現へ。「歩行者検知技術」でディープラーニングが威力を発揮!

source:http://jacobsschool.ucsd.edu/

 

目に見えない“アルゴリズム”が、技術を大きく進化させることもあるようだ。

自動運転に不可欠である“歩行者検知”の速度を大幅に短縮できる新しいアルゴリズムを、カリフォルニア大学サンディエゴ校の研究チームが発表した。

このアルゴリズムは、ほぼリアルタイム(秒間2~4フレーム)で、しかも既存のシステムと比べると誤認は約半分という高精度での歩行者の検知が可能になるという。

自動車等の自動運転のほか、ロボット技術や画像、動画検索システムへの応用が期待される。同校のウェブサイトで紹介されている。

 

「カスケード型分類」って?

研究リーダーのNuno Vasconcelos教授らが開発したアルゴリズムは、“カスケード型分類”とよばれる方式と、“ディープラーニング”を組み合わせたものだ。

歩行者検知として典型的なパターンは、画像を小さな“窓”に分解し、それを歩行者の有無によって分類する。しかし、この方法はむずかしい側面もある。というのは、歩行者はカメラからの距離などよって、さまざまな大きさで画像の中に登場するからだ。

そして、1秒間に5~30コマで撮影される動画のなかの無数の“窓”をそうやってすべてチェックしなければいけないからだ。

“カスケード型分類”においては、検知器はすべての工程で作業を行う。たとえば、最初の工程では、人間がいないことが簡単にわかる“窓”を検知して、それを排除する。たとえば画像の中の空の部分などがそれにあたる。

次の工程では、たとえば木など、人間なのかそれ以外なのか、コンピューターにとってはちょっと区別しづらいモノが写っている“窓”を処理する。そして最後の工程で、人間なのかそれによく似た別のモノなのかというむずかしい判別を行う。ただし、最後に残った“窓”の数は少なくなるので、全体的な作業の複雑さは低く抑えられるのだ。

いっぽうで、従来の“カスケード型分類”は、すべてのステージにおいて、比較的シンプルな分類作業を行う、“弱い学習アルゴリズム”(weak lerner)を使用する。

簡単な対象物を処理する最初のステージにおいては少ない数の要素による分類作業を、むずかしい対象物を処理する最後のステージでは、多数の要素を加味した分類作業を行うという具合に使い分けるという。

この方法はスピードは速いのだが、最後のステージにおいては能力が十分ではないという欠点がある。というのは、すべての工程において、同じアルゴリズムが使われるからだそうだ。

source:http://jacobsschool.ucsd.edu/