✔︎HPもぜひご覧ください : https://www.hrl.jp/
Abstract
物体検出の新しいアプローチであるYOLOを紹介します。オブジェクト検出に関する以前の作業では, 分類器を再利用して検出を実行します。代わりにオブジェクト検出を, 空間的に分離されたバウンディングボックスと関連するクラス確率への回帰問題としてフレーム化します。単一のニューラルネットワークは, 1回の評価で完全な画像から直接バウンディングボックスとクラス確率を予測します。検出パイプライン全体が単一のネットワークであるため, 検出パフォーマンスに基づいてエンドツーエンドで直接最適化できます。
私たちの統合アーキテクチャは非常に高速です。基本のYOLOモデルは, 毎秒45フレームでリアルタイムに画像を処理します。ネットワークのより小さなバージョンであるFastYOLOは、他のリアルタイム検出器の2倍のMean Average Precision(mAP)を達成しながら, 毎秒155フレームという驚異的なフレームを処理します。最先端の検出システムと比較して, YOLOはより多くのローカリゼーションエラーを発生させますが, 何も存在しない場合に誤検出を予測する可能性ははるかに低くなります。最後にYOLOはオブジェクトの非常に一般的な表現を学習します。 PicassoデータセットとPeople-Artデータセットの両方で, 自然画像からアートワークに一般化する場合, DPMやR-CNNを含む他のすべての検出方法を大幅に上回ります。
✔︎ポイント TBD
✔︎参考文献
✔︎HPもぜひご覧ください : https://www.hrl.jp/
Comments