top of page
  • 執筆者の写真HiSR

You Only Look Once: Unified, Real-Time Object Detection

更新日:2022年6月24日

✔︎HPもぜひご覧ください : https://www.hrl.jp/


Abstract

 物体検出の新しいアプローチであるYOLOを紹介します。オブジェクト検出に関する以前の作業では, 分類器を再利用して検出を実行します。代わりにオブジェクト検出を, 空間的に分離されたバウンディングボックスと関連するクラス確率への回帰問題としてフレーム化します。単一のニューラルネットワークは, 1回の評価で完全な画像から直接バウンディングボックスとクラス確率を予測します。検出パイプライン全体が単一のネットワークであるため, 検出パフォーマンスに基づいてエンドツーエンドで直接最適化できます。

 私たちの統合アーキテクチャは非常に高速です。基本のYOLOモデルは, 毎秒45フレームでリアルタイムに画像を処理します。ネットワークのより小さなバージョンであるFastYOLOは、他のリアルタイム検出器の2倍のMean Average Precision(mAP)を達成しながら, 毎秒155フレームという驚異的なフレームを処理します。最先端の検出システムと比較して, YOLOはより多くのローカリゼーションエラーを発生させますが, 何も存在しない場合に誤検出を予測する可能性ははるかに低くなります。最後にYOLOはオブジェクトの非常に一般的な表現を学習します。 PicassoデータセットとPeople-Artデータセットの両方で, 自然画像からアートワークに一般化する場合, DPMやR-CNNを含む他のすべての検出方法を大幅に上回ります。



✔︎ポイント TBD



✔︎参考文献



✔︎HPもぜひご覧ください : https://www.hrl.jp/

閲覧数:63回0件のコメント

最新記事

すべて表示

ChatGPTを用いた音響解析

「opensmileを使ってfeature importanceを計算して」 以下の通り、概ね妥当なコードを生成していると考えられます。 #開始 OpenSMILEは、オーディオ特徴抽出ライブラリであり、音声データからさまざまな特徴を抽出することができます。特徴重要度(Feature Importance)を計算するためには、通常、機械学習モデルを使用することになります。 具体的には、以下の手順で

bottom of page