YOLOについて
をテンプレートにして作成
[
トップ
] [
新規
|
一覧
|
検索
|
最終更新
|
ヘルプ
|
ログイン
]
開始行:
[[小川]]
*YOLO[#xb6a1d9e]
~物体検出アルゴリズムのことで&size(12){You Only Look Once};の頭文字をとっている。
~処理速度が非常に速いのが特徴で、リアルタイムに物体検出を行うことも可能。
~YOLOv5はpytorchをベースに作られている。
**YOLOの仕組み[#he7bf4be]
***①画像をS×S個の小さな正方形に分割する[#he7bf4be]
入力された正方形の画像をさらに小さなS×S個の正方形に分割する
~この小さな正方形を&size(12){グリッド・セル};と呼ぶ
***②-1バウンディングボックスの要素(5つを求める)[#he7bf4be]
-バウンディングボックスとは-[[パウンディングボックス:https://www.ns.kogakuin.ac.jp/~jt13689/?plugin=attach&pcmd=open&file=yolo.jpg&refer=YOLO%E3%81%AB%E3%81%A4%E3%81%84%E3%81%A6]]
~各小さな正方形にB個、配置される長方形だったり四角形だったりするもの
~このバウンディングボックスはあらかじめ設定されている
--一つのバウンディングボックスは5個の特徴を持っている[[バウンディングボックス:https://www.ns.kogakuin.ac.jp/~jt13689/?plugin=attach&pcmd=open&file=yolo2.jpg&refer=YOLO%E3%81%AB%E3%81%A4%E3%81%84%E3%81%A6]]
~x:バウンディングボックスの中心のx座標 y:バウンディングボックスの中心のy座標 w:バウンディングボックスの横幅 h:バウンディングボックスの縦幅 F:信頼度
***②-2一つ一つの小さな正方形が何を映しているかを判断する[#he7bf4be]
各小さな正方形がC種類の中で、どのクラスに所属している可能性が高いかを判断する。
***③②-1と②-2を組み合わせて結果を出す[#he7bf4be]
たくさんのバウンディングボックスから適切なものを得アラブために、NMSという方法を使う
-NMSとは
~余計なバウンディングボックスを消す方法
**YOLO以前の物体検出手法のアルゴリズムのデメリット[#he7bf4be]
従来の物体検出手法の場合、物体を検出する場合は複数の要素に分類してからどのような物体かを判断するという方法が採用されていた。
~→最初に検出すべき物質の範囲を定めるところから始め、検出すべきがどこからが背景に該当するかを個別に判断する必要がある。検出すべき物体の範囲が決まったら、その葉にに含まれる画像の特徴を分析することにより、どのような物体が移っている映像なのかさらに詳細に推測する作業が進められる。最後に、抽出された特徴をもとにして対象となる画像を分類することにより、物体を検出することができるという流れ。こうした方法による物体の検出は複数のプロセスに分けて検出を行う分、時間がかかるというデメリットがある。
**YOLOの特徴[#he7bf4be]
***処理が速い[#he7bf4be]
YOLOは、解析したい画像をコンピュータにインポートするだけで、ニューラルネットワークを使用して画像内に含まれている物体の領域を識別し、出力できる。YOLOによる物体検出の処理時間は、画像1枚あたり約22msで、ほかの物体検出モデルの6~7倍ほどの高速化を実現している。
~物体検出したい画像が入力された場合、YOLOでは画像のリサイズ作業が行われる。YOLOの特徴として、画像は正方形にリサイズする。縦長や横長の画像も、正方形に一度リサイズすることで、ニューラルネットワークを使用した画像解析がしやすくなるメリットがある。正方形にリサイズした画像さらに細かく正方形で分割することも、YOLOのアルゴリズムの特徴。正方形内に分割されたそれぞれの小さな正方形はグリッド・セルと呼ばれ、グリッド・セルの特徴をもとにして検出が進められていく。グリッド・セルの内容から物体の種類が推定され、それぞれの推定がどれくらいの可能性で的中しているかを考慮しながら、さらに細かく画像の解析が行われていく。
***画像全体を見て予測できる[#he7bf4be]
YOLOで画像に移っている物体の葉にを特定するために使用されているのがパウンディング・ボックス。パウンディング・ボックスとは、画像の中に写されている各物体のおおよその範囲を決めるために使用されているボックス型の図形。それぞれのパウンディング・ボックスには画像内の位置を表す座標軸が設定され、さらにそのボックス内に含まれているものが物体である可能性についても数値として計算される。個々のボックス内の画像が物体か背景なのかを判断することにより、物体全体の大きさも推定できる。
***推測技術の正確性が高い[#he7bf4be]
グリッド・セルとバウンディング・ボックスの分析により得られたデータの結果を統合することにより、どのような物体が画像内に写っているかを特定できる。グリッド・セルの分析は個々のセルのクラス・プロばびりてぃを推測していくことにより行われるが、クラス・プロバビリティとはセル内に写っている物体が特定のクラスに属している可能性のこと。この数値が高いほどコンピュータの行ったクラス分けの正確性が高くなる。このクラス・プロバビリティとは前述のバウンディング・ボックスを統合することにより、画像内のどの範囲にどのような物体が写されているのかを大まかに推測することができる。
***YOLOの欠点[#he7bf4be]
分類されたグリッドサイズは固定かつ、グリッド内で識別できるクラスは一つであり、検出できる物体の数は二つという制約を設けているため、グリッド内に大量のオブジェクトが映ってしまうような画像の場合は、物体検出の精度が低くなる。
**参考[#he7bf4be]
-[[YOLOを活用した物体検出レシピ紹介:https://qiita.com/AxrossRecipe_SB/items/d758ac95b2f3d1fbb7e6]]
-[[【YOLO】の仕組みを簡単にまとめてみた【物体検出アルゴリズム】:https://qiita.com/kindamu24005/items/efd53c7511a40ddac636#yolo%E3%82%B7%E3%83%AA%E3%83%BC%E3%82%BA%E3%81%AE%E9%81%95%E3%81%84%E3%82%92%E7%B0%A1%E5%8D%98%E3%81%AB%E3%81%BE%E3%81%A8%E3%82%81%E3%81%A6%E3%81%BF%E3%81%9F]]
終了行:
[[小川]]
*YOLO[#xb6a1d9e]
~物体検出アルゴリズムのことで&size(12){You Only Look Once};の頭文字をとっている。
~処理速度が非常に速いのが特徴で、リアルタイムに物体検出を行うことも可能。
~YOLOv5はpytorchをベースに作られている。
**YOLOの仕組み[#he7bf4be]
***①画像をS×S個の小さな正方形に分割する[#he7bf4be]
入力された正方形の画像をさらに小さなS×S個の正方形に分割する
~この小さな正方形を&size(12){グリッド・セル};と呼ぶ
***②-1バウンディングボックスの要素(5つを求める)[#he7bf4be]
-バウンディングボックスとは-[[パウンディングボックス:https://www.ns.kogakuin.ac.jp/~jt13689/?plugin=attach&pcmd=open&file=yolo.jpg&refer=YOLO%E3%81%AB%E3%81%A4%E3%81%84%E3%81%A6]]
~各小さな正方形にB個、配置される長方形だったり四角形だったりするもの
~このバウンディングボックスはあらかじめ設定されている
--一つのバウンディングボックスは5個の特徴を持っている[[バウンディングボックス:https://www.ns.kogakuin.ac.jp/~jt13689/?plugin=attach&pcmd=open&file=yolo2.jpg&refer=YOLO%E3%81%AB%E3%81%A4%E3%81%84%E3%81%A6]]
~x:バウンディングボックスの中心のx座標 y:バウンディングボックスの中心のy座標 w:バウンディングボックスの横幅 h:バウンディングボックスの縦幅 F:信頼度
***②-2一つ一つの小さな正方形が何を映しているかを判断する[#he7bf4be]
各小さな正方形がC種類の中で、どのクラスに所属している可能性が高いかを判断する。
***③②-1と②-2を組み合わせて結果を出す[#he7bf4be]
たくさんのバウンディングボックスから適切なものを得アラブために、NMSという方法を使う
-NMSとは
~余計なバウンディングボックスを消す方法
**YOLO以前の物体検出手法のアルゴリズムのデメリット[#he7bf4be]
従来の物体検出手法の場合、物体を検出する場合は複数の要素に分類してからどのような物体かを判断するという方法が採用されていた。
~→最初に検出すべき物質の範囲を定めるところから始め、検出すべきがどこからが背景に該当するかを個別に判断する必要がある。検出すべき物体の範囲が決まったら、その葉にに含まれる画像の特徴を分析することにより、どのような物体が移っている映像なのかさらに詳細に推測する作業が進められる。最後に、抽出された特徴をもとにして対象となる画像を分類することにより、物体を検出することができるという流れ。こうした方法による物体の検出は複数のプロセスに分けて検出を行う分、時間がかかるというデメリットがある。
**YOLOの特徴[#he7bf4be]
***処理が速い[#he7bf4be]
YOLOは、解析したい画像をコンピュータにインポートするだけで、ニューラルネットワークを使用して画像内に含まれている物体の領域を識別し、出力できる。YOLOによる物体検出の処理時間は、画像1枚あたり約22msで、ほかの物体検出モデルの6~7倍ほどの高速化を実現している。
~物体検出したい画像が入力された場合、YOLOでは画像のリサイズ作業が行われる。YOLOの特徴として、画像は正方形にリサイズする。縦長や横長の画像も、正方形に一度リサイズすることで、ニューラルネットワークを使用した画像解析がしやすくなるメリットがある。正方形にリサイズした画像さらに細かく正方形で分割することも、YOLOのアルゴリズムの特徴。正方形内に分割されたそれぞれの小さな正方形はグリッド・セルと呼ばれ、グリッド・セルの特徴をもとにして検出が進められていく。グリッド・セルの内容から物体の種類が推定され、それぞれの推定がどれくらいの可能性で的中しているかを考慮しながら、さらに細かく画像の解析が行われていく。
***画像全体を見て予測できる[#he7bf4be]
YOLOで画像に移っている物体の葉にを特定するために使用されているのがパウンディング・ボックス。パウンディング・ボックスとは、画像の中に写されている各物体のおおよその範囲を決めるために使用されているボックス型の図形。それぞれのパウンディング・ボックスには画像内の位置を表す座標軸が設定され、さらにそのボックス内に含まれているものが物体である可能性についても数値として計算される。個々のボックス内の画像が物体か背景なのかを判断することにより、物体全体の大きさも推定できる。
***推測技術の正確性が高い[#he7bf4be]
グリッド・セルとバウンディング・ボックスの分析により得られたデータの結果を統合することにより、どのような物体が画像内に写っているかを特定できる。グリッド・セルの分析は個々のセルのクラス・プロばびりてぃを推測していくことにより行われるが、クラス・プロバビリティとはセル内に写っている物体が特定のクラスに属している可能性のこと。この数値が高いほどコンピュータの行ったクラス分けの正確性が高くなる。このクラス・プロバビリティとは前述のバウンディング・ボックスを統合することにより、画像内のどの範囲にどのような物体が写されているのかを大まかに推測することができる。
***YOLOの欠点[#he7bf4be]
分類されたグリッドサイズは固定かつ、グリッド内で識別できるクラスは一つであり、検出できる物体の数は二つという制約を設けているため、グリッド内に大量のオブジェクトが映ってしまうような画像の場合は、物体検出の精度が低くなる。
**参考[#he7bf4be]
-[[YOLOを活用した物体検出レシピ紹介:https://qiita.com/AxrossRecipe_SB/items/d758ac95b2f3d1fbb7e6]]
-[[【YOLO】の仕組みを簡単にまとめてみた【物体検出アルゴリズム】:https://qiita.com/kindamu24005/items/efd53c7511a40ddac636#yolo%E3%82%B7%E3%83%AA%E3%83%BC%E3%82%BA%E3%81%AE%E9%81%95%E3%81%84%E3%82%92%E7%B0%A1%E5%8D%98%E3%81%AB%E3%81%BE%E3%81%A8%E3%82%81%E3%81%A6%E3%81%BF%E3%81%9F]]
ページ名: