#author("2023-06-20T06:38:21+00:00","default:ubi","ubi") #author("2023-06-20T07:20:34+00:00","default:ubi","ubi") [[小川]] *YOLOv5[#xb6a1d9e] ~物体検出アルゴリズムのことで&size(12){You Only Look Once};の頭文字をとっている。 ~処理速度が非常に速いのが特徴で、リアルタイムに物体検出を行うことも可能。 ~YOLOv5はpytorchをベースに作られている。 **YOLO以前の物体検出手法のアルゴリズムのデメリット[#he7bf4be] 従来の物体検出手法の場合、物体を検出する場合は複数の要素に分類してからどのような物体かを判断するという方法が採用されていた。 ~→最初に検出すべき物質の範囲を定めるところから始め、検出すべきがどこからが背景に該当するかを個別に判断する必要がある。検出すべき物体の範囲が決まったら、その葉にに含まれる画像の特徴を分析することにより、どのような物体が移っている映像なのかさらに詳細に推測する作業が進められる。最後に、抽出された特徴をもとにして対象となる画像を分類することにより、物体を検出することができるという流れ。こうした方法による物体の検出は複数のプロセスに分けて検出を行う分、時間がかかるというデメリットがある。 **YOLOの特徴[#he7bf4be] ***処理が速い[#he7bf4be] YOLOは、解析したい画像をコンピュータにインポートするだけで、ニューラルネットワークを使用して画像内に含まれている物体の領域を識別し、出力できる。YOLOによる物体検出の処理時間は、画像1枚あたり約22msで、ほかの物体検出モデルの6~7倍ほどの高速化を実現している。 ~物体検出したい画像が入力された場合、YOLOでは画像のリサイズ作業が行われる。YOLOの特徴として、画像は正方形にリサイズする。縦長や横長の画像も、正方形に一度リサイズすることで、ニューラルネットワークを使用した画像解析がしやすくなるメリットがある。正方形にリサイズした画像さらに細かく正方形で分割することも、YOLOのアルゴリズムの特徴。正方形内に分割されたそれぞれの小さな正方形はグリッド・セルと呼ばれ、グリッド・セルの特徴をもとにして検出が進められていく。グリッド・セルの内容から物体の種類が推定され、それぞれの推定がどれくらいの可能性で的中しているかを考慮しながら、さらに細かく画像の解析が行われていく。 ***画像全体を見て予測できる[#he7bf4be] YOLOで画像に移っている物体の葉にを特定するために使用されているのがパウンディング・ボックス。パウンディング・ボックスとは、画像の中に写されている各物体のおおよその範囲を決めるために使用されているボックス型の図形。それぞれのパウンディング・ボックスには画像内の位置を表す座標軸が設定され、さらにそのボックス内に含まれているものが物体である可能性についても数値として計算される。個々のボックス内の画像が物体か背景なのかを判断することにより、物体全体の大きさも推定できる。