画像の知識

ディープラーニングにおける解像度の考え方

「検出力を向上するために高解像度のカメラを使いたい」というお声をよくいただきます。ルールベースの画像処理の場合高解像度の画像を使用すると分解能が良くなり検出力が向上する傾向にありますが、ディープラーニングではその限りではない場合があります。ディープラーニングにおける解像度に対する考え方について、大雑把ではありますが下記に簡単に解説致します。

上の①~③のような画像があるとします。

①全体の面積10×10、灰色の四角形の面積4
②全体の面積20×20、灰色の四角形の面積16
③全体の面積10×10、灰色の四角形の面積16


②の灰色の四角形の面積は①に比べて4倍大きいですが、全体の面積に対する灰色の四角形の比率で見れば①:4/100、②:16/400であり、どちらも4%分しかありません。
ディープラーニングにおいて、「灰色の四角形の検出しやすさ」という意味では、①と②はほとんど同じです。


③は全体の面積は①と同じ10×10ですが、灰色の四角形は①よりも4倍大きいです。
比率で見ると16/100で16%になります。ディープラーニングでは単純に全体に対して対象物が大きく捉えられている方が検出がしやすく、この場合③の四角形は、①の四角形よりも検出しやすいと言えます。

ディープラーニングでは、1枚の大きな画像の中から小さい対象物を見つけるというのが、性質上難しいです。
広い範囲から小さい対象物見つけたい場合は、対象物を正確に認識可能な大きさまで拡大して撮像するか、分解能の高い大きな1枚の画像を撮って、後から対象物を検出可能なサイズまで画像を分割して処理する方法が一般的です。

関連記事

TOP