最新ニュース

バウンディングボックスとは?AIを利用した物体検出|手法やできること、メリット・デメリットについて

2024.1.31
バウンディングボックス

皆さんはバウンディングボックスをご存じですか?バウンディングボックスは私たちの生活をより豊かに、安心安全なものにさせてくれる技術の1つです。どのような技術なのか、知っておきたいところです。

本記事ではバウンディングボックスに着目し、その手法やメリット・デメリットなどをご紹介していきます。

バウンディングボックスとは?

バウンディングボックス

バウンディングボックスとはどういうものなのか、基本的な情報をご紹介していきます。

バウンディングボックスの意味

バウンディングボックスは元々、図形や文字などを囲むように存在している枠線を指します。パソコンやスマホなど文字などをタップもしくはクリックをすると、その部分が反転することがあります。この反転において、長方形の枠ごと反転しています。この枠がバウンディングボックスです。

長方形の枠で囲んで区切っていくのがバウンディングボックスで、対象となるものを囲むのに最も小さい長方形が選ばれます。

バウンディングボックスを使って物体を認識する

バウンディングボックス

バウンディングボックスは物体を認識する際に用いられます。バウンディングボックスを用いることで物体の位置をチェックし、物体の情報を判断していきます。AIを活用することで物体が何なのかがわかるようになっており、自動運転や防犯カメラなど様々な場面で使われているものです。

バウンディングボックスの手法

バウンディングボックス

ここからはバウンディングボックスの手法についてご紹介していきます。

R-CNN

R-CNNは畳み込みニューラルネットワークであるCNNを活用した手法です。画像のデータを入れることでCNNで物体を調べて物体の分類を行っていきます。多くの物体を検出できるため、性能としてはとてもハイレベルです。

Fast R-CNN

Fast R-CNNは、R-CNNをより進化させた手法です。R-CNNの場合、画像認識を1000回ほど行わないといけなかったところ、Fast R-CNNはたった1回で済むなど、画像認識のスピードの高さが特徴的です。

Faster R-CNN

バウンディングボックス

Faster R-CNNはFast R-CNNよりもさらに進化させた手法です。物体を検出するスピードを早めたモデルとなっており、その結果、学習時間を短くし、メモリもできるだけ使わないようになっています。画像データを入れてから物体を検出するまでのプロセスが早いのが特徴的です。

SSD

バウンディングボックス

SSDは1回のCNNでの演算だけで物体を検出して仕分けを行うことができる手法です。その正確性はFaster R-CNNとそん色がないほか、バウンディングボックスが小さくなる物体や解像度があまり高くない画像処理などにもきちんと対応します。

YOLO

YOLOはバウンディングボックスが正方形で、効率よく分析ができるようにしたやり方です。正方形の方が効率よく分析がしやすく、どれだけ縦長な画像であっても正方形にできるため、処理速度もさほど時間がかかりません。YOLOが出るまでは処理速度に時間がかかっていましたが、YOLOの登場でより進化を遂げています。

バウンディングボックスでできること

バウンディングボックスでどのようなことができるのか、バウンディングボックスでできることをまとめました。

自動運転

バウンディングボックスによって多くの期待がなされているのが自動運転です。バウンディングボックスは基本的に物体の検出を行うため、自動運転の際には瞬時に物体の検出を行っていくことになります。

自動運転における物体検出では、障害物のほか、歩行者、標識、車線、そして前にいる車両など瞬時にあらゆるものを見極めていくことが求められます。加えて、子供が急に道路に飛び出すなどの局面においても素早く反応をしなければなりません。

バウンディングボックスによって対象となる物体を素早く囲んだ上で分析を行っていくような形になります。

防犯・監視

バウンディングボックス

不審者を見つける、もしくは犯罪行為をチェックする際にもバウンディングボックスが用いられます。監視カメラの映像で人物を四角い枠で捉えていく姿を見たことがあるかもしれません。まさにあの四角い枠こそがバウンディングボックスなのです。

自動運転ほどではありませんが、迅速に検出してチェックしていくことが求められるほか、24時間365日いつでも監視をし続けるという点でも重要です。最近では防犯カメラに映る人の行動から異常を検知する機能も備わるなど、より安心できる社会のために防犯・監視も進化が続いています。

医療における画像診断

画像診断の中でも注目を集めているのが医療における画像診断です。これまでのレントゲン写真、MRIやCTなどの画像を使って診断を行っていくことができます。ディープラーニングを活用した画像診断が行われるようになったことで、人間では気が付かない変化にも対応できるようになっています。

AIとしては常に学び続けているので、毎日のようにデータを得ていく中でその精度はどんどん高まっていきます。加えて短い時間で診断を行っていくことで、医師の業務を力強くサポートします。

バウンディングボックスのメリット

ここからはバウンディングボックスのメリットについてご紹介していきます。

アノテーションの作業がしやすい

バウンディングボックスのメリットとしてアノテーションの作業のしやすさが挙げられます。そもそもアノテーションとはデータに対して情報を付けていくことを指します。バウンディングボックスでは簡単にアノテーションが行えるため、AIの学習をよりよいものにしていくことができます。

バウンディングボックスは長方形なので2つの頂点が決まるだけでも問題はなく、いくつもの頂点が必要となるポリゴンなどと比べても作業の効率性は高いです。

コストがかからない

バウンディングボックスの場合、他のアノテーションと比べてもコストがさほどかからないのが特徴的です。画像データを多く扱う際には、多ければ多いほどアノテーションが欠かせず、その分、費用がかかります。バウンディングボックスであれば2つの頂点を決めるだけで済むなど、1つの作業に時間をかけなくて済む分、コストを抑えられるのです。

それでいて効率的に行えるわけですから、バウンディングボックスを使ったアノテーションが一般的になっていくのは自然の流れと言えます。

バウンディングボックスのデメリット

バウンディングボックス

メリットがある一方、バウンディングボックスにもデメリットがあるのでご紹介していきます。

全体的な物体検出には使えない

バウンディングボックスは画像の中にある物体を認識するのに用いられるものです。そのため、画像全体の物体を検出することや検出したい物体が複雑なケースだと、バウンディングボックスだけでは対応しきれないのが実情です。

裏を返せば、検出したい物体がはっきりと定まっている時、例えば、猫や犬を検出するような場面では効力を発揮します。全体的な物体検出には向いていないということです。

長方形ゆえに多角形に弱い

バウンディングボックス

先ほどご紹介した、検出したい物体が複雑なケースにおいて、バウンディングボックスだと捉えきれません。長方形の枠を囲んで捉えていくため、多角形であればあるほどはっきりと捉えることが大変なのです。

多少コストがかかってもポリゴンなど細かく捉えられるアノテーションの手法が必要になります。バウンディングボックスを使うと物体によってはその精度が落ちるため、取り扱う物体によっては別のアノテーション手法を選ぶことになるでしょう。

バウンディングボックスを使ったアノテーション作業の代行

画像データとAIを用いるものが増えてきた中で、とても重要なのがアノテーション作業です。このアノテーション作業を疎かにするとデータの質が落ちてしまうため、思ったような結果が得られません。

その一方でコストをかけずに済むため、このアノテーション作業を外注するケースがあります。効率的に行える作業ですが、それでも質の良し悪しは出やすいのが実情です。代行を行う際にはクラウドソーシングで適当に行うよりも、アノテーション作業を代行する業者に委託して質のいいものをある程度コストを切り詰めて行っていくのが理想的です。

バウンディングボックスの後にセグメンテーションと呼ばれる区分けを行う際には、より細かく、精度の高い情報を付与することが必要になります。クラウドソーシングでは時に質に影響を与えるケースがあるため、セグメンテーションを行う際には専門の業者に委託するのが一番確実です。

一方でコストをできるだけかけずに行いたい場合にはクラウドソーシングの活用がおすすめであり、実際のところ、複雑なものでない限りはそこまで質が悪くなることは考えにくいでしょう。バウンディングボックスを使ってアノテーション作業の代行を委託する際には、コスト面以外の部分にも目を向けるのが大切です。

まとめ

バウンディングボックスは画像認識などでは必要不可欠なものであり、もはや私たちの生活になくてはならないものであることは間違いありません。顔認証を始め、色々な場面で用いられているからこそ、「名前は知らないけど見たことはある」という方も多いのではないでしょうか。

今後もバウンディングボックスは私たちの生活をよりよいものにするためのサポートを行っていきます。もちろん技術革新によってバウンディングボックスよりも優れたものも出てくるでしょう。ただこれだけシンプルで、しかもコストがかからない手法ですから、根強く残り続ける可能性が高いです。

これから画像認識などを学びたい方にとってバウンディングボックスはぜひとも覚えておきたいフレーズの1つです。

生成AIパスポートとは?

生成AIパスポートはエンジニア職だけでなく一般の方向けの資格です。

生成AI業界における最前線を走っている有識者たちに監修された資格試験で、最先端の確実な知識や簡易的な活用スキルを身につけることができる認定試験・資格です。

試験を通じて、文章生成をすることができるChatGPTなど、AIを活用したコンテンツ生成の具体的な方法や事例に加え、企業のコンプライアンスに関わる個人情報保護、著作権侵害、商用利用可否といった注意点などを学ぶことができます。

生成AIの活用普及を目的とした、国内最大級の生成AI団体である、一般社団法人生成AI活用普及協会(GUGA)が発行する認定試験です。

詳細はこちら

生成AI
パスポート試験

生成AIパスポート試験のご案内はこちら

View More
入会のご案内

当協会の活動趣旨にご賛同いただける方

View More
お問い合わせ

当協会に関する質問やお問い合わせはこちら

View More