%3Cbr%3E%3Cbr%3Emicomia株式会社のAIエンジニア 松久保です。今回は画像認識分野で利用されるYOLOについて技術に精通してない方でもわかるように解説しました。%3Cbr%3E%3Cbr%3E%3Cbr%3E%3Cbr%3E1. AIと画像認識の可能性AI技術が急速に進化する現代では、特に画像認識の分野でその応用が広がっています。工場の検品ライン、店舗での顧客分析、自動運転技術など、あらゆる産業で活用が進み続けています。そんな数ある画像認識技術の中でも、「高速」かつ「高精度」であることから世界中の開発者に注目されているのが YOLO です。%3Cbr%3E%3Cbr%3E2. YOLO徹底解説2-1. YOLO読み方と由来YOLOとは、You Look Only Once の頭文字を取ったもので「ヨロ」と読みます。日本語にすると分かるように”一度見ただけ”と意味が込められており、この名前こそがYOLOの最大の特徴を表しています。%3Cbr%3E%3Cbr%3E2-2. ”一度見ただけ”ってどういうこと?YOLOは、画像や動画の中に映っている物体を検出するための物体検出アルゴリズムの一つです。特徴は、「一度の処理で物体の位置と種類を同時に予測できる」点にあります。つまり、YOLOは画像を一度見るだけで、どこに何が写っているかを一気に判断できるのです。この「検出」と「分類」を同時に処理できるからこそ、“You Only Look Once(一度見るだけ)” という名前が付けられました。従来の物体検出では、まず画像の中から「物体がありそうな部分(候補領域)」を探し、その候補を一つずつ切り出して分類する、という二段階処理が一般的でした。この方法は精度は高いものの、処理に時間がかかるという課題がありました。しかしYOLOは、この2つのステップを1回のニューラルネットワーク処理で完結させることで、圧倒的な高速化とリアルタイム性を実現しています。%3Cbr%3E%3Cbr%3E3. YOLO仕組み(アーキテクチャ)3-1.画像をグリッドに分割するまず、入力された画像を S×S のマス目(グリッド) に分けます。たとえば、S=7なら画像は7×7=49個の小さなエリアに分割されます。各マスは「自分の担当範囲の中に物体があるかどうか」を判断します。%3Cbr%3E3-2.各マスに「箱の候補(バウンディングボックス)」を設定それぞれのマスには、あらかじめ B個の箱(バウンディングボックス) が割り当てられます。これは「このあたりに物体があるかも」という候補です。各箱は次の情報を予測します: ・ 物体がある確率(P(object)) … 物体があるほど1に近い値になります。 ・ 物体の位置(x, y) … 箱の中心座標。 ・ 物体の大きさ(w, h) … 幅と高さ。%3Cbr%3E3-3.「物体がある確率」を計算する各バウンディングボックスは、「その中に本当に物体があるか?」を示す確率を出します。これを 信頼度スコア(Confidence Score) と呼びます。 ・ 物体がある → 値が1に近い ・ 何もない → 値が0に近い%3Cbr%3E3-4.物体の種類(クラス)を予測する同時に、YOLOはその物体が どんな種類のものか も予測します。(例:犬、猫、車、人など)このときの予測は「物体があるとわかったとき、それがどのクラスなのか?」という条件付き確率 P(class | object) で表されます。%3Cbr%3E3-5.最終的な予測最終的に、 ・ 「物体がある確率」 P(object) ・ 「その物体が特定のクラスである確率」 P(class | object)を掛け合わせて、P(class) = P(object) × P(class | object)という形で、「画像の中に何の物体が、どこにあるか」を予測します。%3Cbr%3E%3Cbr%3E%3Cbr%3E%3Cbr%3E4. YOLO何ができる? 広がる活用シーンYOLOは、画像の中から特定のものを見つける技術です。この仕組みを使うことで、今まで人の目で行っていたチェック作業を、カメラとAIで自動化できます。実際に使われている分野をいくつか紹介します。%3Cbr%3E%3Cbr%3E4-1.製造業:不良品や異常の検知工場では、製品の検査を人の目で行うと時間もコストもかかります。YOLOを使うと、以下のようなことが自動でできます。製品の 欠けや傷 を見つける部品が 正しく取り付けられているか をチェック規格外のサイズや形 の製品を仕分け目視検査をAIがサポートすることで、検査のスピードと精度を上げることができます。%3Cbr%3E%3Cbr%3E4-2.農業:果物や害虫の認識農業の現場でも、YOLOは活用されています。リンゴやミカンなど、果実の数を 自動で数える葉っぱや実に付いた 害虫や病気を検出果実の 熟れ具合を判定 して収穫のタイミングを判断生産者の負担を減らし、収穫や管理を効率化できます。%3Cbr%3E%3Cbr%3E4-3.建設・安全管理:ヘルメット着用のチェック建設現場では安全管理がとても重要です。YOLOを活用すれば、カメラ映像から次のようなことが可能になります。作業員の人数を 自動でカウントヘルメットを 着用しているかどうか を判定安全管理をリアルタイムで自動化できるため、ヒューマンエラーを減らせます。%3Cbr%3E%3Cbr%3E4-4.小売・物流:商品の在庫や仕分けお店や倉庫でも、YOLOは力を発揮します。棚に並んでいる商品の 種類と数を自動で認識欠品している商品 をすぐに検出梱包・仕分けのときに 商品を識別人手での在庫確認を減らし、作業をスムーズに進められます。%3Cbr%3E%3Cbr%3E4-5.ドローン・監視カメラ:人物や車両の検出広いエリアの監視もYOLOの得意分野です。特定のエリアに 人が侵入したことを検知車や人の動きを リアルタイムで追跡災害現場で 遭難者を探す ことにも活用可能監視や防災の現場で、迅速な対応を支援します。%3Cbr%3E%3Cbr%3Eこのように、YOLOは機械学習と画像認識の技術を駆使して、これまで人の目に頼っていた作業を自動化・効率化する大きな可能性を秘めています。%3Cbr%3E%3Cbr%3E5. 参考文献[1] Redmon, et al. You Only Look Once: Unified, Real-Time Object Detection. In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2016, pp. 779-788.%3Cbr%3E%3Cbr%3E