micomia

Blog

技術記事

YOLO(ヨロ)でできること|物体検出・セグメンテーション・姿勢推定など5つのタスクを解説

YOLO(ヨロ)でできること|物体検出・セグメンテーション・姿勢推定など5つのタスクを解説

micomia株式会社のAIエンジニア、松久保です。

今回はコンピュータービジョンの分野で「YOLOを使うと何ができるのか」を、初心者の方にも分かりやすく解説します。特に、Ultralytics YOLO 11でサポートされているタスクを中心に紹介します。

Ultralytics YOLOは、高速かつ高精度な推論を可能にするオープンソースのAIフレームワークであり、汎用性の高さが大きな特徴です。物体検出、セグメンテーション(領域分割)、分類、姿勢推定、OBB(回転物体検出)といった複数のコンピュータービジョンタスクを一つのフレームワークで扱うことができます。以下では、それぞれのタスクの概要と活用例を紹介します。




1.Detection / 物体検出

物体検出(Object Detection)はYOLOの最もポピュラーなタスクです。画像や動画に写る物体を検出し、その位置をバウンディングボックスと呼ばれる矩形で囲みます。YOLOはリアルタイム推論が可能で、スマートフォンなどのエッジデバイスでも動作できます。

そのため、自動運転、防犯システムから農業や製造業まで幅広い分野で活用されています。


  • 製造業:不良品の検出や欠損部位の特定

  • 農業:果物や害虫の自動カウント

  • 自動運転:歩行者・車両・信号機の検出

  • 監視システム:不審物や侵入者の検出


画像認識


2.Image Segmentation / セグメンテーション

セグメンテーション(Segmentation)は、物体をバウンディングボックスで囲むだけでなく、ピクセルレベルでその領域を特定するタスクです。物体の輪郭に沿って「どの部分がどの物体か」を正確に識別できるため、より高精度な画像解析が可能になります。


この技術は医療や品質管理など、精密な認識が求められる現場で特に活用されています。

  • 医療:腫瘍や臓器領域の抽出

  • 農業:人間の目では気づきにくい欠陥や害虫の検出

  • AR/VR:背景除去や人物の切り抜き

  • ロボットビジョン:正確な形状認識による把持制御


image


3.Classify / 分類

画像分類(Classification)は、画像全体を一つのカテゴリに分類するタスクです。「この画像に写っているのは何か?」を判定します。教師データも作りやすく、YOLOの他タスクと組み合わせて利用することで、より高度なAIシステムを構築できます。


実際に活用例は非常に多く、さまざまなアプリケーションで活用されています。

  • ECサイト:Tシャツ・パーカー・ジャケットなど商品の自動分類

  • 製造現場:正常品と不良品の仕分け

  • 農業:病気葉と健康葉の判定

  • 環境監視:特定種の動植物やごみの分類検出



4.Pose Estimation / 姿勢推定

姿勢推定(Pose Estimation)は、人間や動物の関節位置(キーポイント)を検出し、骨格構造を推定するタスクです。人物や動物の姿勢をリアルタイムで解析し、動きやポーズの情報を抽出できます。


映像・医療・スポーツなど幅広く応用されています。

  • スポーツ解析:フォーム分析やトレーニング評価

  • フィットネスアプリ:姿勢の正確さチェック

  • 介護・医療:転倒検知や動作評価

  • エンタメ・映像制作:モーショントラッキングやアニメーション生成


image


5.(Oriented Object Detection)/ 回転物体検出

回転物体検出(Oriented Object Detection)は、通常の物体検出とは異なり、角度情報を加えた傾きのあるバウンディングボックスで物体を検出する技術です。


斜めから撮影された物体や角度のある構造物を正確に捉えることができ、特にドローンや衛星写真などの俯瞰映像で威力を発揮します。

  • ドローン撮影:建物や車両の方向検出

  • 港湾・海上監視:船舶の角度推定

  • 工場検査:角度付き部品や素材の向き検出

  • 地図解析・測量:建造物や道路形状の分析


image


6.まとめ

Ultralytics YOLOは、物体検出・セグメンテーション・分類・姿勢推定・OBBといった複数のコンピュータービジョンタスクを一元的に扱える強力なフレームワークです。


課題に応じたタスクを適切に組み合わせることで、汎用的かつ高精度な画像認識AIを構築できます。

また、独自データへのアノテーションを行いファインチューニングすることで、用途に特化したAIモデルを作ることも可能です。


image

松久保波希

micomia株式会社所属のAIエンジニアです。 機械学習モデルの設計・開発・評価を担当しており、データ前処理からモデル構築、学習、検証、改善まで一貫して行っています。

関連記事

フォーム営業代行業者の正体|一斉送信ツールの実態と受信側の防御策
AI

フォーム営業代行業者の正体|一斉送信ツールの実態と受信側の防御策

問い合わせフォームに届く営業の多くは「フォーム営業代行業者」が一斉送信したもの。代行業者の仕組み・使うツール・見分け方を解説し、受信側で取れる効果的な防御策(AI自動ブロック含む)まで詳しく紹介します。

reCAPTCHAで問い合わせフォームへの営業メールは止まる?限界とAIブロックとの違いを徹底解説
AI

reCAPTCHAで問い合わせフォームへの営業メールは止まる?限界とAIブロックとの違いを徹底解説

reCAPTCHA v2/v3 や Cloudflare Turnstile などのボット対策で営業メールを止められない理由を解説。bot ではなく人が送ってくる現実、AI判定との違い、両者を併用する効果的な対策まで詳しく紹介します。

月500円でフォーム営業が激減|FormGuard 導入手順と運用フロー
AI

月500円でフォーム営業が激減|FormGuard 導入手順と運用フロー

問い合わせフォームの営業メールをAIで自動ブロックするSaaS「FormGuard」の導入手順を5ステップで解説。月額500円の内訳、ダッシュボードの使い方、カスタムフィルタの活用法まで実務目線でまとめました。

業種別の営業メール傾向と対策|士業・建設・不動産・BtoB企業のケース
AI

業種別の営業メール傾向と対策|士業・建設・不動産・BtoB企業のケース

士業・建設・不動産・BtoB企業など業種別に届く営業メールの傾向と対策を解説。各業種で多い営業文面のパターン、自社に合うカスタムフィルタの作り方、AI自動ブロックの活用法までまとめました。

問い合わせフォームのスパム対策完全ガイド|技術・運用・AI判定の組み合わせ
AI

問い合わせフォームのスパム対策完全ガイド|技術・運用・AI判定の組み合わせ

問い合わせフォームに届くスパム・営業メール対策を技術編・運用編・AI判定編に分けて完全網羅。reCAPTCHA・ハニーポット・WAF・NGワード・人手仕分け・FormGuard など各手法の効果と組み合わせ方を解説します。

AI用語辞典まとめ|機械学習・LLM・生成AI関連の専門用語をわかりやすく解説
AI

AI用語辞典まとめ|機械学習・LLM・生成AI関連の専門用語をわかりやすく解説

AI開発・機械学習・生成AIの専門用語をまとめて解説するハブページ。ゼロショット学習・ファインチューニング・転移学習・LLM・教師あり/なし学習・YOLOなど、わかりやすい解説記事へのリンク集。

ホームページに「営業お断り」を記載する効果と限界|問い合わせフォーム対策の決定版
AI

ホームページに「営業お断り」を記載する効果と限界|問い合わせフォーム対策の決定版

ホームページに「営業メールお断り」の文言を記載する効果と、それだけでは防ぎきれない問い合わせフォームの営業メール対策を解説。AI自動ブロックによる根本的な解決策FormGuardも紹介します。

営業メールの断り方と返信例文|新規・飛び込み・しつこいケース別の対処法
AI

営業メールの断り方と返信例文|新規・飛び込み・しつこいケース別の対処法

営業メールの断り方を、新規営業・飛び込み営業・しつこい営業のケース別に解説。AIブロックで受信できないようにする方法から返信すべきか無視すべきかの判断、角を立てない返信例文、対応時間を削減する方法までまとめました。

営業メールは無視してもいい?返信しない判断基準と正しい対応法
AI

営業メールは無視してもいい?返信しない判断基準と正しい対応法

営業メールを無視しても問題ないかの判断基準、返信しないケースの注意点、しつこい営業への対応、そもそも営業メールを減らすAI自動ブロックまで解説。担当者の心理的負担を減らす実用的なガイドです。

神戸でASO対策ならmicomia|App Store最適化でダウンロード数を増やす方法
開発Tips

神戸でASO対策ならmicomia|App Store最適化でダウンロード数を増やす方法

神戸でASO対策(App Store最適化)をお考えの方向けに、ASOの基本施策・効果測定方法・micomiaの支援内容をまとめて解説。アプリのダウンロード数を増やす実践的な手法を、神戸拠点の開発会社が紹介します。

サーバーサイドレンダリング(SSR)とは?
開発Tips

サーバーサイドレンダリング(SSR)とは?

サーバーサイドレンダリング(SSR)とは、Webページの描画をサーバー側で行い完成したHTMLを返す手法です。CSRとの違いやSEO効果、Next.jsなどのフレームワーク、ビジネス活用を初心者にもわかりやすく解説します。

関西のアプリ開発会社おすすめの選び方|大阪・神戸・京都で依頼する際のポイント
開発Tips

関西のアプリ開発会社おすすめの選び方|大阪・神戸・京都で依頼する際のポイント

関西エリア(大阪・神戸・京都)でアプリ開発会社を探している方向けに、選び方のポイントと地域特性をまとめました。神戸・兵庫拠点で開発を行うmicomiaの強みも紹介。地元企業との対面打ち合わせを重視したい方に。

事業計画書・補助金申請用のアプリ/システム開発見積もり|企画段階でも無料でお打ち合わせ
開発Tips

事業計画書・補助金申請用のアプリ/システム開発見積もり|企画段階でも無料でお打ち合わせ

事業計画書や補助金申請のためにアプリ・システム開発の見積もりが必要な方向けに、企画段階での見積もり対応や無料のお打ち合わせについて解説。IT導入補助金・ものづくり補助金の申請に間に合うスピード対応もご紹介します。

ノーコードで作るべきもの・フルスクラッチで作るべきものとは?判断基準と使い分けを解説
開発Tips

ノーコードで作るべきもの・フルスクラッチで作るべきものとは?判断基準と使い分けを解説

ノーコードとフルスクラッチの使い分けを解説。MVP・社内ツールはノーコード、高度な処理や大規模システムはフルスクラッチなど、5つの判断基準を紹介します。

A/Bテストとは?やり方・分析方法・アプリ改善への活用をわかりやすく解説
開発Tips

A/Bテストとは?やり方・分析方法・アプリ改善への活用をわかりやすく解説

A/Bテストとは、複数パターンを比較してデータに基づき効果的な方を選ぶ検証手法です。進め方やビジネス活用をわかりやすく解説します。

プッシュ通知の仕組みとは?種類・導入方法・効果的な活用をわかりやすく解説
開発Tips

プッシュ通知の仕組みとは?種類・導入方法・効果的な活用をわかりやすく解説

プッシュ通知とは、サーバーからユーザー端末に自動でメッセージを送る仕組みです。配信の流れやビジネス活用をわかりやすく解説します。

FlutterFlowでできること・できないことを徹底解説|開発経験から見た本音
FlutterFlow

FlutterFlowでできること・できないことを徹底解説|開発経験から見た本音

FlutterFlowでできること・できないことを開発経験から徹底解説。UI構築・Firebase連携・API統合などの強みと、SEO対策・定期実行処理・動画広告など苦手な領域を具体的に紹介します。

Firebaseとは?機能一覧・料金・アプリ開発での活用方法をわかりやすく解説
開発Tips

Firebaseとは?機能一覧・料金・アプリ開発での活用方法をわかりやすく解説

Firebaseとは、Googleが提供するモバイル・Webアプリケーション開発プラットフォームです。データベース、認証、ストレージ、プッシュ通知など、アプリ開発に必要なバックエンド機能をまとめて提供しており、サーバーの構築・管理なしにアプリを開発できます。

マイクロサービスとは?仕組み・メリット・モノリスとの違いをわかりやすく解説
開発Tips

マイクロサービスとは?仕組み・メリット・モノリスとの違いをわかりやすく解説

マイクロサービスとは、アプリケーションを小さな独立したサービスに分割して開発する設計手法です。仕組みやビジネス活用をわかりやすく解説します。

クロスプラットフォーム開発の選び方|主要フレームワーク比較と判断基準をわかりやすく解説
開発Tips

クロスプラットフォーム開発の選び方|主要フレームワーク比較と判断基準をわかりやすく解説

クロスプラットフォーム開発の主要フレームワーク(Flutter、React Native、FlutterFlow)を比較し、プロジェクトに最適な選び方を5つの判断基準で解説します。

YOLO(ヨロ)でできること|物体検出・セグメンテーション・姿勢推定など5つのタスクを解説 | micomia技術記事