本サイトは広告により収益を得ています

第2章:コンピュータビジョン(画像認識)の発展

第2章:コンピュータビジョン(画像認識)の発展

2025年12月29日
フリー検定
広告

目次

現在: 2 / 5

AIエンジニアに関する検定はこちら

面倒な会員登録も不要!すぐに受験!

無料で受験する

現代の自動運転や医療画像診断、顔認証システムの基盤となっている技術について学びます。

1. 物体検出(Object Detection)

画像の中から対象物の「位置(バウンディングボックス)」と「種類(クラス)」を同時に特定する技術です。

  • YOLO (You Only Look Once): 「一度見るだけ」という名前の通り、画像全体を一度の計算でスキャンするアルゴリズムです。非常に高速で、防犯カメラや自動運転などのリアルタイム処理に適しています。

  • SSD (Single Shot MultiBox Detector): YOLOと同様に高速でありながら、異なるサイズの物体(大きい車と遠くの歩行者など)を精度よく検出できる構造を持っています。

  • Faster R-CNN: 「候補領域の提案」と「分類」の2段階で行う手法です。YOLO等に比べ速度は劣りますが、検出精度が非常に高いのが特徴です。

2. セマンティックセグメンテーション

画像内の全ピクセルに対して「これは道路」「これは車」「これは空」といったラベルを割り当てる、最も精密な画像認識手法です。

  • U-Net: アルファベットの「U」のような形をしたネットワーク構造です。医療画像の細胞検出など、境界線を正確に捉える必要がある分野で広く使われています。

  • Mask R-CNN: 物体検出(どこにあるか)に加え、その物体の形状をピクセル単位で切り抜く「インスタンスセグメンテーション」を可能にしたモデルです。

3. 転移学習とファインチューニング

ゼロから巨大なモデルを学習させるには膨大なデータと計算資源(GPU)が必要です。実務では「学習済みモデル」を再利用するのが一般的です。

  • 転移学習(Transfer Learning): 大規模データ(ImageNetなど)で学習済みのモデル(ResNet, EfficientNet等)の重みを固定し、出力層だけを自分の課題に合わせて作り直す手法です。少量のデータでも高精度が得られます。

  • ファインチューニング: 出力層だけでなく、学習済みモデルの一部の重みも微調整(再学習)する手法です。転移学習よりもさらに高い精度を狙えます。

AIエンジニアに関する検定はこちら

面倒な会員登録も不要!すぐに受験!

無料で受験する
広告

検定一覧はこちらから

様々なジャンルの検定から選んで、あなたの知識を試してみましょう。

検定一覧を見る

関連記事

広告