Zynq US+ FPGAを使用したディープラーニング

ディープラーニングアルゴリズムは、オブジェクトの認識と分類におけるヒューマンレベルの精度のため、エッジのIoTアプリケーションでより一般的になりつつあります。いくつかのユースケースが含まれていますが、防犯カメラでの顔の検出と認識、ビデオ分類、音声認識、リアルタイムマルチオブジェクト追跡、文字認識、ジェスチャー認識、財務予測、医療診断システムに限定されません。ディープラーニングアルゴリズムは、機械学習のサブセットとして、人間の脳のニューラルネットワークに触発されています。機械学習で生物学的ニューラルネットワークの概念を展開すると、これまで不可能だった学習問題を解決する上で強力な効果が実証されています。特に、コンボリューショナルニューラルネットワーク（CNN）は、コンピュータビジョンアプリケーション向けの機敏で信頼性の高い画像検出と認識を示しています。このようなネットワークのディープレイヤは、ディープラーニングのモデルを作成するために使用されるニューラルネットワークを作成します。

FPGAを使用したディープラーニングアプリケーションの開発は困難に思えるかもしれません。アルデックでは、CNNを使用してすぐに使用できるFPGAベースのオブジェクト検出ソリューションを顧客に提供し、プロジェクトを迅速に開始できるようにすることで道を切り開きました。これらのアプリケーションでは、ディープラーニングプロセッシングユニット（DPU）がFPGA側に実装されており、3チャネル入力で45fpsのアクセラレーションを実現しています。実際、FPGAが大きいほど、追加できるDPUユニットの数が多くなり、パフォーマンスが向上します。TySOM-3A-ZU19EG 組込みプロトタイピングボードには1,143Kのロジックセルがあり、多くのチャネル処理アプリケーションに不可欠な複数（1～3）のDPUを実装できます。下記画像は、デモの構造と出力画面の結果を示しています。

TySOM-3A-ZU19EG 組込みプロトタイピングボード

このリファレンスデザインの入力として、ライブビデオカメラまたは事前に記録されたビデオを使用することができます。外部カメラを接続するために、アルデックはHSDコネクタ付き5x FPD-Linkを備えたFMC-ADASカードを提供しています。複数のカメラ入力を持つアルデックのADAS アプリケーションの拡張として使用できます。事前に記録されたビデオは、マイクロSDカード、SATAを使用するか、またはクラウドからボードに提供することができます。

オブジェクト検出アプリケーションに加えて、アルデックは顔検出、ジェスチャー検出、歩行者検出、セグメンテーション用のSDxプラットフォームを提供しています。これらのデモデザインは、Zynqベースのプロトタイプボードのリファレンスデザインとして提供されます。これらのデザインは、USBカメラ、FPD IIIリンクを使用してブルーイーグルカメラに接続するFMC-ADASカード、SDカードに保存されている事前に記録されたビデオなどのさまざまな入力を使用してテスト出来ます。パフォーマンス解析については、次の表を参照してください。

APPLICATION NAME	INPUT	PERFORMANCE
	INPUT	TySOM-3A	TySOM-3
	FMC-ADAS	Up to 30 FPS	Up to 30 FPS
Gesture Detection	Video	Up to 18 FPS	Up to 17 FPS
Gesture Detection	FMC-ADAS	Up to 30 FPS	Up to 30 FPS
Pedestrian Detection	Video	Up to 25 FPS	Up to 25 FPS
Pedestrian Detection	FMC-ADAS	Up to 30 FPS	Up to 30 FPS
Segmentation	Video	Up to 24 FPS	Up to 24 FPS
Segmentation	FMC-ADAS	Up to 10 FPS	Up to 10 FPS
Traffic Detection	Video	Up to 36 FPS	Up to 35 FPS
Traffic Detection	FMC-ADAS	Up to 30 FPS	Up to 30 FPS

表1. TySOM-3AおよびTySOM-3のDNNベースの設計パフォーマンス分析

主な特徴

TySOM-3A-ZU19EGまたはTySOM-3-ZU7EVのいずれかを含む
リファレンスデザインとDNNデザインの作成方法に関する説明が含まれています
ADASベースのソリューションには、FMC-ADAS カードと192度のワイドレンズを備えたブルーイーグルカメラが含まれます
各ビデオチャンネルで最大40fpsのパフォーマンス
SDカードにプリロードされた事前作成済みですぐに使用できるファイル

Solution Contents

DNNを使用した顔検出、ジェスチャ検出、歩行者検出、セグメンテーションおよびトラフィック検出のリファレンスデザイン
TySOM-3A-ZU19EGおよびTySOM-3-ZU7EVのSDxプラットフォームはすべてのデザインに対応
デザインを実行するためのビルド済みPetaLinux組込みOS
デザインを実行するための命令とソースファイルが含まれています

Aldec, Inc.
Corporate Headquarters
2260 Corporate Circle
Henderson, NV 89074 USA

Tel: +1 702 990 4400
Fax: +1 702 990 4414
https://www.aldec.com

©2025 Aldec, Inc.

Printed version of site: support.aldec.com/jp/solutions/embedded/deep-learning-using-fpga