Zynq US+ FPGAを使用したディープラーニング

ディープラーニングアルゴリズムは、オブジェクトの認識と分類におけるヒューマンレベルの精度のため、エッジのIoTアプリケーションでより一般的になりつつあります。いくつかのユースケースが含まれていますが、防犯カメラでの顔の検出と認識、ビデオ分類、音声認識、リアルタイムマルチオブジェクト追跡、文字認識、ジェスチャー認識、財務予測、医療診断システムに限定されません。ディープラーニングアルゴリズムは、機械学習のサブセットとして、人間の脳のニューラルネットワークに触発されています。機械学習で生物学的ニューラルネットワークの概念を展開すると、これまで不可能だった学習問題を解決する上で強力な効果が実証されています。特に、コンボリューショナルニューラルネットワーク(CNN)は、コンピュータビジョンアプリケーション向けの機敏で信頼性の高い画像検出と認識を示しています。このようなネットワークのディープレイヤは、ディープラーニングのモデルを作成するために使用されるニューラルネットワークを作成します。

 

ディープラーニングアルゴリズムは、オブジェクトの認識と分類におけるヒューマンレベルの精度のため、エッジのIoTアプリケーションでより一般的になりつつあります。いくつかのユースケースが含まれていますが、防犯カメラでの顔の検出と認識、ビデオ分類、音声認識、リアルタイムマルチオブジェクト追跡、文字認識、ジェスチャー認識、財務予測、医療診断システムに限定されません。ディープラーニングアルゴリズムは、機械学習のサブセットとして、人間の脳のニューラルネットワークに触発されています。機械学習で生物学的ニューラルネットワークの概念を展開すると、これまで不可能だった学習問題を解決する上で強力な効果が実証されています。特に、コンボリューショナルニューラルネットワーク(CNN)は、コンピュータビジョンアプリケーション向けの機敏で信頼性の高い画像検出と認識を示しています。このようなネットワークのディープレイヤは、ディープラーニングのモデルを作成するために使用されるニューラルネットワークを作成します。詳細はこちらをご覧ください。

 

 

FPGAを使用したディープラーニングアプリケーションの開発は困難に思えるかもしれません。アルデックでは、CNNを使用してすぐに使用できるFPGAベースのオブジェクト検出ソリューションを顧客に提供し、プロジェクトを迅速に開始できるようにすることで道を切り開きました。これらのアプリケーションでは、ディープラーニングプロセッシングユニット(DPU)がFPGA側に実装されており、3チャネル入力で45fpsのアクセラレーションを実現しています。実際、FPGAが大きいほど、追加できるDPUユニットの数が多くなり、パフォーマンスが向上します。TySOM-3A-ZU19EG 組込みプロトタイピングボードには1,143Kのロジックセルがあり、多くのチャネル処理アプリケーションに不可欠な複数(1~3)のDPUを実装できます。下記画像は、デモの構造と出力画面の結果を示しています。

 

 

TySOM-3A-ZU19EG 組込みプロトタイピングボード

 

このリファレンスデザインの入力として、ライブビデオカメラまたは事前に記録されたビデオを使用することができます。外部カメラを接続するために、アルデックはHSDコネクタ付き5x FPD-Linkを備えたFMC-ADASカードを提供しています。複数のカメラ入力を持つアルデックのADAS アプリケーションの拡張として使用できます。事前に記録されたビデオは、マイクロSDカード、SATAを使用するか、またはクラウドからボードに提供することができます。

 

 

オブジェクト検出アプリケーションに加えて、アルデックは顔検出、ジェスチャー検出、歩行者検出、セグメンテーション用のSDxプラットフォームを提供しています。これらのデモデザインは、Zynqベースのプロトタイプボードのリファレンスデザインとして提供されます。これらのデザインは、USBカメラ、FPD IIIリンクを使用してブルーイーグルカメラに接続するFMC-ADASカード、SDカードに保存されている事前に記録されたビデオなどのさまざまな入力を使用してテスト出来ます。パフォーマンス解析については、次の表を参照してください。

 


APPLICATION NAME

INPUT PERFORMANCE
TySOM-3A TySOM-3
FMC-ADAS Up to 30 FPS Up to 30 FPS

Gesture Detection

Video Up to 18 FPS Up to 17 FPS
FMC-ADAS Up to 30 FPS Up to 30 FPS

Pedestrian Detection

Video Up to 25 FPS Up to 25 FPS
FMC-ADAS Up to 30 FPS Up to 30 FPS

Segmentation

Video Up to 24 FPS Up to 24 FPS
FMC-ADAS Up to 10 FPS Up to 10 FPS

Traffic Detection

Video Up to 36 FPS Up to 35 FPS
FMC-ADAS Up to 30 FPS Up to 30 FPS

 

表1. TySOM-3AおよびTySOM-3のDNNベースの設計パフォーマンス分析

 

主な特徴

Solution Contents

 



Printed version of site: support.aldec.com/jp/solutions/embedded/deep-learning-using-fpga