Zynq US+ FPGAを使用したディープラーニング ディープラーニングアルゴリズムは、オブジェクトの認識と分類におけるヒューマンレベルの精度のため、エッジのIoTアプリケーションでより一般的になりつつあります。いくつかのユースケースが含まれていますが、防犯カメラでの顔の検出と認識、ビデオ分類、音声認識、リアルタイムマルチオブジェクト追跡、文字認識、ジェスチャー認識、財務予測、医療診断システムに限定されません。ディープラーニングアルゴリズムは、機械学習のサブセットとして、人間の脳のニューラルネットワークに触発されています。機械学習で生物学的ニューラルネットワークの概念を展開すると、これまで不可能だった学習問題を解決する上で強力な効果が実証されています。特に、コンボリューショナルニューラルネットワーク(CNN)は、コンピュータビジョンアプリケーション向けの機敏で信頼性の高い画像検出と認識を示しています。このようなネットワークのディープレイヤは、ディープラーニングのモデルを作成するために使用されるニューラルネットワークを作成します。 ディープラーニングアルゴリズムは、オブジェクトの認識と分類におけるヒューマンレベルの精度のため、エッジのIoTアプリケーションでより一般的になりつつあります。いくつかのユースケースが含まれていますが、防犯カメラでの顔の検出と認識、ビデオ分類、音声認識、リアルタイムマルチオブジェクト追跡、文字認識、ジェスチャー認識、財務予測、医療診断システムに限定されません。ディープラーニングアルゴリズムは、機械学習のサブセットとして、人間の脳のニューラルネットワークに触発されています。機械学習で生物学的ニューラルネットワークの概念を展開すると、これまで不可能だった学習問題を解決する上で強力な効果が実証されています。特に、コンボリューショナルニューラルネットワーク(CNN)は、コンピュータビジョンアプリケーション向けの機敏で信頼性の高い画像検出と認識を示しています。このようなネットワークのディープレイヤは、ディープラーニングのモデルを作成するために使用されるニューラルネットワークを作成します。詳細はこちらをご覧ください。 FPGAを使用したディープラーニングアプリケーションの開発は困難に思えるかもしれません。アルデックでは、CNNを使用してすぐに使用できるFPGAベースのオブジェクト検出ソリューションを顧客に提供し、プロジェクトを迅速に開始できるようにすることで道を切り開きました。これらのアプリケーションでは、ディープラーニングプロセッシングユニット(DPU)がFPGA側に実装されており、3チャネル入力で45fpsのアクセラレーションを実現しています。実際、FPGAが大きいほど、追加できるDPUユニットの数が多くなり、パフォーマンスが向上します。TySOM-3A-ZU19EG 組込みプロトタイピングボードには1,143Kのロジックセルがあり、多くのチャネル処理アプリケーションに不可欠な複数(1~3)のDPUを実装できます。下記画像は、デモの構造と出力画面の結果を示しています。 TySOM-3A-ZU19EG 組込みプロトタイピングボード このリファレンスデザインの入力として、ライブビデオカメラまたは事前に記録されたビデオを使用することができます。外部カメラを接続するために、アルデックはHSDコネクタ付き5x FPD-Linkを備えたFMC-ADASカードを提供しています。複数のカメラ入力を持つアルデックのADAS アプリケーションの拡張として使用できます。事前に記録されたビデオは、マイクロSDカード、SATAを使用するか、またはクラウドからボードに提供することができます。 オブジェクト検出アプリケーションに加えて、アルデックは顔検出、ジェスチャー検出、歩行者検出、セグメンテーション用のSDxプラットフォームを提供しています。これらのデモデザインは、Zynqベースのプロトタイプボードのリファレンスデザインとして提供されます。これらのデザインは、USBカメラ、FPD IIIリンクを使用してブルーイーグルカメラに接続するFMC-ADASカード、SDカードに保存されている事前に記録されたビデオなどのさまざまな入力を使用してテスト出来ます。パフォーマンス解析については、次の表を参照してください。 APPLICATION NAME INPUT PERFORMANCE TySOM-3A TySOM-3 FMC-ADAS Up to 30 FPS Up to 30 FPS Gesture Detection Video Up to 18 FPS Up to 17 FPS FMC-ADAS Up to 30 FPS Up to 30 FPS Pedestrian Detection Video Up to 25 FPS Up to 25 FPS FMC-ADAS Up to 30 FPS Up to 30 FPS Segmentation Video Up to 24 FPS Up to 24 FPS FMC-ADAS Up to 10 FPS Up to 10 FPS Traffic Detection Video Up to 36 FPS Up to 35 FPS FMC-ADAS Up to 30 FPS Up to 30 FPS 表1. TySOM-3AおよびTySOM-3のDNNベースの設計パフォーマンス分析 主な特徴 TySOM-3A-ZU19EGまたはTySOM-3-ZU7EVのいずれかを含む リファレンスデザインとDNNデザインの作成方法に関する説明が含まれています ADASベースのソリューションには、FMC-ADAS カードと192度のワイドレンズを備えたブルーイーグルカメラが含まれます 各ビデオチャンネルで最大40fpsのパフォーマンス SDカードにプリロードされた事前作成済みですぐに使用できるファイル Solution Contents DNNを使用した顔検出、ジェスチャ検出、歩行者検出、セグメンテーションおよびトラフィック検出のリファレンスデザイン TySOM-3A-ZU19EGおよびTySOM-3-ZU7EVのSDxプラットフォームはすべてのデザインに対応 デザインを実行するためのビルド済みPetaLinux組込みOS デザインを実行するための命令とソースファイルが含まれています