バックナンバーはこちら

today&tomorrow

Customer Spotlight

  • T&T HOME
  • Customer Spotlight
  • スマートなコネクテッド・マシンとネットワークの未来(IC Compiler IIテクノロジ・シンポジウムのMovidius社基調講演より)

2017 Jan Winter vol.105

スマートなコネクテッド・マシンとネットワークの未来(IC Compiler IIテクノロジ・シンポジウムのMovidius社基調講演より)

シノプシス コーポレート・コミュニケーションズ・ストラテジ担当ディレクター Mike Santarini

スマート・ビジョン・プロセッシングSoCにとって、ディープ・ラーニングの分野は新しい課題でもありチャンスでもあるといいます。「今、ディープ・ラーニングが大いに注目されています。解決に必要なアルゴリズムがわからないようなケースに対応できるからです」。Brown氏が挙げたのは、“ほとんどの人は友人が作り笑いをしているのか本当に笑っているのかを見分けることができるが、機械にはその区別が容易ではない”という例です。「このような問題はアルゴリズムを記述して解くのは非常に困難ですが、人間には簡単に解くことができます。それは、人間の脳には1000億近くのニューロンがあるためです。同じことをICで実現するにはどうすればよいでしょうか。過去10年間、このニューロンのモデルを作成しようという取り組みが行われてきました。例えば、あるニューロンに、隣接する1,000個のニューロンのネットワークが接続しているとします。これら1,000個のニューロンはそれぞれ正または負の電荷を出力します。その電荷をある一定の時間と空間で合計して出力値を決定します。実際のニューロンはこのような動作をします。では、どうすればこのニューロンのモデルを作成できるでしょうか。どうすれば同じことを回路で実行できるようになるでしょうか」

その答えはニューラル・ネットワークの構築にあるといいます。「例えば、ある一定範囲のピクセルを入力します。最初のニューロン層では各ピクセルを活性化させ、重みを付けて合計します。そのニューロン層の出力を次のニューロン層に入力し、さらに重み付けをします。このようにして、最初のニューロン層で画像に含まれる小さな特徴量を検出します。次の層ではもう少し大きな特徴量を検出し、いくつかの層を経て最終的に“このピクセル範囲の画像はAかBかCかDかEか?”を判定します」

ディープ・ニューラル・ネットワークの手法を用いてネットワークに大量のテスト/学習をさせると、ネットワークは画像や動画の中から物体や人物を識別したり、言語を翻訳したり、音声を分類したりできるようになるほか、さまざまな種類のイメージ/ビジョン処理にも応用できるとBrown氏は言います。

たとえば、ディープ・ニューラル・ネットワークにブルーベリー・マフィンの写真とタン・チワワの顔の写真を区別させる問題があります(図1)。「チワワかマフィンかを区別するのは難しい問題です。違いを検出するアルゴリズムを作成するのは容易ではありません。どれも全部愛くるしい目と鼻があるように見えます」

ディープ・ラーニング・ネットワークは比較的短期間で精度が格段に向上したものの、ここ2年間はネットワークに追加するニューロン層の数が指数関数的に増えているにもかかわらず、認識精度はわずかしか向上していないとBrown氏は指摘しています。

この問題を解決するのがMovidius社のSoCで、これによってネットワークに接続された多くの種類のビジョン・システムがローカルで処理を実行できるようになるとBrown氏は言います。

「現在のディープ・ラーニングで実に興味深いのは、当社が設計するSoCで非常に複雑なニューラル・ネットワークをリアルタイムで実行できるだけの性能を持続できるようになったという点です。以前なら、同じことをしようとしても非常にシンプルなアナログ・ネットワークしか実行できませんでした。しかし現在当社が設計している精巧かつ高機能なSoCによって、ニューラル・ネットワークの利用は爆発的に広がっています」。

ネットワーク・エッジで処理を実行することにより、ネットワークの電力効率は100万倍向上し、必要な帯域幅は1/10,000に削減され、レイテンシは1/1,000に削減されるほか、プライバシー、耐障害性、サービス継続性の改善という利点もあるとBrown氏は言います。

Brown氏は、「人間の脳と同じくらい精巧なSoCを作り出すこと」がMovidius社の重要な目標だと言います。「1秒間に10京(1017)回の演算を実行できるようにすれば、それは100,000 TFLOPSに相当します。これを極小のチップで実行できるようになればすばらしいと思いませんか。しかもこの演算を人間の脳のように20 Wで実行できれば、ワットあたり性能は500 GFLOPSにも達します。それは驚異的な性能です。当社はこうした人間の脳の性能に少しでも近付こうと努力しています。ちなみに、人間の脳の皮質の約50%が視覚に関するものです」。

まだ人間の脳ほど精巧ではありませんが、Movidius社のVPU Myriad 2は非常に高度なアーキテクチャを採用しています。このデバイスは、以下のものをワンチップに統合しています。

  • 構成可能なイメージング/ビジョン・ハードウェア・エンジン
  • 複雑なイメージング/ビジョン・アルゴリズムを低消費電力で高速に実行する12個のプログラマブルなDSP
  • ローカル処理をサポートする低消費電力のゼロ・レイテンシ・オンチップ・メモリー
  • RTOS、ファームウェア、ランタイム・スケジューラを実行する2つのRISC CPU

カテゴリートップ