TensorFlow™

TensorFlow TensorFlowは、データフローグラフを使った数値演算のためのオープンソースのソフトウェア・ライブラリです。グラフにおけるノードは数学的な演算を表し、エッジはノード間でやりとりされる多次元配列(テンソル)を表します。

TensorFlowの柔軟なアーキテクチャにより、デスクトップ、サーバー、モバイルデバイス上の1つ以上のCPUまたはGPUを使った解析を、単一のAPIで展開することが可能になります。TensorFlowはもともとGoogleの人工知能研究機関内のBrain Teamで働く研究者とエンジニアが機械学習とディープ・ニューラル・ネットワークの研究用に開発したものですが、言語翻訳や医療研究、自動運転、画像認識、セキュリティ等の他領域にも幅広く適用できるだけの一般性を持ったシステムです。

RDMAテクノロジーは、分散システムの性能限界を拡張してきました。TensorFlowは、オープンソースの普遍的な高パフォーマンスRPCフレームワークであるgRPCを利用し、さらにTCPベースのgRPCよりも約322%高速なRDMAベースのgRPCを活用しています。

TenserFlow
TensorFlowがRDMAを活用する別のやり方として、MPI(Message-Passing Interface)があります。MPIバージョンのTensorFlowは、高パフォーマンスの機械学習とデータマイニング(MLDM)アルゴリズムのセットであるMaTEx(Machine Learning Toolkit for Extreme Scale)で利用可能です。



メラノックス®のソリューション

メラノックスのI/Oアダプタは、最大200Gb/sの高信頼でロスのない、遅延1マイクロ秒未満の接続性により処理のボトルネックを解消します。1つのアダプタがブレード・サーバ・システム全体に最適な接続性を提供可能であり、データセンターで複数のイーサネット・アダプタを維持するためのコストを抑制します。メラノックスだけが、RDMA、GPUDirect® RDMA、そしてSHARP™ v2mのような分散機械学習フレームワークに最適なネイティブ高速化エンジンを提供し、コグニティブ・コンピューティング・アプリケーションのパフォーマンスを劇的に改善します。メラノックスのInfiniBandスイッチとゲートウェイは、データセンター・ファブリックの統合を可能にし、さらなるパフォーマンスの改善を実現します。