概要
NVIDIA® Mellanox® UFM®プラットフォームは、データセンター ネットワーキング管理に革命をもたらします。機能を強化したリアルタイムのネットワークテレメトリーと、AIを搭載したサイバーインテリジェンスおよび分析機能とを組み合わせることで、スケールアウトInfiniBandデータセンターをサポートします。
UFMプラットフォームは、研究分野や工業分野のデータセンター事業者が最新のデータセンターファブリックのプロビジョニング、モニタリング、管理、維持、そして予防的な問題管理を効率的に行えるようにすることで、ファブリックのリソースをより有効に活用し、競争優位を獲得するとともに、事業経費を削減できるようサポートします。また、ワークロードの最適化や設定のチェック、そしてAIベースのネットワーク異常検知と予知保全を活用したファブリックのパフォーマンス向上など、数段階のソリューションと総合的な機能を提供し、現代のスケールアウトデータセンターが求める多様な要件に応えます。
UFMプラットフォームの主なハイライト

NVIDIAメラノックスUFMテレメトリー
リアルタイムモニタリング

NVIDIAメラノックスUFMエンタープライズ
ファブリックの可視化&制御

NVIDIAメラノックスUFMサイバーAI
サイバーインテリジェンス&分析
UFM TELEMETRY
リアルタイムモニタリング

UFMテレメトリープラットフォームは、豊富なリアルタイムのネットワークテレメトリー情報、アプリケーションワークロードの使用状況、システム構成などをキャプチャし、詳細な分析を行えるようオンプレミスまたはクラウドベースのデータベースにストリーミングする、ネットワークのパフォーマンスと状態をモニタリングするネットワーク検証ツールを提供します。
主な特徴:
- スイッチ、アダプター、ケーブルテレメトリー
- システム検証
- ネットワークパフォーマンス テスト
- テレメトリー情報をオンプレミスまたはクラウドベースのデータベースにストリーミング
UFM ENTERPRISE
ファブリックの可視化&制御

ミッドティアUFM Enterpriseプラットフォームでは、UFMテレメトリーのあらゆる利点が強化されたネットワーク監視と管理機能、ワークロード最適化、定期的な構成チェックと統合されています。また、このプラットフォームは、自動ネットワーク検出およびプロビジョニング、トラフィック監視、輻輳の検出を行います。UFM Enterpriseは、SlurmやPlatform LSFなど、最新のジョブスケジューラ、クラウド、クラスタ管理を使用して、ジョブスケジューラのプロビジョニングと統合を可能にします。さらに、UFMはOpenStack、Azureクラウド、VMwareを使用したネットワークプロビジョニングと統合を実現します。
主な特徴:
- UFMテレメトリーを搭載
- ネットワーク検出と検証を自動化
- 安全なケーブル管理
- トラフィックのボトルネックを特定する輻輳追跡
- 問題の特定と解決
- グローバルなソフトウェアアップデート
- ジョブスケジューラ プロビジョニング、SlurmおよびPlatform LSFとの統合
- 高度なレポーティングおよび包括的なREST API
- ウェブベースの豊富なGUI

NVIDIAメラノックスUFMサイバーAI
サイバーインテリジェンス&分析
UFMサイバーAIアプライアンスは、UFM TelemetryとUFM Enterpriseのメリットを拡大したもので、予防メンテナンスをスケールアウトすることでスーパーコンピューティングの運用コストを低減できるようになっています。
プラットフォームにはオンプレミスの専用UFMサイバーAIアプライアンスが必要です。
主な特徴:
- UFM TelemetryとUFM Enterpriseを内蔵
- パフォーマンスの低下を検知
- 使用状況の経時的変化を検知
- クラスタの異常な動作を検知
- 人工知能により、関連がないように思われる現象同士が相関
- 必要に応じて予防メンテナンスのアラートを発信
- システムデータの継続的収集により予測可能性を最大化
UFMサイバーAIの仕組み
サイバーAIプラットフォーム特有のメリットには、豊富なテレメトリー情報を経時的にキャプチャし、深層学習アルゴリズムに使用できることがあります。その仕組みを以下で説明します:

- UFMはデータセンターの「心臓の鼓動」、オペレーションモード、状態、ワークロードネットワークシグネチャーを学習し、テレメトリー情報とイベント間の相関関係の検出から成る強化されたデータベースを構築します。
- UFMは、鼓動の変化を読み取り、将来的なパフォーマンス低下やデータセンターのコンピューティングリソースの異常な使用状況のサインと結び付けます。
- こうした変化や現象との相関関係は、予測分析のパフォーマンスをトリガーし、システムおよびアプリケーションの異常や潜在的なシステム障害の兆候をアラートします。
- システム管理者は、このような潜在的なセキュリティ脅威を迅速に検知して対応し、将来的な障害に効率的に対処できるため、OPEXを節減してエンドユーザーSLAを維持できるようになります。
既存のデータセンター管理ツールとの統合
UFMは、オープンで拡張可能なオブジェクトモデルを提供してデータセンターインフラストラクチャを記述し、関連するすべての管理アクションを実行します。UFMのAPIは、主要なジョブスケジューラー、クラウド、VMwareとの統合を可能にします。
安心を提供するNVIDIA Mellanox - 監視およびNOCサービス
メラノックスのソリューションがお客様のビジネス目標およびメラノックステクノロジーと合致していることを確認するためには、定期的なパフォーマンス分析が不可欠です。当社の監視およびNOCサービスは、お客様のソリューションを継続的に検証し、障害が発生する前に問題に対処できるよう潜在的な障害の兆候を特定することで、お客様に安心を提供します。

- 遠隔でのNOC、ネットワーク管理、モニタリングのサービス
- 専任のサービスエンジニア
- ティア1、2、3のサポート
- 継続的なエラー/障害管理
- 障害の報告と管理
- 結果の分析と報告
- パフォーマンスのモニタリング - アラームやリアルタイムアラート
- スケーラブルでコスト効率に優れたサービス
- 製品概要 NVIDIAメラノックスUnified Fabric Manager (UFM) プラットフォームのポートフォリオダウンロード
- 製品概要 メラノックスInfiniBandアダプタのカタログダウンロード
- OCP向けConnectX InfiniBandアダプタカード パンフレットダウンロード
- 製品概要 ConnectX-6 VPIダウンロード
- 製品概要 ConnectX-5 VPIダウンロード
- 製品概要 ConnectX-5 VPI OCPダウンロード
- 製品概要 ConnectX-5 VPI Socket Directダウンロード
- 製品概要 ConnectX-4 VPIダウンロード
- 製品概要 ConnectX-3 Pro VPIダウンロード
- UFM-SDNアプライアンス製品概要ダウンロード
- UFM-LSF製品概要ダウンロード