概要

NVIDIA® Mellanox® UFM®プラットフォームは、データセンター ネットワーキング管理に革命をもたらします。機能を強化したリアルタイムのネットワークテレメトリーと、AIを搭載したサイバーインテリジェンスおよび分析機能とを組み合わせることで、スケールアウトInfiniBandデータセンターをサポートします。

UFMプラットフォームは、研究分野や工業分野のデータセンター事業者が最新のデータセンターファブリックのプロビジョニング、モニタリング、管理、維持、そして予防的な問題管理を効率的に行えるようにすることで、ファブリックのリソースをより有効に活用し、競争優位を獲得するとともに、事業経費を削減できるようサポートします。また、ワークロードの最適化や設定のチェック、そしてAIベースのネットワーク異常検知と予知保全を活用したファブリックのパフォーマンス向上など、数段階のソリューションと総合的な機能を提供し、現代のスケールアウトデータセンターが求める多様な要件に応えます。

製品概要を見る
UFMプラットフォームがスーパーコンピューティングのOPEXを最適化

UFMプラットフォームの主なハイライト

UFMテレメトリー 

NVIDIAメラノックスUFMテレメトリー

リアルタイムモニタリング

リアルタイムのネットワークテレメトリー、ワークロード、システム構成などが揃った充実したデータベースを構築できます。
プラットフォームのオプション:ソフトウェア、Dockerコンテナ、UFMテレメトリーアプライアンス
UFMエンタープライズ

NVIDIAメラノックスUFMエンタープライズ

ファブリックの可視化&制御

UFMテレメトリーの利点に、機能強化されたネットワークモニタリングおよび管理を組み合わせました。
プラットフォームのオプション:ソフトウェア、Dockerコンテナ、UFMエンタープライズアプライアンス
UFMサイバーAI

NVIDIAメラノックスUFMサイバーAI

サイバーインテリジェンス&分析

UFMテレメトリーとUFMエンタープライズの利点を強化し、予防メンテナンスをスケールアウトしてスーパーコンピューティングのOPEXを抑えることができます。
プラットフォームにはオンプレミスの専用UFMサイバーAIアプライアンスが必要です。

UFM TELEMETRY

リアルタイムモニタリング

UFMテレメトリー 

UFMテレメトリープラットフォームは、豊富なリアルタイムのネットワークテレメトリー情報、アプリケーションワークロードの使用状況、システム構成などをキャプチャし、詳細な分析を行えるようオンプレミスまたはクラウドベースのデータベースにストリーミングする、ネットワークのパフォーマンスと状態をモニタリングするネットワーク検証ツールを提供します。

主な特徴:

  • スイッチ、アダプター、ケーブルテレメトリー
  • システム検証
  • ネットワークパフォーマンス テスト
  • テレメトリー情報をオンプレミスまたはクラウドベースのデータベースにストリーミング

UFM ENTERPRISE

ファブリックの可視化&制御

UFM ENTERPRISE

ミッドティアUFM Enterpriseプラットフォームでは、UFMテレメトリーのあらゆる利点が強化されたネットワーク監視と管理機能、ワークロード最適化、定期的な構成チェックと統合されています。また、このプラットフォームは、自動ネットワーク検出およびプロビジョニング、トラフィック監視、輻輳の検出を行います。UFM Enterpriseは、SlurmやPlatform LSFなど、最新のジョブスケジューラ、クラウド、クラスタ管理を使用して、ジョブスケジューラのプロビジョニングと統合を可能にします。さらに、UFMはOpenStack、Azureクラウド、VMwareを使用したネットワークプロビジョニングと統合を実現します。

主な特徴:

  • UFMテレメトリーを搭載
  • ネットワーク検出と検証を自動化
  • 安全なケーブル管理
  • トラフィックのボトルネックを特定する輻輳追跡
  • 問題の特定と解決
  • グローバルなソフトウェアアップデート
  • ジョブスケジューラ プロビジョニング、SlurmおよびPlatform LSFとの統合
  • 高度なレポーティングおよび包括的なREST API
  • ウェブベースの豊富なGUI
UFMサイバーAI

NVIDIAメラノックスUFMサイバーAI

サイバーインテリジェンス&分析

UFMサイバーAIアプライアンスは、UFM TelemetryとUFM Enterpriseのメリットを拡大したもので、予防メンテナンスをスケールアウトすることでスーパーコンピューティングの運用コストを低減できるようになっています。

プラットフォームにはオンプレミスの専用UFMサイバーAIアプライアンスが必要です。

主な特徴:

  • UFM TelemetryとUFM Enterpriseを内蔵
  • パフォーマンスの低下を検知
  • 使用状況の経時的変化を検知
  • クラスタの異常な動作を検知
  • 人工知能により、関連がないように思われる現象同士が相関
  • 必要に応じて予防メンテナンスのアラートを発信
  • システムデータの継続的収集により予測可能性を最大化

UFMサイバーAIの仕組み

サイバーAIプラットフォーム特有のメリットには、豊富なテレメトリー情報を経時的にキャプチャし、深層学習アルゴリズムに使用できることがあります。その仕組みを以下で説明します:

UFMのダッシュボード
  • UFMはデータセンターの「心臓の鼓動」、オペレーションモード、状態、ワークロードネットワークシグネチャーを学習し、テレメトリー情報とイベント間の相関関係の検出から成る強化されたデータベースを構築します。
  • UFMは、鼓動の変化を読み取り、将来的なパフォーマンス低下やデータセンターのコンピューティングリソースの異常な使用状況のサインと結び付けます。
  • こうした変化や現象との相関関係は、予測分析のパフォーマンスをトリガーし、システムおよびアプリケーションの異常や潜在的なシステム障害の兆候をアラートします。
  • システム管理者は、このような潜在的なセキュリティ脅威を迅速に検知して対応し、将来的な障害に効率的に対処できるため、OPEXを節減してエンドユーザーSLAを維持できるようになります。

既存のデータセンター管理ツールとの統合

UFMは、オープンで拡張可能なオブジェクトモデルを提供してデータセンターインフラストラクチャを記述し、関連するすべての管理アクションを実行します。UFMのAPIは、主要なジョブスケジューラー、クラウド、VMwareとの統合を可能にします。

安心を提供するNVIDIA Mellanox - 監視およびNOCサービス

メラノックスのソリューションがお客様のビジネス目標およびメラノックステクノロジーと合致していることを確認するためには、定期的なパフォーマンス分析が不可欠です。当社の監視およびNOCサービスは、お客様のソリューションを継続的に検証し、障害が発生する前に問題に対処できるよう潜在的な障害の兆候を特定することで、お客様に安心を提供します。

モニタリングとNOCのサービス
  • 遠隔でのNOC、ネットワーク管理、モニタリングのサービス
  • 専任のサービスエンジニア
  • ティア1、2、3のサポート
  • 継続的なエラー/障害管理
  • 障害の報告と管理
  • 結果の分析と報告
  • パフォーマンスのモニタリング - アラームやリアルタイムアラート
  • スケーラブルでコスト効率に優れたサービス
ビデオ サムネイル

UFMプラットフォームがスーパーコンピューティングのOPEXを最適化

メラノックスQuantum

ビデオ サムネイル

HDR 200G InfiniBand、International Supercomputing Conference 2019で絶賛される

InfiniBandのネットワーク内コンピューティング技術とロードマップ

NVMeオーバーファブリック ソリューション

TACC(テキサス アドバンスド コンピュータセンター)がメラノックスのInfiniBandを採用

詳細について

ご質問

ご購入

NVIDIAメラノックスのクッキーに関する方針

本ウェブサイトは、お客様の好みの傾向や関心に合ったコンテンツを表示し、閲覧をより快適にするため、ならびにトラフィックの分析のためにクッキーを使用しています。本サイトのクッキーを削除またはブロックすることもできますが、それによりサイトの機能が妨げられる可能性があります。詳しくは、当社のプライバシーに関する方針をご覧ください。