デル・テクノロジーズの生成AIソリューションが、よりスピーディーな価値提供を実現

生成AIと推論のためのフルスタック ソリューションを短時間で導入・展開

ブログ原稿 https://www.dell.com/en-us/blog/deliver-faster-value-with-dell-generative-ai-solutions/
筆者 Varun Chhabra | 2023年7月31日

生成AI(ジェネレーティブAI)に対する人気があらゆる業界で急激に広がり、注目を集めています。多くの企業は、自社のビジネスにとって生成AIがどのような意味を持ち、どうすれば価値と収益を生み出すことができるのかを見出そうとしています。

デル・テクノロジーズは、5月に発表したProject Helixを基盤に、7月31日に生成AI推論プロジェクトのためのフルスタック ソリューションの展開と導入を簡素化するアーキテクチャーを発表しました。NVIDIAとのコラボレーションをベースとするこの共同アーキテクチャーは、モジュール式の柔軟なデザインで数多くのユースケースとコンピューティング要件をサポートします。

そもそも「推論」とは?
AI(人工知能)における推論とは、トレーニングしたモデルを使った予測の生成や意思決定、入力データをベースとする出力の生成といったプロセスを指し、モデルのトレーニング段階で学習した知識とパターンをまったく新しいデータに適用します。トレーニングしたモデルは、推論のプロセスでは、コンピューティング アルゴリズムまたはニューラル ネットワーク アーキテクチャーを通じて入力データを処理し、出力や予測、すなわち価値のある情報やアクションを生成します。

生成AIにおける推論の意味は?
推論は、AIシステムのライフサイクルにおける最後の段階であり、モデルが知識を一般化し、新しいデータをベースとする予測やレスポンスを生成することを可能にします。基本的に、トレーニングとファインチューニングなどによるカスタマイズが完了したら、本番環境に展開して結果と価値を提供できます。もちろん、事前トレーニング済みのモデルを使うことも可能です。

推論の興味深いユースケースとして、以下のようなものがあります。

自然言語生成:モデルを使って、文書の作成やダイアログの生成、要約、コンテンツの作成といったテキスト生成タスクを実行できます。
チャットボットとバーチャル アシスタント:ユーザーからの問い合わせや指示をベースに自然言語によるレスポンスを生成することで、対話エージェント、チャットボット、バーチャル アシスタントを強化できます。
コード開発:コードの補完、ユニット テスト生成能力、コード説明のチャット機能などにより、ソフトウェア開発を支援することができます。

生産性とインサイトを強化
導入を簡素化する「Dell Validated Design」の実証済みのリファレンス アーキテクチャーによって、生成AIを展開する際に、推測(場合によっては憶測)をベースとする作業を取り除くことができます。また、「Dell PowerEdge XE9680」や「PowerEdge R760xa」などのデル・テクノロジーズ インフラストラクチャー、幅広いNVIDIA® TensorコアGPU、デル・テクノロジーズのソフトウェアおよびTriton Inference ServerやNeMoフレームワークを含むNVIDIA AI Enterpriseソフトウェアによって、推論処理機能を強化することができます。「Dell PowerScale」オールフラッシュまたはハイブリッド ストレージ アレイは、生成AIおよび大規模言語モデルのための高速で十分な容量のデータレイク ストレージを提供します(デザイン ガイドはこちらでダウンロードできます)。

推論向けのリファレンス アーキテクチャーは、お客様が自社のモデルをゼロから構築してトレーニングするのではなく、NVIDIA NeMoフレームワークによって、事前トレーニング済みのモデルをコスト効率良く活用するロードマップを提供します。事前トレーニング済みの推論モデルを活用することで、よりコスト効率に優れた成果を、よりスピーディーに実現することが可能になります。事前トレーニング済みの推論モデルは、例えば言語翻訳といったさまざまな機能をすぐに利用できる環境を提供しながら、タスク固有の少量のデータでさらにファインチューニングしていくことができます。

ハイパフォーマンスな開発環境をローカルで提供
AI開発者やデータ サイエンティストは、LLM(大規模言語モデル)推論をデータセンターへ大規模に展開する際、生成AIモデルをローカルで開発して本番環境へ移行する前にファインチューニングすることができます。1台に最大4枚のNVIDIA RTX 6000 Ada世代GPUを搭載した「Dell Precisionワークステーション」と内蔵のAIソフトウェア(「Dell Optimizer」)によって、お客様は慣れ親しんできたデル・テクノロジーズの高度なパフォーマンスと信頼性を得ることができます。

「Dell Professional Services」を活用 - 優先項目をスピーディーに実現
さらに、デル・テクノロジーズは、LLM推論の実現に向けた過程において、あらゆるステージでお客様をサポートします。「Dell Professional Services」では、戦略の策定、デル・テクノロジーズ製品の導入や他のシステムとの統合、新たなビジネス要件に対応するための拡張など、すべてのステップを通じて、常にお客様をサポートします。

デル・テクノロジーズとNVIDIAが提供する強力な生成AIソリューションによって、お客様は顧客関連業務やコンテンツ作成、ソフトウェア開発、販売などの分野のプロセスの変革を実現できます。同時に、自社独自のデータの保護に欠かせないオンプレミスのセキュリティーを確立することが可能になります。

デル・テクノロジーズの生成AIソリューションの詳細は、こちらをご覧ください。また、こちらでインフォグラフィックをダウンロードできます。

デル・テクノロジーズのAIワークステーションに対するさまざまな取り組みの詳細は、来月開催される『Siggraph』のデル・テクノロジーズ ブースで、ぜひ直接ご確認ください。