データサイエンスを阻む2大難問「人」と「技術」その解決策は?

DX推進に不可欠なデータサイエンスをどう進めるべきか

デジタルトランスフォーメーション(DX)を、重要な経営課題として積極的に取り組む企業が増えている。ただ、その実現は容易なことではない。DXを成功させるには、これまでの成功体験で培われてきた思考方法を大きく転換し、新たな発想で価値を生み出す必要があるからだ。

こうした変革を推進するために、重要な役割を果たすのがデータサイエンスである。例えば、IoTを活用し、工場における生産効率を高めていくケースを考えてみよう。そのためには生産現場のIoTでデータを収集し、その結果を再び生産現場にフィードバックすることになるが、当然ながらデータをそのままフィードバックしても意味がない。膨大なデータを機械学習やディープラーニングに学習させ、そこから何らかのモデルを作成し、「次に何を行うべきか」を生産現場に指示しなければならないのだ。

それではDX推進に向けたデータサイエンスへの取り組みは、どのように進めるべきなのか。そこで直面する課題と解決策も含め、この分野に詳しい有識者に話を聞いた。

DXの阻害要因となっているデータサイエンス。その理由とは

デル・テクノロジーズ株式会社
最高技術責任者
黒田 晴彦氏

「ワールドワイドで見ると、2016~2018年にかけて米国が先行する形でDXが進められ、その後、米国以外でもDXへのシフトが始まりました」。このように語るのは、デル・テクノロジーズの黒田 晴彦氏だ。同社の調査によれば、日本でも2020年には『現在デジタル変革を加速している』と回答した企業が80%に達しているという。「その一方でDXの阻害要因も明らかになってきました。実は3割近くの企業が『データ/情報から貴重な洞察を抽出することができない』と答えているのです」。

つまりこれは、データサイエンスがまだ十分機能していないことを意味する。その結果、日本では「DXが自社DNAに組み込まれている」といえる「デジタルリーダー」が、まだ全体の2%にしか達していないのだ。「グローバルではデジタルリーダーの比率が6%となっています。世界的に見てもまだ少ないのですが、現状、日本企業はそれよりも後れを取っているといえるでしょう」(黒田氏)。

「Digital Transformation Index」の日本における調査結果

DXの成熟度は2020年に一気に進んではいるものの、デジタルリーダーの比率は2%程度にすぎない。その阻害要因の1つに挙げられているのが、データサイエンス領域での取り組みの遅れだ
エヌビディア合同会社 ソリューションアーキテクチャ & エンジニアリング シニア ソリューションアーキテクト 佐々木 邦暢氏

しかし、光明もある。この阻害要因を解消するための取り組みが、今後は急速に進んでいくことが期待できるからだ。具体的には「今後1~3年における投資対象エリア」として、「人工知能(AI)」を挙げる企業の比率がトップとなっているのだ。

「ただし、データサイエンスを推進するには、『人』と『技術環境』の両面での取り組みが必要になります」と指摘するのは、エヌビディアの佐々木 邦暢氏だ。人の面では長らく人材不足が続いていたが、多くの大学でデータサイエンスの学科が新設されたことで、状況は大きく変わりつつある。さらに技術環境の側面でも、注目すべき変化が生まれつつあるという。

「これまでは、データサイエンスを必要とする部門や人々が、サーバーの形で設置されたコンピューターリソースを共有し、お互いに譲り合いながら利用する、というのが一般的でした。そのためデータサイエンティストの仕事は待ち時間が長く、会社や研究室の外で分析作業を行うことも難しかったのです。しかし最近ではコロナ禍の影響で、オフィスや研究室での作業が制限されるようになっています。その結果、データサイエンスの技術環境も変化しつつあるのです」(佐々木氏)

技術環境を大きく変化させたデータサイエンス向けGPU

その変化とは、データサイエンス向けワークステーション(DSWS)の利用が広がっていることだ。手元のリソースでデータ分析ができれば、待ち時間は大幅に短縮され、自宅や現場、外出先でも業務を遂行できる。

この変化を生み出したのは前述のように、コロナ禍における新たなユーザーニーズの顕在化だが、実はもう1つ重要な要因があるという。それはデータサイエンス向けに開発されたGPUが登場し、これをワークステーションに搭載することで、極めて高いパフォーマンスを発揮できるようになったからだ。

「NVIDIAではデータサイエンス向けにRTX 8000/6000というGPUを提供しており、CPUだけによる処理に比べて8~30倍の処理速度を実現しています。これに加え、データ準備からモデルトレーニング、可視化といった、データサイエンスに必要な一連のプロセスを高速化できるソフトウエアスタック『RAPIDS』も、オープンソースの形で提供しています。RTX 8000/6000とRAPIDSを組み合わせて活用することで、データサイエンティストの待ち時間は極限まで短縮され、一連の作業プロセスを短時間で数多く繰り返すことが可能になるのです」(佐々木氏)

NVIDIA RTX 8000を活用した場合の処理時間の変化

CPUのみの処理に比べ、8~30倍の処理速度を実現できる。このような処理能力が手元で利用できれば、データサイエンティストの待ち時間を最小化でき、作業効率を極限まで高められる

ただし、この能力を最大限に引き出すには、GPUを搭載するコンピューターも重要になるという。

「例えば大学の研究室では、自ら部品を集めて組み立てた自作コンピューターを使っているケースがまだ少なくありません。しかしこのような手組みのコンピューターでは、ディープラーニングで長時間のトレーニングを行う際に、すぐにGPUの温度が上昇し学習が遅くなる、といった事象が発生しやすくなります。GPU性能を安定的に引き出すには、GPU搭載を前提にしっかりと設計されたDSWSが必要なのです」(佐々木氏)

このようなDSWSをユーザーが選択しやすいように、NVIDIAでは「NGC-Ready Systems」というページに製品一覧を掲載している。NGCとは「NVIDIA GPU CLOUD」の略で、NVIDIAが提供するディープラーニングや科学計算用に最適化されたGPUプラットフォームのこと。これに対応した製品がリストアップされているのだ。

ここで注目したいのがデル・テクノロジーズ製品のラインアップだ。モバイル型で4機種、タワー型で2機種、ラック型で1機種が掲載されているのである。

NVIDIAとの緊密な連携が生み出す高品質なDSWS

「タワー型のPrecision 5820/7920 Towerとラック型のPrecision 7920 Rackは、いずれもRTX 8000/6000をサポートしています」と説明するのは、デル・テクノロジーズの中島 章 氏。モバイル型の2機種はRTX 5000をサポートしており、最近ではPrecision 7550/7750の人気が高くなっているという。

「NGC-Ready」となっているデル・テクノロジーズ製品のラインアップ

モバイル型で2機種、タワー型で2機種、ラック型で1機種が提供されている。その中でも最近は、Precision 7550/7750の人気が高くなっている
デル・テクノロジーズ株式会社 クライアント・ソリューションズ統括本部 アウトサイドスペシャリスト部長 中島 章氏

デル・テクノロジーズがこれだけの「NGC-Ready製品」をラインアップできる背景には、NVIDIAとの緊密なパートナーシップがあり、大きく3つの取り組みが行われているという。

第1はNGC-Ready認証における米国本社同士の連携。第2は日本国内における情報支援や個別案件への相談対応。そして第3が、デモ環境構築の協力体制など、マーケティングにおける連携だ。ユーザーがDSWSで何か困ったことがあれば、両者が一体となってサポートする。このような取り組みも、デル・テクノロジーズのDSWSの評価が高い要因となっているという。

このパートナーシップは、次世代GPU「NVIDIA RTX A6000」への対応でも生かされている。これはAIとHPC(ハイパフォーマンス・コンピューティング)への適用を意識して設計された「NVIDIA AMPEREアーキテクチャ」を採用した最新GPUだ。

汎用並列コンピューティングモデルである「CUDA(Compute Unified Device Architecture:クーダ)」に対応した「CUDAコア」を1万752コア、レイトレーシングアクセラレータである「RTコア」を84コア装備し、AI向けの行列演算ユニットである「TENSORコア」も、前世代のGPUに比べて最大5倍のスループット、最大10倍のスパース性能を発揮する。これによってディープラーニングにおけるパフォーマンスが、RTX 6000に比べて3倍以上になっている。近いうちに前述のタワー型製品群でも、これを正式にサポートする予定だという。

RTX A6000とRTX 8000のパフォーマンス比較

RTX A6000に対応したワークステーションを利用することで、従来の3倍のパフォーマンスを手に入れることが可能になる

「このほかにもデル・テクノロジーズでは、データサイエンティストがいない企業様を対象に、コンサルティングや人材育成プログラムの提供も行っています。また、DSWSだけではなく高性能サーバーやストレージからパソコンに至るまで、幅広い製品ラインアップがあり、これらを組み合わせた最適な提案も可能です」と黒田氏は補足する。

これまで難題だった「人」と「技術」も既に解決策が出てきている。今こそこうした選択肢を考慮しつつ、データサイエンスを進める段階にきているといえるだろう。

日経BP社の許可により、2021年4月28日~ 2021年7月29日掲載の日経 xTECH Active Specialを再構成したものです。

<前の記事へ   次の記事へ>

About the Author: Dell Technologies