• 先端ゲノム研究を支えるストレージ基盤を「Dell EMC アイシロン」で全面刷新次世代シーケンサーの有効活用に大きく貢献

      PDF版

    • お客様名

      国立大学法人 大阪大学 微生物病研究所

    • 業種

      文教

    • 導入製品

      Dell EMC Isilon NL410

    •  
    • 「次世代シーケンサーは目覚しいスピードで進化しており、その能力をフルに引き出すことがゲノム研究を進めていく上での重要課題となっています。
      DELL EMCアイシロンによる新計算機システムが稼動したことで、研究にも大きな弾みが付くことと期待しています。」

      国立大学法人 大阪大学
      微生物病研究所 
      遺伝情報実験センター
      ゲノム解析室長
      教授
      飯田 哲也 氏

  • ■課題

     

    次世代シーケンサーへの対応が大きな課題に

     

    感染症や免疫学の研究を行う専門機関として、1934年に設置された大阪大学 微生物病研究所(以下、微研)。それ以来80余年の長きにわたり、日本の生命科学の発展に大きく寄与し続けてきた。

    大阪大学 微生物病研究所 附属遺伝情報実験センター ゲノム解析室室長 教授 飯田 哲也氏は「現在微研では、感染症などの原因となる微生物を研究する『感染機構研究部門』、病原体に対抗するヒトの免疫系を研究する『生体防御研究部門』、がんの制御メカニズムを研究する『環境応答研究部門』の基幹3部門に加えて、応用研究を行う3つのセンターや日本・タイ感染症共同研究センターなどの施設を展開しています。いずれの部門でも、世界的に第一線の研究が行われているほか、若手研究者の育成活動も進めています」と説明する。

    こうした微研の施設の中でも、高度な遺伝子解析技術の共同開発研究や学内外の研究者への解析技術支援を担当しているのが附属施設の遺伝情報実験センター(GIRC)だ。飯田氏は「GIRCには3つの研究部門がありますが、我々が兼任する『感染症メタゲノム研究分野』では、DNAシーケンサーによるゲノム情報解析やバイオインフォマティクスを駆使した研究活動を展開。そのための計算機システムも構築し、学内外の研究者に提供しています」と続ける。

    実は、物理学や天文学などの他のサイエンス分野と比べて、生物学の研究に大規模計算機資源が用いられるケースはそれほど多くなかったのだという。しかしゲノム解析技術の急速な発展により、こうした状況も大きく変わることとなった。「特に決定打となったのが、2000年代半ばに登場した『次世代シーケンサー』(以下、NGS)です。現在では初期のDNAシーケンサーの1万倍以上ものデータが出力されるようになっており、高速・大容量な計算機システムが研究に欠かせなくなっています」と飯田氏は説明する。

    しかも、NGSの進化は現在も続いており、毎年約10倍という驚異的なスピードで性能が向上しているとのこと。大阪大学 微生物病研究所 附属遺伝情報実験センター 特任准教授 中村 昇太氏は「NGSの進化は、ICTの世界で有名な『ムーアの法則』を軽々と上回るほど。必然的に計算機システムにも、より高い性能と大容量さが求められますので、継続的な環境改善を続けていかなくてはなりません」と語る。

    ちょうど2012年に構築した旧計算機システムが更新時期を迎えたことから、同センターでは次期システムの導入に向けた検討に着手。今後の研究活動を支える新たなインフラの構想を練り上げていった。

    •  
    • 大阪大学
      微生物病研究所 
      遺伝情報実験センター
      特任准教授
      中村 昇太 氏

  • ■解決のアプローチ

     

    Dell EMCアイシロンで、PB級の高速・大容量環境を実現

     

    今回の新計算機システムの構築にあたっては、NGSへの対応が最大のテーマとして掲げられた。「前回のシステム更新の際には、分子の動きをシミュレーションする分子動力学計算など、他の研究用途にもある程度幅広く対応できるよう設計を行いました。しかし、近年では、研究者の間でもNGSの需要が飛躍的に高まっています。そこで今回は他の用途はある程度割り切って、NGSに特化した構成を組もうと考えました」と中村氏は説明する。

    ここで重要なポイントとなったのが、システムの中核を担うストレージの選定だ。NGSを研究にフル活用するためには、膨大なデータを確実に保存できるキャパシティと、高いパフォーマンス、柔軟なスケーラビリティが求められる。

    大阪大学 微生物病研究所 附属遺伝情報実験センター 講師 後藤 直久氏は「NGS以前の時代には、我々の管理下にあるシステムのデータ容量は合計で数十TB程度でした。それが現在では、約1.2PBもの容量に膨れ上がっています。しかも新ストレージは、この先5年間にわたって使い続けるわけですから、こうした急激なデータ容量増大にも十分耐えられるものでなくてはなりません」と語る。

    もっとも、いくら陳腐化を防ぐためとはいえ、際限なくコストを投下するというわけにもいかない。次期計算機システム用に確保できる予算の中で、最大限の容量とパフォーマンスを確保する必要があった。

    こうした困難な要件を満たせるストレージとして、公開競争入札を経て導入されたのが、DELL EMCのスケールアウトNAS「DELL EMC Isilon NL410」である。

    「アイシロンは、ストレージ・ノードを追加するだけで性能と容量をリニアに向上させられますので、我々のような使い方にも余裕で対応できます。また、細かくパーティションを区切ってしまうとデータ管理が煩雑になってしまいますが、アイシロンなら広大なストレージ空間をワンボリュームとして扱えます。さらにコストの面でも、一番リーズナブルだったのがアイシロンでした」と中村氏。また後藤氏も「我々の研究ではI/O性能の高さも非常に重要になってきますが、この点でもアイシロンは十分なパフォーマンスを備えていました」と続ける。

  • また、パフォーマンスの面でも、大きな改善効果が生まれている。以前導入していたストレージでは、誰かが大容量ファイルのコピーを行ったりすると、他のユーザーのレスポンスが極端に落ちてしまうことがあった。しかし現在では、こうした問題も完全に解消。中村氏は「おかげで研究中のストレスが格段に減りました。これも全てのノードがNASヘッドとして機能するアイシロンならではの良さですね」とにこやかに語る。

    アイシロンのアプリケーション・ソフトも、大容量データの効率的な運用に貢献。「現在はユーザーデータの保護に『SnapShotIQ』を活用しているほか、『SmartQuotas』についても利用の検討を進めているところです。いくら大容量空間が利用できるとは言え、あまり特定のユーザーが占有するようなことがあると公平性を欠いてしまいます。今後は容量に応じた費用負担の仕組みなども考える必要がありますので、そうした取り組みに役立てていければ」と後藤氏は説明する。

    同センターでは今後もアイシロンを活用し、NGSによる研究をさらに加速させていく考えだ。おそらく多くの新たな発見が、今後も次々と生まれてくることだろう。