データセンタ&オープンコンピュート
OCP(Open Compute Project)とは増大するデータセンタの需要に対し、効率的なハードウェアの仕様や設計のオープンソース化を進めるコミュニティーのことです。OCPの仕様や設計に準拠したハードウェアは、大規模データセンタに高い処理能力と経済性、さらに消費電力量の低減をもたらすといわれています。ここでは、データセンタの需要拡大の背景やデータセンタが抱えるいくつもの課題、そしてOCP準拠のハードウェアが解消するデータセンタの課題について紹介します。
ITの利活用は日々拡がりと進化を続けて、ニーズは多様化しています。このような状況の中、ネットワークに接続された端末に対し、さまざまなサービスを提供するサーバやネットワーク機器などのIT機器を収容した施設がデータセンタです。ここでは、データセンタの需要が拡大した背景を紹介します。
データセンタの需要拡大には、クラウドサービス利用の増加が影響しています。クラウドサービス利用の増加の原因には、オンラインビジネスの拡大、スマートデバイスの増加やソーシャルメディアの活用などが挙げられます。また、クラウドストリーミングやクラウドゲーム、そしてIoTデバイスからのデータ収集などは多くの場合クラウドサービスによって提供されます。これらの状況に対応するには大容量のデータを送受信し処理する必要があり、データセンタ需要拡大の主な要因となっています。
AIデータセンタとは、人工知能や機械学習などAIサービスを提供するデータセンタのことです。AIサービスを提供するAIデータセンタは高速なネットワークや並列処理能力、大容量メモリなどAI処理に特化した設計になっています。特に生成AIでは学習量が多いほど精度や品質が向上するため、大量のデータを学習させる大規模言語モデル(LLM:Large Language Model)が必要となります。LLMの構築には大量の学習用データに対し類似した演算を繰り返さなければなりません。このような演算処理はGPU(Graphics Processing Unit)によって行われます。さらに低遅延と高速処理を実現するために、専用のハードウェアであるAIアクセラレータを搭載していることが一般的です。近年、生成AIのビジネスへの活用は拡大しつつあり、AIデータセンタへの需要が高まっています。
クラウドサービスやAIサービスなどを提供するデータセンタの設備は、長期的に安定して正常稼働を維持できなければなりません。なかでも電力を供給する電源設備は重要であり、必要な電源容量に対して高い設備使用率で無駄のない電源システムの構築が求められます。ここでは、データセンタの電源システムが抱える課題について説明します。
データセンタでは、サーバの高性能化によりTDP(Thermal Design Power)*1の増加、さらにIT機器の搭載密度が高まったことで、単位面積あたりの発熱量の急激な上昇が続いています。特にGPUやAIアクセラレータを搭載するAIサーバは大きな電力を必要とし高発熱化する傾向にあります。高密度化や大電力化による排熱問題はサーバの故障や誤作動のリスクを高めるため冷却が不可欠です。しかし冷却設備の増設や、冷却設備の運用に必要な電力消費が増加し、それに伴う運営コストや環境負荷が大きな課題となっています。
*1 TDP(Thermal Design Power):最大消費電力時の熱量。
データセンタでは、IT機器の稼働により局所的に温度が上昇するホットスポットという現象が課題となっています。ホットスポットのみを限定して冷却できない空調システムでは、データセンタ全体を冷却するしかなく、その結果余計な電力を消費することになります。ホットスポットを放置すると、サーバの性能低下や故障のリスクも高まります。
確実かつ継続的なサービスを提供するデータセンタの電源設備では停電や瞬断は許されません。高品質かつ高信頼の性能が求められるため、商用電源の停電・瞬断・電圧変動や保守・増設工事・故障時においてもデータセンタが継続的に運用するための高いメンテナンス性が必要です。しかしIT機器を高密度に配置した結果、配線が密集しメンテナンス性の低下を招いているという課題があります。
データセンタでは、サーバの増加により空調や電源設備の容量が追いつかず、ラックを追加することが困難となるケースが発生しています。また、サーバが集中したラックでは、設備に余裕があっても床荷重が増大し、建物の構造上、追加で設置できないケースも少なくありません。そのため、効率的な空調システムの選定や、屋外設備の配置計画を慎重に検討する必要があり、スペース不足が深刻な課題となっています。
排熱やホットスポットの冷却、メンテナンスやスペースの不足といった課題を、OCPに準拠した電源システムがどのように解消するのかについて説明します。
OCPに準拠したデータセンタのラックには、OCP仕様の21インチのオープンラックが使われます。従来の19インチラックに対し、21インチラックでは1ユニットの高さが高くなっています。これにより、ラック内に搭載できるサーバ、ストレージの台数を増やすことが可能となり省スペース化に貢献します。なお21インチラックでは、19インチラックと区別できるように「1OU(Open Unit)」という単位となっています。
サーバの過熱を防ぐには、高い排熱性が欠かせません。従来の分散型給電システム(図1)を集中給電システム(図2)にすることで、大きな熱源である電源部とサーバを分離し、それぞれの最適な温度管理が可能になります。特にGPUやAIアクセラレータによる高発熱化が懸念されるAIサーバにおいてOCPの最適な温度管理はサーバの排熱性の向上に有効です。
また、サーバの冷却方法は空調冷却が一般的ですが、この方法は冷却能力の限界が指摘されています。そこで近年ではより効率の良い冷却方式として、特殊な液体(非導電性の誘電性液体)にサーバを浸し冷却する液浸冷却が注目されています。
集中型給電システムは、より変換効率の高い負荷領域でシステムを動作させることができるため、全体として電源を高効率で稼働することができます。また、サーバだけでなくクーラント分配ユニット(CDU:Cooling Distribution Unit)にも同時に給電することが可能です。これにより、ラックの消費電力量を抑制することができ、データセンタの運用コスト削減につながります。また限りがあるデータセンタの電力容量に対し、より多くのサーバを投入できるといったメリットもあります。
OCPに準拠したサーバやストレージは、メンテナンス時の操作性を配慮した設計になっています。サーバには電源ケーブルがなく、ラックの電源バー(バスバー)に直接サーバを接続し給電する構造となっています。これにより、ラックへの装着と同時に電源供給できる状態になり、配線の取り回しも簡潔にまとめることができます。また、嵌合位置の確認ができない場合でも正しく嵌合できるブラインドメイトプラグを使うことも可能です。このようにメンテナンスに配慮した設計となっているため設備保全作業の負担を軽減し、安定した稼働の維持に貢献しています。
データセンタでは、高効率な電源システムばかりではなく、高い排熱性能やメンテナンス性、さらに省スペース性といった機能が求められており、OCPはこれらを実現するための技術です。
村田製作所のOCPに準拠した集中電源システムでは、小型化かつ省スペースで高い電源効率を実現したエネルギー密度の高いPSU(Power Supply Unit)を採用しています。これにより、排熱処理の効率化にも貢献します。またホットスワップが可能なので、さまざまなトラブルからのすみやかな回復が可能です。パワーシェルフは19インチや21インチに対応しており、多様なサイズのIT機器を格納することができます。Delta/Wye/Singleといった入力にも対応しており、さらに入力ケーブルやPDU(Power Distribution Unit)、マウントキットなどアクセサリ類も豊富なため、さまざまな環境で設置することが可能です。
これらはOCPのメリットを最大限に活かすと同時に、データセンタの電源システムが抱えるさまざまな課題を解消することができる機能であり、OCPは増大するデータセンタの需要を支える重要な取り組みであると期待されています。