サーバ用電源の「冗長運転」って、そもそもナニ?

はじめに

「冗長(じょうちょう)運転」とは、同じ役割の電源を“余分に”用意して並列に動かし、どれかが故障してもシステムを止めずに動き続けられるようにする設計のことを言います。データセンターやサーバでは、止まる=サービス停止=大損失につながるため、サーバの信頼性を高める一般的な手法です。

わかりやすく例えると・・・

  • 電源を「エンジン」、サーバを「バス」と考えます。
  • バスを走らせるのにエンジン1基で十分でも、もう1基を積んでおけば、片方が止まっても走り続けられます。
  • これが「冗長」。必要台数+予備台数でチームを組ませるのがポイントです。

冗長運転の基本用語

  • N+1:必要台数Nに対して“予備1台”を追加した構成(例:2台必要なら3台で運転)。コスパ良し。
  • N+N(2N):必要台数と同じ台数をまるごと予備側に用意(例:2台必要なら+2台=計4台)。耐故障性がさらに高い。
  • 電源並列運転:複数のAC/DCを同一出力(例:12V)に束ねて同時に供給。
  • 負荷分担(シェアリング):並列電源で電流を上手に分け合う仕組み。ドロップ式/アクティブ式などがある。
  • ORing(オーリング):片方が故障しても逆流や巻き込みを防ぎ、良品側だけが負荷を持つための“電気の逆止弁”。ダイオードやMOSFET(理想ダイオード)が使われます。
  • ホットスワップ:サーバ電源を動作中に抜き差しできる仕組み。バックプレーンやコネクタ、保護回路で実現。

メリットは?

  • 高可用性:1台ダウンでもサービス継続。サービス品質やアップタイム目標を守りやすい。
  • 計画保守がラク:動かしながら交換・増設が可能(ホットスワップ)。
  • 余裕運転で長寿命:各電源の負荷率が下がり、発熱やストレスが減る場合が多い。
  • 拡張性:将来の消費電力増に合わせてモジュールを追加できる構成も。

冗長運転の具体例

例1:N+1(必要800W、電源モジュール600W×2台)

  • 平常時:2台で分担。各400W程度を供給(負荷率約67%)。
  • 片方故障:健在の1台(600W定格)が800Wをまるごと支えられない=NG。
    → この例は定格不足。N+1は「残りで必要電力を満たせる」ことが必須です。

例2:N+1(必要800W、電源モジュール1200W×2台)

  • 平常時:2台で各400W(負荷率約33%、発熱小さめ)。
  • 片方故障:残り1台で800Wを単独供給可。サービス継続=OK。

例3:N+N(必要1.2kW、1.2kW×2群=合計2.4kW)

  • 片系統丸ごと故障でも、もう片系統だけで必要1.2kWを供給可能。
  • 配電経路(AC系統やブレーカ)も二重化するのが定石。

ポイント:冗長は「台数」ではなく「残存能力」。故障時に“残った側だけで必要電力・電流を満たせるか”で判断します。

実現方法は?

方法概要
ORing素子ダイオードORing:シンプルだが電圧降下・発熱が大きい。 MOSFET(理想ダイオード)ORing:低損失で高効率。逆流防止と高速切替に優れる。
負荷分担(Current Share)  ドロップ特性式(自然分担):出力電圧にわずかな“傾き”を持たせ、流れやすい方から自動的に分担。簡単で堅牢。 アクティブシェア(Share Bus/PMBus連携):各電源が通信/アナログ線で協調し、分担精度を高める。高出力・高密度で有利。
ホットスワップと保護  限流・突入電流抑制、逆流防止、サージ対策、過電圧/過電流/過温保護。 バックプレーン上のシーケンスで「安全に抜き差し」できる。
監視・制御(アラーム/PMBus等)風量低下、温度上昇、ファン故障、ORing開放、出力低下などを検出して通知。 ロギングにより、予兆保全(ファン劣化や温度ドリフト)に活用。

故障するとどうなる?

  • 片方の電源が停止 → ORingが逆流を防止 → 健全側の電源が瞬時に電流を肩代わり。
  • 出力電圧は規定内を維持(過渡応答の設計がカギ)。
  • 管理ソフトは「PSU1 FAIL」「冗長性喪失」などのアラートを出し、交換を促す。
  • ホットスワップで故障モジュールを交換 → 自動的に再並列 → 冗長性復帰。

よくある誤解と落とし穴

誤解の例説明
冗長=無限に安心?共通要因故障(同一系統のACブレーカ、同一ラックPDU、同一部屋温度)が残ると一網打尽のリスク。配電と冷却の二重化が重要。
定格の読み違い「12V 100A」と書いてあっても、環境温度・高度・エアフロー条件でディレーティング(出力低下)が発生。故障時の“片系運転”をその条件でも満たせるか要確認。
共有ケーブル・コネクタの抵抗配線抵抗が偏ると分担バランスが崩れ、片側過負荷→保護動作→ループに陥ることも。ケーブル長・太さを合わせ、接触抵抗を管理。
突入電流・ブレーカトリップ同時投入で大きな突入電流が流れると上位ブレーカが落ちる。投入シーケンスやソフトスタート、遅延を設ける。
異機種混在の並列出力特性やシェア方式が合わず不安定に。基本は同一型番・同一リビジョンで揃える。
最低負荷・過渡応答の見落としごく低負荷での安定性、負荷急変時の電圧ディップ/オーバーシュートも事前検証が必要。

選定のコツ(チェックリスト)

  • 必要電力(ピーク/平均/将来拡張)と“片系運転”時の余裕(ディレーティング込み)
  • ORing方式(ダイオードかMOSFETか)、逆流保護の有無と損失
  • 負荷分担方式(ドロップ式/アクティブ)、シェア精度、シェアバス互換性
  • ホットスワップ性能(定格、抜き差し寿命、ガイドピン、先行接点)
  • 保護機能(OVP/OCP/OTP、突入制御、サージ耐量)
  • 監視・通信(アラーム信号、PMBus/SMBus、テレメトリ:電圧・電流・温度・ファン)

合わせて読みたい

  • 物理仕様(フォームファクタ、コネクタ、エアフロー方向、騒音)
  • 信頼性(MTBF、実地実績、ファンの冗長/交換性)
  • 安全規格・EMC効率(80 PLUS等)と運用環境(温度/湿度/高度)

合わせて読みたい

評価・試験のすすめ

初心者の方でも、次の観点を押さえると“冗長が本当に効くか”を確かめられます。

負荷分担の確認  直流電子負荷を使い、段階的に電流を上げながら各PSUの出力電流を記録。分担が偏りすぎていないかチェック。
過渡応答(負荷急変)  10~50%のステップ負荷を与え、電圧ディップやオーバーシュート、回復時間をオシロで測定。故障時の肩代わりでも規格内か確認。
片側遮断テスト  片方のPSUを意図的に停止/取り外しして、もう片方が無停止で担えるか、アラームは正しく出るかを確認。
ORingの動作確認故障側への逆流がないか、ORing素子の発熱・電圧降下を測る。MOSFETならドロップは小さいはず。
環境試験  高温時、吸気塞ぎ、ファン劣化を想定した条件での冗長性維持可否。突入電流と上位ブレーカ協調も併せてチェック。
監視・ログo         PMBus等で電圧・電流・温度・エラーコードを取得し、トレンド化。予兆保全に効果的。

FAQ

QA
冗長を入れると効率は下がる?平常時の負荷率が下がる分、個体の効率カーブ次第では若干下がることも。ただしMOSFET ORingなど低損失化で影響を抑えられます。
何台並列が現実的?2~3台が一般的。台数が増えるほど分担設計と配線管理がシビアになります。大電力は“モジュール大きめ×少台数”が扱いやすい傾向。
ACも冗長化すべき?はい。PSUだけでなく、AC系統(別系PDU/別相/別UPS)まで二重化すると共通要因故障に強くなります。

まとめ

  • 冗長運転は「必要能力を満たしつつ、1台(または1系統)失っても止まらない」ための並列・予備設計。
  • カギは「ORingで切り離す」「正しく負荷分担する」「片系でも能力を満たす」の3点。
  • 選定では“残存能力”“配電/冷却の二重化”“監視・保守性”まで含めて考える。
  • 評価では直流電子負荷+過渡試験+片側遮断で、実運用の強さを事前に確認。

「冗長」は“余分”ではなく、“止めないための必需品”。基礎を押さえれば、初心者の方でも要点を見極められます。まずは必要電力と片系運転時の余裕を計算し、最小限の構成から確実に固めていきましょう。

関連情報