トラブルシューティングログ:増設メモリのCRCエラー
1. 事象の概要
ヤフオク等で調達・増設した中古メモリ(DIMM)において、運用開始後まもなくiRMC S5にてステータス異常を検知。最終的に該当モジュールが完全に「故障」と判定され、システムから隔離された。
2. タイムラインとiRMC S5の検知挙動
① 初期検知:ステータス「警告(Warning)」
- ログ内容: メモリのCRCエラー(巡回冗長検査エラー)が許容閾値を超過。
- システムの挙動: 警告が出た段階で、該当のメモリはBIOS上でFailと認識。OS上では認識されず、使用不可の状態となった。
- 原因推測: データの転送エラーが多発したため、iRMCおよびUEFIがシステムの致命的なクラッシュ(OSハングアップ等)を防ぐために、対象DIMMを自動的に「マップアウト(無効化)」隔離したと思われる。
② 最終段階:ステータス「故障(Failure / Critical)」
- ログ内容: コメントなし(完全に無応答、またはハードウェア不揮発性エラー)。
- システムの挙動: 完全に「故障」マークが点灯。
- 結果: 対象モジュールの永続的な不具合(経年劣化による寿命)と断定。

3. 中古パーツ採用における考察と対策
enterprise向けサーバー(PRIMERGY RX2540 M4など)は、一般のデスクトップPCに比べてハードウェアの自己診断・保護機能(iRMC等のBMCやECC/CRCチェック)が非常に厳格である。そのため、わずかな劣化や相性問題でも弾かれるケースがある。
今後のアクションプラン
- 代替パーツの選定: 新しくヤフオクで買うかどうか・・・お財布と相談です。
- なしのままで行く: 買わなくてもメモリは十分足りている。スペック厨としては載せたい。