元スレメモリはやっぱりECC Part3
メモリ覧 / PC版 /みんなの評価 : ○
1 :
サーバやワークステーションのみならず、PCにだってECCは必要さ!
高品質な部品を集めてPC作る慎重派な君のマストアイテム、ECCメモリについて語りあおう。
■ECCメモリ自体の品質■
例えばTranscendのDDR2は、NON-ECCが6層基板、ECCが8層基板となっている。※
各ベンダや製品ラインでモジュール構成と検品体制は異なるが、以下の様な認識は誤り。
・ECCメモリはメモリ自体でいえばNON-ECCメモリと製品の品質や信頼性は変わらない。
モジュール側はECC用チップを追加しているに過ぎない。
※Transcend Releases 2GB DDR2-800 ECC Unbuffered DIMM
http://www.transcendusa.com/Press/index.asp?LangNo=0&axn=Detail&PrsNo=786
■DRAMのリフレッシュとECC■
DRAMは貯めている電荷を自然に放電しており、放っておくとゼロになり情報を失ってしまう。
電荷が自然に漏れて完全になくなる前に定期的に全セルのプリチャージを行うことで、情報を保持し続け、データ化けを防いでいる。
繰り返し行われるこの一連の充電動作をリフレッシュ=補填と呼ぶ。
Dynamic=動的 RAMと呼ばれる所以は、この様にして常に動き続けているため。
しかしメモリセル≒チップの電荷を保持出来る時間が変動し、リフレッシュが間に合わずデータ化けを引き起こす場合がある。
DRAMの構造上、良品として世の中に出ている全てのチップが潜在的にこの特性を持っている。
更に、経年劣化(特に漏れ電流や接合リークの増加)や、微細化の影響によりリテンション=データ保持特性は悪化する。
(宇宙線のみならず)これに対してもECCは有効。
2 = 1 :
■そもそもECCメモリとは?
ECC(Error-Correcting Code)を記録でき、エラーの検出と訂正に対応したDIMMの事。
但し、エラー検出/訂正処理はメモリコントローラー側が行い、
DIMM側にはECCのハミング符号記録用にDRAMチップが追加されているだけである。
non-ECC DIMMはデータ幅が 64bit であるのに対し、
ECC DIMMは 72bit (データ用64bit + ECC用8bit) 幅のバスで接続される。
この72bitのデータ内で、1bitのエラー(single-bit error)を訂正し、
2bitエラー(Multi-bit Error)を検知できる。
しかし、ミッションクリティカルな用途では通常のECCでは訂正できない多bitエラーに対応する為、
IBM Chipkillテクノロジーに代表される、より強力な多bitエラー訂正技術を備えたものもある。
参考URL
ttp://ja.wikipedia.org/wiki/Chipkill
ttp://thinkit.co.jp/story/2010/07/24/1671
ttp://www.atmarkit.co.jp/fsys/special/001iasvr_basic/iasvr_basic05.html
3 = 1 :
■ECCメモリの利用■
下記①~②が必須。
①. メモリコントローラがECCに対応している。
・INTEL
Nehalem以降
LGA1366 (X58):CPUにメモコン内蔵。XEONのみECC対応。
→対応CPU:XEON 35**, 36**, 55**, 56**, 65**, 74**, 75**
LGA1156 (i34**):CPUにメモコン内蔵。XEONと、例外的に一部の組込向けのみECC対応。
→対応CPU:XEON 34**, Celeron G1101, Pentium G6950
Nehalem以前
LGA775/771:チップセットのMCH (Memory Controller Hub) にメモコン搭載。
→対応MCH:955X, 975X, X38, (X48?), i30**, i32**, i50**, i51**, i54**
・AMD
K8以降はCPUにメモコン内蔵。全CPUにおいてハードウェアレベルでECC対応。
→対応CPU:Athlon64、PhenomII、Opteronなど
②. マザーボードがECCに対応している。
具体的には下記2点を充たしていること。※
・メモリスロットへのECC用ビット配線
→配線が実装されていなければECCは動作しない。(マザーボードのハードウェア側面)
・BIOS
→ECCをサポートしていなければECCは機能しない。(マザーボードのソフトウェア側面)
※マザーボードがECCに対応していない場合は、ECCメモリを差しても全く起動しないか、
若しくはNON-ECCメモリとして動作するので注意。(エラー検知も訂正も不可。)
■各マザーボードメーカーのECC対応■
大雑把な傾向としては下記を参照。
☆ ・TYAN ・SuperMicr●
◎ ・ASUS
○ ・GIGABYTE ・INTEL
△ ・ABIT ・ASRock ・BIOSTAR ・DFI ・Foxconn ・J&W
× ・EVGA ・MSI
■特記事項■
ECC関連の設定可能パラメータの種類はマザーボードで程度差がある。
手抜きマザーボードになると、ECCのON/OFFと、訂正記録をOS上のログに残すことしか出来ない。
理想的マザーボードは各種設定 [4bit ECC (Chipkill チップキル)、
Scrub間隔、L1~L2キャッシュのScrub等] が細かく設定可能。
メモリパフォーマンスと安定性のバランスをユーザーが自由に選択出来る。
5 = 1 :
ママン動作確認報告例
【CPU】Intel Xeon W3680 @ 3.33GHz
【M/B】Intel WX58BP
【Mem】SanMax SMD-12G68EHP-13H-T (4GB x3)
BIOS:
【バージョン】Ver:34 (Date:4/20/2010)
【ECC設定項目】以下の1項目のみ
・Memory Correction <Non-ECC / ECC>
【ECCログ】あり
・ECC Event Logging <Enable / Disable>
【汎用ログ】あり
・Event Logging <Enable / Disable>
Memtest86+:
【バージョン】Memtest86+ v4.10
【Chipset】 Core IMC 32nm (ECC : Detect / Correct) Scrub+ / BCLK : 133 MHz
【Settings】RAM : 666 MHz (DDR3-1333) / CAS : 9-9-9-24 / Triple Channel
【ECC ModeのOn/Off】可
6 = 1 :
★参考文献★
The Benefits of Chipkill-Protect for PC Server Main Memory
http://ece.umd.edu/courses/enee759h.S2003/references/ibm_chipkill.pdf
ECCメモリについて
http://www.hpc.co.jp/hit/B-Memory/ECCMemory.html
メモリ技術(冗長性、信頼性)解説
http://www.nec.co.jp/products/express/tech/memory/index.shtml
Memory scrubbing
http://en.wikipedia.org/wiki/Memory_scrubbing
メモリスループットとECC設定
http://www17.ocn.ne.jp/~midou/zakki/sk8n01_03.html
ECC RAM Performance
http://www.buildyourown.org.uk/forums/topic.asp?TOPIC_ID=16274
LSIに対する宇宙線の脅威
http://journal.mycom.co.jp/articles/2008/08/22/dsn/menu.html
DRAM Errors in the Wild: A Large-Scale Field Study
http://www.cs.toronto.edu/~bianca/papers/sigmetrics09.pdf
DRAM error rates: Nightmare on DIMM street
http://blogs.zdnet.com/storage/?p=638
DRAMのエラー発生率は従来考えられていたよりずっと高い?
http://slashdot.jp/hardware/09/10/09/0134220.shtml
Googleサーバのメモリはエラーが多いか?
http://www.geocities.jp/andosprocinfo/wadai09/20091017.htm
CENTURY MICROメモリー解説イベント
http://blog-pcparts.coneco.net/one/coneco4_66.html
ASUS COMPUTEX Japan 2009
CPUソケットの中央から、メモリスロットの両端までの距離を等しくし、全体の配線長をできる限り短くした「Golden Symmetry」
7 = 1 :
前スレから適当に引っ張ってきたテンプレは以上になります。
安鯖でECC使ってるけどやはり良い。
そりゃ値段は少々高いが、自身これで外れメモリ掴んだ経験がゼロだし、
MEMTESTで洗わなくてもメモリエラーに気づけるのはでかい。
PC方面からECCを追い出そうとしてるIntelの動きが気に食わんが、
チップセットやBIOS的なトコで元々恵まれてたわけでもないからあんま状況は変わってないような。
もっと販路を! 以上スレ立てでした。
8 = 1 :
前スレ
メモリはやっぱりECC Part2
http://hibari.2ch.net/test/read.cgi/jisaku/1261291017/
初代スレ
【Transcend】メモリはやっぱりECC【 SuperTalent】
http://pc11.2ch.net/test/read.cgi/jisaku/1227278105/
9 :
やっぱりメモリは欧州共同体だよな
10 :
英会話?・・・いや、缶コーヒーかな
11 :
たしかに近年のインテルはECC排除ですね。
13 :
PC-9801の時代なんてパリティー付きメモリモジュール当たり前だったもんな
PC/AT互換機が入って来るようになってから、高コストで悪者扱いされて消えてしまった
15 :
そいつの顧客がかわいそう
19 :
Xeonしか見えないから大丈夫
29 :
おいィィィ?
31 :
pdfマニュアルにはきちっとECC対応が謳われてる
そのマイアミ支部の輩が無能どもなだけだろ
改めて台湾本社にしっかり問い合わせろ
32 :
どっちを信じたらいいんだい
35 :
人柱になればいじゃない
36 :
BIOSTARスレを見ているとこのメーカーはいまいちだな
MBは見るだけならなかなかよさげだが中身は…
所詮二級ブランドか
38 :
いや、ろくにまともな回答が来ない3流メーカーよりよっぽどマシだと思うぜ。
44 :
あの価格帯じゃもうしばらくエルピ次世代チップは無理じゃないの
47 :
そういう働きかけをAMDがやればいいんだけどねぇ。
MSは以前から推奨してるわけだし、AMDは以前からECC対応してるのを宣伝として使えるし、
パッケージにECC対応と大きくロゴ追加する程度で安価にすぐ対応出来るだろうに。
48 :
>>47
>AMDは以前からECC対応してるのを宣伝として使えるし、
下手に「Intelが下位にもECC対応したから、もうIntel買えばいいだろ」という世界
を作ってしまうのはAMD自身にとっては損でしかないのでは?w
現在、安くECC対応できる選択肢がAMDの独壇場であることは、AMDには有利。
49 :
電力パフォーマンス的にもサーバみたいにまったりダラダラ稼働し続けるマシンに最適だしなぁ、AMDは。
AMDがECCはオプだけですとかやり出したら組み込みが逃げていよいよ潰れるだろうから、たぶんやんないだろしね。
50 = 49 :
>>46
スゲー同意。
今でだってメモリが原因で落ちるマシンは各所にあるからねぇ。
自作とかだと、メモリの刺しすぎでマザーの電力供給能力が不足してブラウンアウトしたり、
熱密度が高くなりすぎてエラー出したりってのは、
5年保証とかの一見まともなパッケージ買ってきてもけっこー起こる。
ECC付いてりゃこの辺の異常は即刻追っかけられるし、WindowsなどOSが気付くことが出来る。
今も昔も糞みたいなバルク買わなきゃ大丈夫って時代じゃねぇし、
未だに不安定の理由をMicrosoftに押しつけるアホが居る事考えると、
ECCをパフォーマンス指標のゲタにするのは理にかなってると思われ。
そりゃあ反エコロジーで反エコノミーだろうけど、ECCを標準にしようぜと心底思う。
メモリエラーで文句言われる対策にWindowsにメモリテストツール添付とか、
元々あんなん詳しい奴しか分からんし、
そゆのに興味持ってる奴はとっくにMEMTEST86使ってるワケで。
ああ、もっとECCを!
非ECC仕様が激安PCとかオーバークロッカー向けとかのニッチ向けになって欲しいくらいだ。
みんなの評価 : ○
類似してるかもしれないスレッド
- メモリはやっぱりECC Part2 (984) - [96%] - 2010/8/21 8:23 ○
- メモリはやっぱりECC Part4 (1001) - [96%] - 2013/3/3 13:00
- メモリはやっぱりECC Part8 (127) - [96%] - 2023/1/8 13:00
- メモリはやっぱりECC Part7 (1002) - [96%] - 2022/6/24 20:02
- メモリはやっぱりECC Part6 (1005) - [96%] - 2019/2/5 2:46
- メモリ16Gも積んでる奴って (75) - [42%] - 2014/2/22 23:00
トップメニューへ / →のくす牧場書庫について