のくす牧場
コンテンツ
牧場内検索
カウンタ
総計:127,643,626人
昨日:no data人
今日:
最近の注目
人気の最安値情報

私的良スレ書庫

不明な単語は2ch用語を / 要望・削除依頼は掲示板へ。不適切な画像報告もこちらへどうぞ。 / 管理情報はtwitter
ログインするとレス評価できます。 登録ユーザには一部の画像が表示されますので、問題のある画像や記述を含むレスに「禁」ボタンを押してください。

元スレIntelの次世代CPUについて語ろう 40

Intel スレッド一覧へ / Intel とは? / 携帯版 / dat(gz)で取得 / トップメニュー
スレッド評価: スレッド評価について
みんなの評価 :
タグ : 追加: タグについて ※前スレ・次スレは、スレ番号だけ登録。駄スレにはタグつけず、スレ評価を。荒らしタグにはタグで対抗せず、タグ減点を。
レスフィルター : (試験中)
←前へ 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 次へ→ / 要望・削除依頼は掲示板へ / 管理情報はtwitter
552 : Socket77 - 2009/09/13(日) 13:39:59 ID:tMhawENg (+24,+29,-65)
>>549
x86は以前としてFP系の方は苦手だ。全体的に速いから結果的に勝っているだけ。
x86が何故整数だけでなくFPも高速かというと、FPユニットに力をいれているからっていうより
内蔵キャッシュが強力で、クロック高めってだけ。仮にx87に限定しても最速の可能性はある。
554 : Socket77 - 2009/09/13(日) 14:56:48 ID:AvzXJDPq (+8,+23,-6)
・・・よん?
556 : Socket77 - 2009/09/13(日) 16:03:11 ID:tMhawENg (+28,+28,-20)
スカラFP対決にきまってるだろ。
SIMDはまた話が別だ。もとからx87にないしな。
557 : Socket77 - 2009/09/13(日) 16:04:43 ID:tMhawENg (+0,+1,-32)
つーか、SPEC CPUの結果はSIMDつかってないからなあ。
それであんだけいけるってことはx87でもトップレベルだろう。
558 : Socket77 - 2009/09/13(日) 16:11:56 ID:tMhawENg (-24,-29,-101)
ちなみに当時のPentium 4時代のSPEC CPUをみれば
SSE2で劇的に性能がのびたことはないのがわかる。
せいぜい10-20%程度の世界だったよ。
x86がFPでも最速クラスになったのは、RISC/IA63が相対的に弱体化したことと
地味にFPの実装を改善していた徐々にスコアが伸びていったことによる。
SIMDは関係ないし、SSE2以降のスタック廃止の成果も大きくはない。
561 : Socket77 - 2009/09/13(日) 18:28:37 ID:p/olwFQy (+27,+29,-19)
GPGPUはなんつーか特定の使い方を強制するからなぁ。
汎用性はない。これで整数も並列で高速だったらまだよかったけど。
562 : Socket77 - 2009/09/13(日) 18:44:13 ID:tMhawENg (-21,-30,-275)
http://www.nminoru.jp/~nminoru/memo/spec/spec_cpu2000.html
あまりSPEC CPUで最近まとまってるソースはしらないが、
とりあえずここをみるだけでも、実装の方がはるかに重要だとわかる。
例えばint/fpのスコア比は、Pentium 4やAthlon/Opetronではほぼ1対1であるが、
Pentium IIIではfpのスコアが小さい。しかし、SSE2があるDothanでもPentium III
よりましであるものの劇的に改善されているわけではない。後継のYonahではかなり改善されている。
スタックアーキテクチャではないFPUをもつRISCでもスコア比が2倍のものから
PPC G4のようにfpのスコアがやたら低いものもある。
fpがメモリ帯域依存といっているのは確かにそういう傾向はあるが、
キャッシュに依存している部分も大きい。
また、レトロなx87ベンチであるSuperPIでは、Core 2/NehalemはAMDよりも速い。
563 : Socket77 - 2009/09/13(日) 18:46:46 ID:tMhawENg (+26,+29,-54)
というわけで、x87の時のx86が極端に悪く、
SSE2導入から極端によくなったというわけではない。
実装の改善の方が命令セットの問題よりも遙かに大きいわけで、
これはコードといくらにらめっこしていても、より大域的な視点で実測データをみていかないと
わからない話である。
565 : Socket77 - 2009/09/13(日) 19:03:55 ID:tMhawENg (+26,+29,-158)
>>564
Yonahはその通り、結局実装なんだよな。

SSE2でスタックを廃止したおかげでFMAとかを導入できたり、回路実装しやすくなったり
最適化コンパイラを作りやすくなったり、という設計上の2次的なメリットはあるというか、
むしろそれが目的なんだろ。ある時点で、x87とSSE2とで所要クロックを比較したら差が出た程度では
移行のメリットの本質はわからない。
元々x87にある命令と同等の命令をSSE2置き換えても、実行ユニットが同じである手前、
実際の所、劇的な改善はない。
566 : Socket77 - 2009/09/13(日) 19:12:20 ID:Es+knxil (-28,+29,-19)
>>557
それは知らんかった。今まで、SIMD使っての結果だとばかり思ってたよ


569 : Socket77 - 2009/09/13(日) 19:22:08 ID:tMhawENg (+25,+29,+0)
スカラ/ベクトル
SISD/SIMD
の効果は別個に考えて欲しいな。
SIMD/ベクトルは汎用演算よべるものじゃないし、これを容認したら何でも有り。
SPEC CPU専用の命令と半チートユニットを追加したものが勝ちだ。
基本はFP性能といったら暗黙の了解でスカラFP。
SIMDや特定用途向けハードまでいれると何が優れているのかよくわからなくなる。

>>567
AVXはSIMDの効果がメインだろ。命令エンコーディングは後藤が騒いでいるが、
おまけの効能しかないし、これでx86が生まれかわるみたいな大げさな代物では到底ないのはわかるだろ。
一方で、SIMDとは関係なくFPユニット周りが増強されているのならば、
既存のSSEコードも再コンパイルなしで速くなるし、再コンパイルすれば更に速くなる。
しかし、Sandy Bridgeの本領を評価するにはやはりバリバリAVXと新しいポート構成に最適化された
アプリで評価する必要がある。そんな感じだろ。
570 : Socket77 - 2009/09/13(日) 19:24:07 ID:tMhawENg (+29,+29,-63)
自動SIMD化なんて使われるようになったのは最近の話だし、
まだまだ影響軽微だな。個人的にはわけがわからなくなるからSIMDは禁止にするか、
明確に別ジャンル化してほしいものだ。
572 : Socket77 - 2009/09/13(日) 20:00:56 ID:lZW/KYYS (+32,+29,-93)
自動SIMD化というのはこういうもののこと?

>ループを解析して可能であれば SIMD 命令を使って
>ベクトル演算をするようにコンパイル

こういう事なら80年代からスパコン用コンパイラでやってるけど
575 : ,,・´∀`・, - 2009/09/13(日) 22:38:49 ID:XYtvuRLk (-15,+29,-134)
Sandy Bridgeは旧来SSEも遅くしちゃいけないしAVXも対応しなきゃいけないので
デコーダのロジック部はかなり膨れあがってると思うよ。

文字通りSSEからAVXへの「Bridge」だからな。

んで、主要アプリのAVX移行が完了したあたりでSSE*を切り捨てるだろう。

もちろんいきなり使えなくなるんじゃじゃなくて、デコードの高速化のためのロジックを弱体化させるだろう。
具体的にはプリフィクスの長さ分だけストールするようになる、なんてことが考えられる。

旧来命令の切り捨てってのは繰り返してきたことだからな
P6で16ビットコードが遅くなったりもした。
576 : Socket77 - 2009/09/13(日) 22:39:53 ID:tMhawENg (+27,+29,-86)
>>571
幾何平均だからむしろ一部のベンチでスコアを伸ばしても影響軽微なんだろ。
SPEC CPUで自動ベクトル化されたスコアが登録され始めたのは比較的最近。
まあ元の話は自動ベクトル化どうこうではなくて、
x87と非SIMDのSSEで性能に大差がないって話だけどね。>>562を見ればわかる話。
577 : Socket77 - 2009/09/13(日) 22:56:32 ID:tMhawENg (+34,+29,-134)
自動ベクトル化のスコアはここ数年で登録されるようになったけど、
所詮、最低SPEC CPUベンチ特化でSIMDコードがはきだせれば高スコアがねらえるので、
自動ベクトル化を標準ベンチで認めるのはCPU、コンパイラ双方の実力をわかりにくくする
だけで個人的には反対だ。
極端なハイスコアをあげているのは自動マルチスレッド化の方が顕著だけど、
次バージョンでは評価の枠組みを整理し直して欲しいな。
578 : ,,・´∀`・, - 2009/09/13(日) 22:58:36 ID:XYtvuRLk (-25,+29,-3)
ベクトルコンピュータ否定ですか?
579 : Socket77 - 2009/09/13(日) 23:04:45 ID:tMhawENg (+34,+29,-186)
SPEC CPUの評価方法の話だろ。
自動ベクトル化、自動マルチスレッド化を有効にしたスコアは専用の項目にわけるべきだよ。
まあ、最近のマルチコアやサーバ用CPUのSIMD強化ブームをみる限りでは
黙っていても次のSPEC CPUがあるのなら整備されるのではないかと。
今のSPEC CPUの枠組みでは、自動ベクトル/マルチスレッド化は正当に評価できん。
高々十数種類しかない決まったソースコードで最適化できりゃいいからな。
実アプリに広範に対応できるような自動並列の技術はいらなくてもどうにでもなる。
580 : Socket77 - 2009/09/13(日) 23:19:19 ID:lZW/KYYS (+19,+21,-33)
SPECは元々自分のソースを走らせる人間が参考にすべきベンチで
バイナリで買うソフトの参考としては疑問がある
581 : Socket77 - 2009/09/13(日) 23:37:22 ID:tMhawENg (-24,-29,-268)
どんなベンチにも限界はあるだけど、
ただ対処できる最低限のことに対処できていないから問題なんだな。
これまで汎用CPUにおけるSIMDは、おまけ機能の話だったのが、
最近になって、マルチスレッドと並ぶ、CPUの高速化の主役としてまじめな取り組みになってきたことに
SPEC CPU側の対応がおいついてない感じ。
SPEC CPU以前はDhrystoneやWhetstoneといったもっと出来の悪いベンチや理論MIPS値で
異なるアーキテクチャ間の性能比較が語られていたのだが、
ベンチマークも常に進歩する必要がある。
まあもっと酷いのがSPEC CPUのrate。
同じSPEC CPUのプログラムをスレッド数分起動しただけの手抜き作なのに、サーバ用CPUでマルチコアが普及してからは、
むしろrateの値が語られることが多くなってしまった。次期バージョンではマルチスレッド/スループット
評価用ベンチは全く見直されること必至だろう。
583 : Socket77 - 2009/09/13(日) 23:46:08 ID:tMhawENg (-25,-30,-67)
SPEC CPUはサーバサイドじゃなくてEWSだろう。
PC向けとしては使わないアプリばかり。
RISC EWSが全盛をきわめたときがSPEC CPU自体も華だった。
サーバはやっぱTPC系。SYSmarkはシステムに依存してるから、異なるアーキテクチャの比較には使えない。
586 : Socket77 - 2009/09/13(日) 23:53:40 ID:tMhawENg (+29,+29,-47)
ああ、SAPがあったか。
実際の所、SPEC CPUは、RISCが生きていた時代には新しいCPUが出るたびにチェックしてたけど
2006以降は全くといっていいほど見てないな。マルチコアでわかりにくくなったってのもあるが、
x86以外がかなり壊滅したから他アーキテクチャに興味が薄れたってのもある。
587 : Socket77 - 2009/09/13(日) 23:59:01 ID:IU1FyGU9 (+4,+19,-29)
SSEに最適化はおそろしく面倒臭い
588 : Socket77 - 2009/09/13(日) 23:59:42 ID:tMhawENg (+29,+30,-119)
ぶっちゃけ、新しいCPUがでると、ありとあらゆるベンチマークを走らされて、
世界中のオタクの厳しい評価の目にさらされ、数%の速度差にまで原因に議論が及ぶ
PC向けCPUが一番性能評価の結果が信用できる。
それに比べると未だに理論flopsみたいな過去の遺物をベースに語られるHPCなどは、
実は全く客観的評価の信用ならないジャンル。
593 : ,,・´∀`・, - 2009/09/14(月) 00:44:55 ID:7XYdvvzk (-19,+20,-153)
無いな。
ただこれまでにも商用ソフトのいくつかはライブラリ経由で透過的にSSEを使ってるから
それなりに効果はありそうだけどね。

たとえばSSE4.2のテキストサーチAPIはかなり恩恵が大きい。
Webサーバだったり高級言語のインタプリタに実装されればかなり性能向上が期待できる。

あと、CairoとかImageMagickとかの腐れプログラムがSIMD対応改善してくれると
オープンソースアプリも含めてすっげー恩恵受けるんだが
594 : Socket77 - 2009/09/14(月) 01:11:38 ID:zVlYa+o5 (-15,+29,-67)
なるほど
The free lunch is overってのが
SandyBridgeでは加速するのか

でもこのままマルチコアとSIMDで
お茶を濁すだけでは先が行き詰るのは
見えてるからなんとかしないと
マズいのでは、となんとなく思う

シングルスレッドでも性能上げるなら
投機的マルチスレッディングだ、ってのを
どこかで見た覚えもあるけど立ち消えに
なっちゃったし今後どうするんだろうね
596 : Socket77 - 2009/09/14(月) 01:23:06 ID:kPUAlzJA (+63,+19,-21)
>>592
別にこれで納得しろと言うつもりはないがこんなハードらしい

CPUは90nm 400mm2 2GHz、ピン数はべらぼう、
メモリはこんなん
597 : Socket77 - 2009/09/14(月) 01:45:52 ID:kPUAlzJA (+36,+29,-9)
>>596
おや? 数えてみたらピン数大したことないな
2004年のパソコンCPUよりは多いけど
598 : Socket77 - 2009/09/14(月) 04:25:37 ID:V6Vt4THg (+30,+30,-64)
しかし、フリーランチが終わるとなると、旧命令の切り捨ても迂闊には出来なくなるな
今までは、切り捨てとは言っても一時的な落ち込みで、長い目で見たら確実に高速に
なっていった訳だが、今後はそうも行かない
それが困るからといっても、シングル性能の向上は実際に困難な訳で…
599 : Socket77 - 2009/09/14(月) 06:16:51 ID:yC813vry (+23,+28,-17)
IPC維持しつつクロック自体は上がっていくんじゃないの?
600 : Socket77 - 2009/09/14(月) 06:44:28 ID:7HKvHHZq (+24,+29,-21)
たしかにCairoとかSIMD対応してくれると嬉しいなぁ。
64bitが来つつある事だし、メス入れねぇかな
←前へ 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 次へ→ / 要望・削除依頼は掲示板へ / 管理情報はtwitterで / Intel スレッド一覧へ
スレッド評価: スレッド評価について
みんなの評価 :
タグ : 追加: タグについて ※前スレ・次スレは、スレ番号だけ登録。駄スレにはタグつけず、スレ評価を。荒らしタグにはタグで対抗せず、タグ減点を。

類似してるかもしれないスレッド


トップメニューへ / →のくす牧場書庫について