私的良スレ書庫
不明な単語は2ch用語を / 要望・削除依頼は掲示板へ。不適切な画像報告もこちらへどうぞ。 / 管理情報はtwitterでログインするとレス評価できます。 登録ユーザには一部の画像が表示されますので、問題のある画像や記述を含むレスに「禁」ボタンを押してください。
元スレIntelの次世代CPUについて語ろう 40
Intel スレッド一覧へ / Intel とは? / 携帯版 / dat(gz)で取得 / トップメニューみんなの評価 : ○
レスフィルター : (試験中)
>>549
x86は以前としてFP系の方は苦手だ。全体的に速いから結果的に勝っているだけ。
x86が何故整数だけでなくFPも高速かというと、FPユニットに力をいれているからっていうより
内蔵キャッシュが強力で、クロック高めってだけ。仮にx87に限定しても最速の可能性はある。
x86は以前としてFP系の方は苦手だ。全体的に速いから結果的に勝っているだけ。
x86が何故整数だけでなくFPも高速かというと、FPユニットに力をいれているからっていうより
内蔵キャッシュが強力で、クロック高めってだけ。仮にx87に限定しても最速の可能性はある。
スカラFP対決にきまってるだろ。
SIMDはまた話が別だ。もとからx87にないしな。
SIMDはまた話が別だ。もとからx87にないしな。
つーか、SPEC CPUの結果はSIMDつかってないからなあ。
それであんだけいけるってことはx87でもトップレベルだろう。
それであんだけいけるってことはx87でもトップレベルだろう。
GPGPUはなんつーか特定の使い方を強制するからなぁ。
汎用性はない。これで整数も並列で高速だったらまだよかったけど。
汎用性はない。これで整数も並列で高速だったらまだよかったけど。
というわけで、x87の時のx86が極端に悪く、
SSE2導入から極端によくなったというわけではない。
実装の改善の方が命令セットの問題よりも遙かに大きいわけで、
これはコードといくらにらめっこしていても、より大域的な視点で実測データをみていかないと
わからない話である。
SSE2導入から極端によくなったというわけではない。
実装の改善の方が命令セットの問題よりも遙かに大きいわけで、
これはコードといくらにらめっこしていても、より大域的な視点で実測データをみていかないと
わからない話である。
>>564
Yonahはその通り、結局実装なんだよな。
SSE2でスタックを廃止したおかげでFMAとかを導入できたり、回路実装しやすくなったり
最適化コンパイラを作りやすくなったり、という設計上の2次的なメリットはあるというか、
むしろそれが目的なんだろ。ある時点で、x87とSSE2とで所要クロックを比較したら差が出た程度では
移行のメリットの本質はわからない。
元々x87にある命令と同等の命令をSSE2置き換えても、実行ユニットが同じである手前、
実際の所、劇的な改善はない。
Yonahはその通り、結局実装なんだよな。
SSE2でスタックを廃止したおかげでFMAとかを導入できたり、回路実装しやすくなったり
最適化コンパイラを作りやすくなったり、という設計上の2次的なメリットはあるというか、
むしろそれが目的なんだろ。ある時点で、x87とSSE2とで所要クロックを比較したら差が出た程度では
移行のメリットの本質はわからない。
元々x87にある命令と同等の命令をSSE2置き換えても、実行ユニットが同じである手前、
実際の所、劇的な改善はない。
スカラ/ベクトル
SISD/SIMD
の効果は別個に考えて欲しいな。
SIMD/ベクトルは汎用演算よべるものじゃないし、これを容認したら何でも有り。
SPEC CPU専用の命令と半チートユニットを追加したものが勝ちだ。
基本はFP性能といったら暗黙の了解でスカラFP。
SIMDや特定用途向けハードまでいれると何が優れているのかよくわからなくなる。
>>567
AVXはSIMDの効果がメインだろ。命令エンコーディングは後藤が騒いでいるが、
おまけの効能しかないし、これでx86が生まれかわるみたいな大げさな代物では到底ないのはわかるだろ。
一方で、SIMDとは関係なくFPユニット周りが増強されているのならば、
既存のSSEコードも再コンパイルなしで速くなるし、再コンパイルすれば更に速くなる。
しかし、Sandy Bridgeの本領を評価するにはやはりバリバリAVXと新しいポート構成に最適化された
アプリで評価する必要がある。そんな感じだろ。
SISD/SIMD
の効果は別個に考えて欲しいな。
SIMD/ベクトルは汎用演算よべるものじゃないし、これを容認したら何でも有り。
SPEC CPU専用の命令と半チートユニットを追加したものが勝ちだ。
基本はFP性能といったら暗黙の了解でスカラFP。
SIMDや特定用途向けハードまでいれると何が優れているのかよくわからなくなる。
>>567
AVXはSIMDの効果がメインだろ。命令エンコーディングは後藤が騒いでいるが、
おまけの効能しかないし、これでx86が生まれかわるみたいな大げさな代物では到底ないのはわかるだろ。
一方で、SIMDとは関係なくFPユニット周りが増強されているのならば、
既存のSSEコードも再コンパイルなしで速くなるし、再コンパイルすれば更に速くなる。
しかし、Sandy Bridgeの本領を評価するにはやはりバリバリAVXと新しいポート構成に最適化された
アプリで評価する必要がある。そんな感じだろ。
自動SIMD化なんて使われるようになったのは最近の話だし、
まだまだ影響軽微だな。個人的にはわけがわからなくなるからSIMDは禁止にするか、
明確に別ジャンル化してほしいものだ。
まだまだ影響軽微だな。個人的にはわけがわからなくなるからSIMDは禁止にするか、
明確に別ジャンル化してほしいものだ。
自動SIMD化というのはこういうもののこと?
>ループを解析して可能であれば SIMD 命令を使って
>ベクトル演算をするようにコンパイル
こういう事なら80年代からスパコン用コンパイラでやってるけど
>ループを解析して可能であれば SIMD 命令を使って
>ベクトル演算をするようにコンパイル
こういう事なら80年代からスパコン用コンパイラでやってるけど
Sandy Bridgeは旧来SSEも遅くしちゃいけないしAVXも対応しなきゃいけないので
デコーダのロジック部はかなり膨れあがってると思うよ。
文字通りSSEからAVXへの「Bridge」だからな。
んで、主要アプリのAVX移行が完了したあたりでSSE*を切り捨てるだろう。
もちろんいきなり使えなくなるんじゃじゃなくて、デコードの高速化のためのロジックを弱体化させるだろう。
具体的にはプリフィクスの長さ分だけストールするようになる、なんてことが考えられる。
旧来命令の切り捨てってのは繰り返してきたことだからな
P6で16ビットコードが遅くなったりもした。
デコーダのロジック部はかなり膨れあがってると思うよ。
文字通りSSEからAVXへの「Bridge」だからな。
んで、主要アプリのAVX移行が完了したあたりでSSE*を切り捨てるだろう。
もちろんいきなり使えなくなるんじゃじゃなくて、デコードの高速化のためのロジックを弱体化させるだろう。
具体的にはプリフィクスの長さ分だけストールするようになる、なんてことが考えられる。
旧来命令の切り捨てってのは繰り返してきたことだからな
P6で16ビットコードが遅くなったりもした。
自動ベクトル化のスコアはここ数年で登録されるようになったけど、
所詮、最低SPEC CPUベンチ特化でSIMDコードがはきだせれば高スコアがねらえるので、
自動ベクトル化を標準ベンチで認めるのはCPU、コンパイラ双方の実力をわかりにくくする
だけで個人的には反対だ。
極端なハイスコアをあげているのは自動マルチスレッド化の方が顕著だけど、
次バージョンでは評価の枠組みを整理し直して欲しいな。
所詮、最低SPEC CPUベンチ特化でSIMDコードがはきだせれば高スコアがねらえるので、
自動ベクトル化を標準ベンチで認めるのはCPU、コンパイラ双方の実力をわかりにくくする
だけで個人的には反対だ。
極端なハイスコアをあげているのは自動マルチスレッド化の方が顕著だけど、
次バージョンでは評価の枠組みを整理し直して欲しいな。
SPEC CPUの評価方法の話だろ。
自動ベクトル化、自動マルチスレッド化を有効にしたスコアは専用の項目にわけるべきだよ。
まあ、最近のマルチコアやサーバ用CPUのSIMD強化ブームをみる限りでは
黙っていても次のSPEC CPUがあるのなら整備されるのではないかと。
今のSPEC CPUの枠組みでは、自動ベクトル/マルチスレッド化は正当に評価できん。
高々十数種類しかない決まったソースコードで最適化できりゃいいからな。
実アプリに広範に対応できるような自動並列の技術はいらなくてもどうにでもなる。
自動ベクトル化、自動マルチスレッド化を有効にしたスコアは専用の項目にわけるべきだよ。
まあ、最近のマルチコアやサーバ用CPUのSIMD強化ブームをみる限りでは
黙っていても次のSPEC CPUがあるのなら整備されるのではないかと。
今のSPEC CPUの枠組みでは、自動ベクトル/マルチスレッド化は正当に評価できん。
高々十数種類しかない決まったソースコードで最適化できりゃいいからな。
実アプリに広範に対応できるような自動並列の技術はいらなくてもどうにでもなる。
SPECは元々自分のソースを走らせる人間が参考にすべきベンチで
バイナリで買うソフトの参考としては疑問がある
バイナリで買うソフトの参考としては疑問がある
ああ、SAPがあったか。
実際の所、SPEC CPUは、RISCが生きていた時代には新しいCPUが出るたびにチェックしてたけど
2006以降は全くといっていいほど見てないな。マルチコアでわかりにくくなったってのもあるが、
x86以外がかなり壊滅したから他アーキテクチャに興味が薄れたってのもある。
実際の所、SPEC CPUは、RISCが生きていた時代には新しいCPUが出るたびにチェックしてたけど
2006以降は全くといっていいほど見てないな。マルチコアでわかりにくくなったってのもあるが、
x86以外がかなり壊滅したから他アーキテクチャに興味が薄れたってのもある。
ぶっちゃけ、新しいCPUがでると、ありとあらゆるベンチマークを走らされて、
世界中のオタクの厳しい評価の目にさらされ、数%の速度差にまで原因に議論が及ぶ
PC向けCPUが一番性能評価の結果が信用できる。
それに比べると未だに理論flopsみたいな過去の遺物をベースに語られるHPCなどは、
実は全く客観的評価の信用ならないジャンル。
世界中のオタクの厳しい評価の目にさらされ、数%の速度差にまで原因に議論が及ぶ
PC向けCPUが一番性能評価の結果が信用できる。
それに比べると未だに理論flopsみたいな過去の遺物をベースに語られるHPCなどは、
実は全く客観的評価の信用ならないジャンル。
無いな。
ただこれまでにも商用ソフトのいくつかはライブラリ経由で透過的にSSEを使ってるから
それなりに効果はありそうだけどね。
たとえばSSE4.2のテキストサーチAPIはかなり恩恵が大きい。
Webサーバだったり高級言語のインタプリタに実装されればかなり性能向上が期待できる。
あと、CairoとかImageMagickとかの腐れプログラムがSIMD対応改善してくれると
オープンソースアプリも含めてすっげー恩恵受けるんだが
ただこれまでにも商用ソフトのいくつかはライブラリ経由で透過的にSSEを使ってるから
それなりに効果はありそうだけどね。
たとえばSSE4.2のテキストサーチAPIはかなり恩恵が大きい。
Webサーバだったり高級言語のインタプリタに実装されればかなり性能向上が期待できる。
あと、CairoとかImageMagickとかの腐れプログラムがSIMD対応改善してくれると
オープンソースアプリも含めてすっげー恩恵受けるんだが
なるほど
The free lunch is overってのが
SandyBridgeでは加速するのか
でもこのままマルチコアとSIMDで
お茶を濁すだけでは先が行き詰るのは
見えてるからなんとかしないと
マズいのでは、となんとなく思う
シングルスレッドでも性能上げるなら
投機的マルチスレッディングだ、ってのを
どこかで見た覚えもあるけど立ち消えに
なっちゃったし今後どうするんだろうね
The free lunch is overってのが
SandyBridgeでは加速するのか
でもこのままマルチコアとSIMDで
お茶を濁すだけでは先が行き詰るのは
見えてるからなんとかしないと
マズいのでは、となんとなく思う
シングルスレッドでも性能上げるなら
投機的マルチスレッディングだ、ってのを
どこかで見た覚えもあるけど立ち消えに
なっちゃったし今後どうするんだろうね
しかし、フリーランチが終わるとなると、旧命令の切り捨ても迂闊には出来なくなるな
今までは、切り捨てとは言っても一時的な落ち込みで、長い目で見たら確実に高速に
なっていった訳だが、今後はそうも行かない
それが困るからといっても、シングル性能の向上は実際に困難な訳で…
今までは、切り捨てとは言っても一時的な落ち込みで、長い目で見たら確実に高速に
なっていった訳だが、今後はそうも行かない
それが困るからといっても、シングル性能の向上は実際に困難な訳で…
たしかにCairoとかSIMD対応してくれると嬉しいなぁ。
64bitが来つつある事だし、メス入れねぇかな
64bitが来つつある事だし、メス入れねぇかな
前へ 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 次へ / 要望・削除依頼は掲示板へ / 管理情報はtwitterで / Intel スレッド一覧へ
みんなの評価 : ○類似してるかもしれないスレッド
- Intelの次世代CPUについて語ろう 44 (1001) - [97%] - 2011/1/21 6:46
- Intelの次世代CPUについて語ろう 41 (967) - [97%] - 2009/12/26 8:32 ○
- Intelの次世代CPUについて語ろう 47 (1001) - [97%] - 2011/11/7 11:16
- Intelの次世代CPUについて語ろう 42 (1001) - [97%] - 2010/4/10 23:32 ○
- Intelの次世代CPUについて語ろう 43 (1001) - [97%] - 2010/9/26 23:01 ○
- Intelの次世代CPUについて語ろう 35 (1001) - [95%] - 2008/12/1 23:03 ○
- Intelの次世代CPUについて語ろう 36 (1001) - [95%] - 2009/1/23 6:07 ○
- Intelの次世代技術について語ろう 109 (1006) - [82%] - 2023/1/25 13:00
- Intelの次世代技術について語ろう 106 (1001) - [82%] - 2022/6/24 20:01
- Intelの次世代技術について語ろう 110 (321) - [82%] - 2023/2/9 17:00
- Intelの次世代技術について語ろう 108 (1006) - [82%] - 2022/11/18 15:30
- IntelとAMDどっちが勝ってるの? (499) - [41%] - 2010/2/26 17:31 ○
トップメニューへ / →のくす牧場書庫について