のくす牧場
コンテンツ
牧場内検索
カウンタ
総計:126,364,210人
昨日:no data人
今日:
最近の注目
人気の最安値情報

    私的良スレ書庫

    不明な単語は2ch用語を / 要望・削除依頼は掲示板へ。不適切な画像報告もこちらへどうぞ。 / 管理情報はtwitter
    ログインするとレス評価できます。 登録ユーザには一部の画像が表示されますので、問題のある画像や記述を含むレスに「禁」ボタンを押してください。

    元スレIntel派がAMDの次世代CPUを語るスレ 1

    Intel スレッド一覧へ / Intel とは? / 携帯版 / dat(gz)で取得 / トップメニュー
    スレッド評価: スレッド評価について
    みんなの評価 :
    タグ : 追加: タグについて ※前スレ・次スレは、スレ番号だけ登録。駄スレにはタグつけず、スレ評価を。荒らしタグにはタグで対抗せず、タグ減点を。
    レスフィルター : (試験中)
    ←前へ 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 次へ→ / 要望・削除依頼は掲示板へ / 管理情報はtwitter
    802 : Socket77 - 2011/03/27(日) 00:14:14.19 ID:ROPmNcwR (+24,+29,-29)
    現実的には、
    遅いCPU+鉄板>>>>速いCPU+地雷板

    K10はそろそろアレかと思うけど、遅くて困ってるわけでもないという。
    BULL買う理由を作りたいが・・
    804 : Socket77 - 2011/04/06(水) 23:55:40.38 ID:sAVe1jEN (-7,+0,+0)
    タマシイムマシンでおk
    805 : ,,・´∀`・, - 2011/04/07(木) 21:52:04.25 ID:b2TBjklW (+6,+11,-16)
    http://support.amd.com/us/Processor_TechDocs/47414.pdf

    ざっと読んだ感想:
    SIMD整数もそれなりに性能でそう
    807 : Socket77 - 2011/04/08(金) 03:02:55.24 ID:Mewg0HRr (+15,+20,+0)
    SSE5のダメージ引きずってるのかね
    810 : Socket77 - 2011/04/08(金) 11:32:33.53 ID:k1nSsdCa (-20,+29,-49)
    逆にIntelにとってありがたいのは、将来サポート予定ものを殆どBullが積んでくれたので
    自社の移行の時にはソフトが潤沢に出回っているだろうって点だな
    812 : Socket77 - 2011/04/08(金) 13:35:41.09 ID:k1nSsdCa (-20,+29,-94)
    後藤の記事を見る限りじゃ今後もAVXの拡張は進められ、FMA4なども実装されるらしいよ
    命令セットは当然違うが、似たような機能ならソフトメーカーの対応も容易だろうという意味
    815 : Socket77 - 2011/04/08(金) 16:56:29.64 ID:wa5d82Gp (+33,+29,-9)
    団子がこんだけ力説するってことは、Bullは高性能なんだろうなぁ
    団子の分析が当たったことねーしw
    817 : Socket77 - 2011/04/08(金) 17:05:19.71 ID:k1nSsdCa (-25,+29,-79)
    そもそもSIMDの長さを拡大すればするほどの充填率が下がり無駄が増えるのに
    IntelがSIMDを拡張したいのはララビーとの整合性を取るためだよね
    822 : ,,・´∀`・, - 2011/04/08(金) 17:41:25.39 ID:MxZ4lNh4 (+33,+29,-8)
    >>815
    http://www.realworldtech.com/page.cfm?ArticleID=RWT033011040021
    プロファイリングしてみたらこの結果になるのは納得できたよ
    824 : Socket77 - 2011/04/08(金) 17:46:50.19 ID:k1nSsdCa (-23,+29,-131)
    多分延期の理由はララビーと同じで電力効率が悪かったからだと思うがね

    で、FMACが別個の乗算と加算を同時に行えないのは判ってるよ
    知りたいのは、乗加算1→乗加算2→乗加算3→乗加算4・・・と続き、それぞれが前の乗加算の結果に依存するとき
    FADD+FMULとFMACの所要サイクル数どうなるかだ

    827 : ,,・´∀`・, - 2011/04/08(金) 18:18:13.15 ID:MxZ4lNh4 (-10,+29,-94)
    Sandy Bridgeの場合。
    乗算5+加算3で合計レイテンシ8だが実際にチェインが発生するのは加算の3サイクルのみ。
    ***□□□□□■■■
         ***□□□□□■■■
              ***□□□□□■■■

    Bulldozerは積和算で6サイクル分。Sandy Bridgeの倍のインターリーブ数が必要。
    ***■■■■■■
             ***■■■■■■
                      ***■■■■■■


    これは>>822のパフォーマンス低下の原因のひとつだね。K10まではFADDはレイテンシ4だったが6に悪化した。
    もちろん原因がわかってれば改善も出来る。
    1スレッドあたり論理レジスタ16本の縛りが結構きついけど、ロードユニットが1モジュール全体で4本
    (整数コア毎に2本)あるので、なんとか酷使してやればスループットを改善できる。
    828 : 忍法帖【Lv= - 2011/04/08(金) 18:22:56.46 ID:4aEYnbAj (+24,+29,-24)
    AMD次世代本スレよりこちらのほうが面白くなっているな
    様々な角度・視点から可能性を論じるのは良いことだ
    無駄な罵りあいや荒らしはご勘弁
    829 : ,,・´∀`・, - 2011/04/08(金) 18:30:50.63 ID:MxZ4lNh4 (-15,+29,-41)
    というか性能が悪いベンチも包み隠さずAMD公式に出したほうが良いんだけどね。
    そのほうがソフト側でボトルネックの対処をしやすい。

    都合のいい数字だけ出してファンの一時の安心を誘ったところで最終的にはAMDが損をする。
    830 : Socket77 - 2011/04/08(金) 22:03:57.32 ID:wa5d82Gp (+27,+29,-8)
    団子が一人で戯言言ってるだけだな
    スレ自体が放置されてるのをいいことに好き勝手やってる
    831 : ,,・´∀`・, - 2011/04/08(金) 22:20:06.83 ID:MxZ4lNh4 (-15,+29,-131)
    RWTの記者は科学技術計算だから一般のアプリではそんなに関係ないかもしれない
    みたいなことを言ってるが、行列積とかFFTなんてもろにPCアプリで使う分野だぜ。
    単精度4x4行列はゲームで頻繁に使う。それも大量に。
    行列の規模が小さいほどレイテンシの問題はシビアになる。
    FFTは動画や音声のエンコーディングなどでも使われてるし

    さらに言えばbzip2圧縮で速度落ちてるならZIPやCABが落ちてない可能性も否定できない。
    というかこの程度は想定内の数字なんで驚きはしない。

    あとこれは禁句だったかもしれないが全体的にSandy Bridgeより命令のレイテンシ・スループットが悪い。
    838 : Socket77 - 2011/04/10(日) 10:03:36.16 ID:D1vSjEUz (+24,+29,-5)
    といってもIntelも同じ道辿るし規定路線でしょ
    841 : Socket77 - 2011/04/10(日) 15:47:38.91 ID:qdtN2RQ6 (+13,+20,-3)
    オープンで緩いライセンスならどうでもいい
    843 : Socket77 - 2011/04/10(日) 18:31:27.80 ID:t/vIWwJa (+16,+29,-18)
    初めは遅くても世代がカバーするんじゃないの?
    開発の容易さ以上の甘い蜜はないと思う
    844 : Socket77 - 2011/04/10(日) 18:32:41.47 ID:FtURtnl6 (-20,+29,-4)
    用意じゃないから使われない
    今までも
    846 : Socket77 - 2011/04/11(月) 13:06:33.95 ID:IhdM9T7E (+28,+28,-114)
    CPUのSIMD演算基で1命令1サイクルないし2サイクルで完結できるレベルの並列度の演算命令を
    低クロックで並列度が無駄に高いGPUにそのまんまもっていったところでそれこそ性能ダウンだろw

    結局GPUでできるのはAPIレベルだろ。

    848 : Socket77 - 2011/04/11(月) 21:42:29.27 ID:W68UgpFa (+14,+29,-1)
    そんなの無いは
    849 : ,,・´∀`・, - 2011/04/12(火) 00:49:58.53 ID:UMrWC45V (+21,+29,-61)
    GPUでCPUのSIMD命令を置き換え可能でなおかつCPUのそれより効率的に実行できるとするなら
    CPUのSIMDユニットは最初からGPUと同じ構造になってるはずだろ?
    構造が根本から違うってことは不適ってことなんだよ。
    ←前へ 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 次へ→ / 要望・削除依頼は掲示板へ / 管理情報はtwitterで / Intel スレッド一覧へ
    スレッド評価: スレッド評価について
    みんなの評価 :
    タグ : 追加: タグについて ※前スレ・次スレは、スレ番号だけ登録。駄スレにはタグつけず、スレ評価を。荒らしタグにはタグで対抗せず、タグ減点を。

    類似してるかもしれないスレッド


    トップメニューへ / →のくす牧場書庫について