のくす牧場
コンテンツ
牧場内検索
カウンタ
総計:126,363,914人
昨日:no data人
今日:
最近の注目
人気の最安値情報

    私的良スレ書庫

    不明な単語は2ch用語を / 要望・削除依頼は掲示板へ。不適切な画像報告もこちらへどうぞ。 / 管理情報はtwitter
    ログインするとレス評価できます。 登録ユーザには一部の画像が表示されますので、問題のある画像や記述を含むレスに「禁」ボタンを押してください。

    元スレIntelの次世代CPUについて語ろう 41

    Intel スレッド一覧へ / Intel とは? / 携帯版 / dat(gz)で取得 / トップメニュー
    スレッド評価: スレッド評価について
    みんなの評価 :
    タグ : 追加: タグについて ※前スレ・次スレは、スレ番号だけ登録。駄スレにはタグつけず、スレ評価を。荒らしタグにはタグで対抗せず、タグ減点を。
    レスフィルター : (試験中)
    ←前へ 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 次へ→ / 要望・削除依頼は掲示板へ / 管理情報はtwitter
    151 : Socket77 - 2009/10/22(木) 11:51:18 ID:FnGHivCP (+15,+26,-1)
    ミクロの世界へ
    152 : Socket77 - 2009/10/22(木) 12:23:40 ID:0dlnLsby (+23,+28,+0)
    >>151
    ナノの世界だよ
    153 : Socket77 - 2009/10/22(木) 12:31:28 ID:uV7PAVCg (+29,+29,-62)
    >専用のモジュール

    で、具体的に何をのせてくるんだろうか?armみたいなJavaのハードエミュレータみたいなのとか?
    つーか電力を節約したいのか、特定処理を高速化したいか、何を目的にしてるのかがよくわからん
    もしかして二兎狙ってるの?ブレるぞ
    155 : Socket77 - 2009/10/22(木) 13:41:29 ID:zxel5sXy (-13,+29,-67)
    まあこのスレ的なポイントは、SPEにしろGPUにしろ、「ISAから独自に構築して
    デコーダ層からまるっと問題領域に最適化しないと電力効率実行効率あがらんよ」
    という所だと思う。
    汎用ISA勝負は人海戦術で力技のx86にも勝機があったが、
    専用モジュールの領域ではそうはいかないだろう、と。
    そこはこれからLarrbeeで試される。
    156 : Socket77 - 2009/10/22(木) 14:54:27 ID:ofl08Jl8 (+0,+30,+0)
    >>155
    そのへんの認識が既に前世紀的だぞ。

    Cellを含めた古典的RISCの敗因は、シンプルすぎたこと。
    デコーダのコストだけで全体の効率が変わるほどマイクロアーキテクチャの
    世界は甘くない。
    RISCがシンプルすぎることは大きな欠点になっている。
    メモリ操作なんて頻繁に使うのにアドレッシングに何オペレーションに何命令も
    使って各命令4バイトずつ食うのは非合理的じゃないか、とか。
    ARMがMIPS等からシェアを奪えたのは、2バイト命令の採用や比較的強力な
    アドレッシングモードなど、CISCの利点を採りいれてるからだ。

    概してRISCはIPCが稼ぎにくい。性能を高めるにはクロックを上げるしかない。
    逆にCISCは1コアに使えるトランジスタ数が増えた分、命令ストリームと
    実行パイプラインの両面で演算密度を高めやすい。

    x86市場の中ですら実証されてる。
    パイプラインフロントエンドからx86デコーダを取り払い、内部RISC化した
    Pentium 4と、CISCを内部オペレーションレベルで処理の結合を図った
    Pentium MやAthlonのアプローチ、どっちが今に繋がっているか?

    そしてGPUもいまではVRAM間のトラフィックがネックになり、中途半端にプログラマブルに
    したせいで電力効率は低くとどまってる。抽象度が低いため、資産に囚われて
    大幅な設計変更ができないというジレンマに陥っている。かつてのRISCと同じ構図だ。
    GPGPUも所詮は電力あたりのFLOPS数が高いという数の暴力を行使しているにすぎない。
    (理論FLOPS数あたりの効率は度外視)
    その点ではGPUとしての資産を持たないLarrabeeは大胆なパラダイムシフトを
    提案できる立場にある。
    もっとも最終的には性能関係なしに数捌けるGMAからの置き換えという
    無敵のカードがあるわけだが。
    157 : +++ - 2009/10/22(木) 16:32:36 ID:AogLAlWl (+24,+29,-51)
    intelは15nmもEUVは間に合わないんじゃないかとか言ってるようだけど。
    量産化が早い時期にくるintelの都合もあるんだろうし、現状のプロセスも
    うまくいってそうだし。
    158 : Socket77 - 2009/10/22(木) 17:19:29 ID:zxel5sXy (-18,+29,-62)
    団子がお花畑モードで書いた妄想をそのまま鵜呑みにしちゃったのか。

    まあLarrabeeの実物見れば目が覚め……ないだろうな。
    まだ第一世代だから次の世代からとかなんとか。
    159 : Socket77 - 2009/10/22(木) 17:25:04 ID:aLViUXIR (+7,+17,+0)
    >>156
    同意

    最後の4行以外。
    160 : Socket77 - 2009/10/22(木) 17:58:31 ID:ofl08Jl8 (+2,+29,-110)
    >>158
    第2世代は第1世代から大きくは変わらんよ。
    ムーアの法則の終息を見越して設計されてる。

    Larrabeeが効率が良いとは言わないが他のGPGPUの実効性能が酷い。
    標榜するピークFLOPS数の2割程度でも出ればCPUより性能出るって
    満足しちゃうから、効率が悪いという認識が無いだけ。
    162 : Socket77 - 2009/10/22(木) 18:15:14 ID:ofl08Jl8 (-4,+30,-238)
    >>161
    速そうに見えるってより実際に速いんだけどな。
    x86の命令セットにマッチアドレス演算用の専用ユニット(AGU)を持つことで
    汎用ALUでやるよりも高い効率を実現している。

    頻繁に使う演算に特化した命令(あるいはそのモード)と専用ユニットを
    持つってのは、方向性としては正しい。
    x86がベストとは言わないが、かつて栄光を誇ったRISCが自滅していったんだ。

    POWER7では、ARMの真似してロード・ストアと同時にベースポインタを
    進める命令を強化してきたが、要するにそこまで行き詰っている。

    適当な言葉が思い当たらなかったのでIPCって表現したけど語弊があるかな。
    仮にOperations Per Clockとでもしようか。

    Core MAではマイクロアーキテクチャレベルでは6つの演算ユニットに
    同時にオペレーションを発行できるけど、PowerPCではたかだか4。
    163 : Socket77 - 2009/10/22(木) 18:16:02 ID:iKCNzz7j (+33,+29,-78)
    >>156
    RISCの欠点と言うよりも設計思想や64bit対応の考え方の違い。
    MIPSはPowerと同じような所を狙って開発されていたんだから
    そんなちっちゃいことは考えてなかった。

    DSとPSPなんかみてて思うんだけど
    ARMは小規模なとろこでは優秀なだどでちょっと画面が大きく
    なったりしたら使えないのでは。
    167 : Socket77 - 2009/10/22(木) 18:49:18 ID:iKCNzz7j (+23,+29,-19)
    >>165
    たとえが悪かった
    ARMの命令セットが広域のメモリを扱うのに向いてるかってこと。
    画面が大きくなれば飛ぶ範囲も広いでしょ。
    168 : Socket77 - 2009/10/22(木) 19:14:47 ID:ofl08Jl8 (+8,+29,-129)
    >>167
    ああ、レジスタ間接のディスプレースメントフィールドは12ビットしかないね。
    ただオペランドのデータ長に依存してスケールするから
    極端に少ないということもない。

    もっとも画面処理をどこまでARMの命令セットでやるかというのも疑問だが。
    根本的なところ言えばそういうところ言い出したら12が16だろうが
    大して変わらんように見えるが。

    絶対指定の即値だとどうなる?
    【ヒント】
    http://d.hatena.ne.jp/natsutan/20080411/1207920875
    170 : Socket77 - 2009/10/22(木) 19:53:59 ID:ofl08Jl8 (+4,+29,-47)
    その意味でARMは32ビット即値を命令ストリームに置くことで
    実質8バイト命令を実現できるわけで。
    というか考え方としてはModRMの後部の拡張フィールドとなんら変わらない。

    やり方次第でARMもx86に迫る高速設計は可能。省電力さえ犠牲にすればだけど。
    実際16本あれば十分じゃないの?リネームが複雑になるし。
    171 : Socket77 - 2009/10/22(木) 21:06:22 ID:I/V2J/Um (+29,+29,-34)
    x86歳代の問題は、設計が古すぎてオーバーヘッドになってることでしょ?
    PowerPCとかARMにくらべて、ワット辺り処理能力がかなり悪いのはそれが原因だったはず
    172 : Socket77 - 2009/10/22(木) 21:24:14 ID:KHZs8zFP (+22,+27,-3)
    設計じゃなくて命令セットの問題だけどな
    177 : ,,・´∀`・, - 2009/10/22(木) 23:49:25 ID:QfHQkvVn (-20,+29,-34)
    結局の所消費電力かなぐり捨てればその程度だってこと

    ああ、POWER6のほうの数字間違ってるからね。
    本当の数字はリンク先参照。


    電力効率の方にはエントリーすらされてない。
    179 : Socket77 - 2009/10/22(木) 23:59:14 ID:KGbocoaV (+30,+30,-181)
    精神分裂病(統合失調症)の危険性

    1. 誰かに嫌がらせをされているという。
    2. 誰かに狙われたり、つけられたり、盗聴されたりしているという。
    3. 電波のようなものであやつられるという。
    4. 自分の考えが不思議な力によって回りの人たちに伝わってしまうという。(テレパシーなど)
    5. 周りに人がいないのに自分を責めるような声が聞こえてくるという。
    6. 誰かが自分にのりうつっているという。
    7. 体の中に何かの機械がはいっているという。
    8. 体の一部(骨、脳など)が溶けたり形がかわったりするという。
    9. 頭の中が混乱して、何を考えていたのかわからなくなるという。
    10. 話にまとまりがない。支離滅裂で何をいってるのか理解できない。
    11. 自分の考えている事が声になって聞こえてくるという。
    12. ずっと独り言をいっている。一人笑いがある。
    13. 喜怒哀楽の感情がなくなってしまった。
    14. 引きこもりがちで、ほとんど外出しない。
    15. 以前は見られなかったような奇妙な言動がある。



    180 : ,,・´∀`・, - 2009/10/23(金) 00:01:28 ID:QfHQkvVn (-20,+29,-45)
    POWER6なんて実質Pentium 4の後継みたいなもんだぞ。
    まあシングルコア性能ならあのまま旧Nehalemに突き進めば
    最強だったかもしれんな

    このご時世大した意味ないけど
    186 : Socket77 - 2009/10/23(金) 02:12:08 ID:2gWd2EPP (-13,+29,-145)
    >>185
    それはサーバ未満のパフォーマンスCPUという市場が
    開発コストも製造コストもべらぼうにかかるのに価格に転嫁しにくい、
    Intel一社以外は養えない薄利多売市場だから、という話だな。
    Intel自身ですら、性能抑えてチップ面積も小さくしたAtomにシフトして
    利益率を改善している始末。

    もしIntelでなくx86が優れているのだ……というなら、特に名を秘す某社が
    破綻寸前に追い詰められてしまうはずはない。
    187 : Socket77 - 2009/10/23(金) 04:40:10 ID:c0iNOhwG (+23,+29,-104)
    一番パイの大きいPC市場を押さえてて、無尽蔵に開発費用をつぎ込めるからこそ、
    x86はなんとか誤魔化しきれてるともいえるわけだが

    逆にいえば、同じ費用をPPCなどにつぎ込めば、もっとワット効率に優れたCPUは作れるだろうが
    現実はAppleやゲーム機の需要でも足り無いのが現実で
    188 : Socket77 - 2009/10/23(金) 04:41:56 ID:c0iNOhwG (+27,+29,-27)
    それに当のIntelですら、機会があればx86辞めたがってるのも事実なわけで
    それくらい、x86のオーバーヘッドは馬鹿に鳴らないんだろう
    189 : Socket77 - 2009/10/23(金) 04:57:40 ID:2gWd2EPP (+3,+29,-23)
    >>188
    かつてはそういう時期もあったが、今のIntelはx86から一歩も離れる気はない。
    GPUにフルスペックのx86コア採用とか、偏執狂的なx86への執着以外の何物でもない。
    190 : Socket77 - 2009/10/23(金) 05:11:28 ID:+xJxuIxz (+27,+29,-13)
    最近団子が言ってることって
    http://pc.watch.impress.co.jp/docs/2004/1130/kaigai136.htm
    ここら辺ですでに語られてるよね。
    中の人は団子とは結論が違うけど。
    196 : Socket77 - 2009/10/23(金) 08:07:08 ID:+xJxuIxz (+22,+29,-14)
    198 : ,,・´∀`・, - 2009/10/23(金) 08:40:25 ID:Ue3qZdbi (-15,+29,+0)
    > 【Rattner氏】 私は、ISAが障壁にならないという意見に基本的には異論はない。しかし、
    のくだりは注目ね

    > ここで重要なのは、プロセッサのパフォーマンスは平均消費電力で制約されるのではなく、
    > ピーク温度で制約されることだ。そのため、ホットスポットであるデコーダが、CPUの動作周波数の
    > 制約になる。なぜなら、その部分のジャンクション温度が既定値を超えないようにしなければ
    > ならないからだ。その意味では、ISAはゼロコストではない。フレッドと、ちょっと相違があるのは
    > その部分で、デコーダの電力効率に関しては、固定長命令セットアーキテクチャの方がどうしても有利になる。

    ここはその通り。実際出てきたAtom見てみると2GHzあっさり実現してるけどな。

    > もう1つの要素はキャッシュアクセスだ。Intelアーキテクチャでは、よりキャッシュインテンシブになる。
    > レジスタファイルが少ないためで、それがデータキャッシュに負担をかける。それに対して、(RISC系
    > CPUのように)レジスタファイルが大きいと、データキャッシュへの負担は小さくなる。その方が、
    > 電力消費の面では有利だ。ここにもトレードオフがある。

    組み込み系のCPUで高速なものは汎用レジスタ16本のものが主流なんだが

    あとは即値モードがリッチな分x86のほうがレジスタ本数の割にはロード・ストア回数を減らすことが出来るはずだ。
    あー、別にARMの即値モードは貧弱でもないよ。
    その気になれば32ビットとか64ビットとか取れるからね。先に説明されてるけど。

    組み込みCPUに対するx86の強みは、PC規格が共通化されてるから即製品投入できるが故
    結果的にプロセスルールの優位を強みに出来ること。
    40nmのCortex-A8も勿論でもされてるが、今製品になってるレベルでは事実上A8の1GHz未満あたりが競合。
    Atomはこのあたりには負けてない。
    200 : Socket77 - 2009/10/23(金) 10:03:28 ID:UJPkvtfq (+29,+29,-47)
    どんな命令の組み合わせでも同時デコードしないといけない制約下ではきついが、
    Pentiumみたいに非対照でペアリングに制限のある方式ならそこまで複雑にはならない。

    加えて言うと、同時処理スレッド数が増えると、明らかに同時切り出し可能な命令数もそれに比例して増える。
    ←前へ 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 次へ→ / 要望・削除依頼は掲示板へ / 管理情報はtwitterで / Intel スレッド一覧へ
    スレッド評価: スレッド評価について
    みんなの評価 :
    タグ : 追加: タグについて ※前スレ・次スレは、スレ番号だけ登録。駄スレにはタグつけず、スレ評価を。荒らしタグにはタグで対抗せず、タグ減点を。

    類似してるかもしれないスレッド


    トップメニューへ / →のくす牧場書庫について