のくす牧場
コンテンツ
牧場内検索
カウンタ
総計:127,641,644人
昨日:no data人
今日:
最近の注目
人気の最安値情報

私的良スレ書庫

不明な単語は2ch用語を / 要望・削除依頼は掲示板へ。不適切な画像報告もこちらへどうぞ。 / 管理情報はtwitter
ログインするとレス評価できます。 登録ユーザには一部の画像が表示されますので、問題のある画像や記述を含むレスに「禁」ボタンを押してください。

元スレIntel Larrabee 4コア

Intel スレッド一覧へ / Intel とは? / 携帯版 / dat(gz)で取得 / トップメニュー
スレッド評価: スレッド評価について
みんなの評価 :
タグ : 追加: タグについて ※前スレ・次スレは、スレ番号だけ登録。駄スレにはタグつけず、スレ評価を。荒らしタグにはタグで対抗せず、タグ減点を。
レスフィルター : (試験中)
←前へ 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 次へ→ / 要望・削除依頼は掲示板へ / 管理情報はtwitter
901 : Socket77 - 2009/11/24(火) 18:22:23 ID:dPj4zyY9 (+24,+29,-10)
このスレとかIntel次世代スレとか、木どころか葉脈見て森見ないようなやつばっかだな
903 : Socket77 - 2009/11/24(火) 22:22:53 ID:sOTYc8Q2 (+15,+30,+0)
905 : Socket77 - 2009/11/24(火) 23:05:55 ID:1ayzPV/z (+13,+15,-16)
グラボはラデ音でも買えばいいと思うよ by Intel
907 : Socket77 - 2009/11/24(火) 23:14:59 ID:nOQx4sqY (+5,+29,-16)
なんでテクスチャユニットついてるん?
908 : Socket77 - 2009/11/24(火) 23:17:52 ID:ELEBIXpN (+28,+29,-2)
>>907
普及させるために仮面かぶってるからさ。
909 : Socket77 - 2009/11/24(火) 23:22:45 ID:nOQx4sqY (-1,+28,-2)
なんでタイリングするん?
910 : ,,・´∀`・, - 2009/11/24(火) 23:29:27 ID:hPX1Nh9Y (+7,+29,-129)
VRAMの帯域消費量を節約するため。

ピクセルライン単位でちびちび転送して処理するからあのデータが足りないとかいって
帯域をひたすら浪費する。
ある程度の大きさずつキャッシュに確保して纏めて処理したほうがトラフィック削減できる。

ああ、PowerVRがどうとか言ってるのはアホなんで構う必要なし。
そんな帯域狭いわけがないだろ。
911 : Socket77 - 2009/11/24(火) 23:29:41 ID:ELEBIXpN (+27,+29,-39)
>>909
過去のDXとかとの互換性であったほうがいいのかなぁ??
タイリングアーキテクチャはDxではキャンセルされてしまったので、グライドみたいな立ち位置じゃね?
912 : ,,・´∀`・, - 2009/11/24(火) 23:41:34 ID:hPX1Nh9Y (-6,+23,-67)
VRAM転送だけで何十Wも消費するので、キャッシュを旨く使って消費電力を抑えれば
その分の余剰TDPキャパの枠内でコアをオーバークロックすることができる

なんて実装が登場するかもしれないね。


913 : Socket77 - 2009/11/25(水) 00:06:42 ID:wpIpnjnJ (+30,+29,-24)
タイリングレンダで発生するシェーダ間の中間データはどこに置くん?
914 : ,,・´∀`・, - 2009/11/25(水) 00:16:31 ID:XnXiDy9n (+38,+30,-267)
運が良ければそのままL2キャッシュにそのまま保持。
Cellじゃないんだからバケツリレーする必要なんてないよ。

ストリーム処理の粒度は粗くなり、今までのGPUでは絶え間なくなく流れてた
VRAMのフローは途切れ途切れになる。
いや、それがIntelの目論見なんだけど。

段階的にタイルに移行し、ゆくゆくはCPUコアと統合し、L3キャッシュでバッファリングすることで
より狭い帯域のメモリで動かせるようになったり、CPU間と高速にデータやりとりしたりってことが
できるようになる。



GPUは帯域食いのイメージがあるが、実は意外と食わないってのはあまり知られてない事実。
演算ユニット単位で見るとメモリ帯域はものすごく狭い。
要するにデータの局所性はCPUと比べてものすごく高い。
局所性があるならキャッシュは有効だ。
十分なキャッシュ容量を与えないからこそ無駄にトラフィックが浪費されるわけで。
915 : Socket77 - 2009/11/25(水) 02:07:44 ID:zXg+k36V (+29,+29,-152)
GPUっていうかリアルタイム3Dグラフィックスは、もっと帯域食わない方法が沢山あるという事だな
ハードワイヤード実装でレンダリングパイプラインが固定され続けて15年が経った、と
俺たち末端のプログラマはそのハードの仕組みに従うしかないからなー
916 : Socket77 - 2009/11/25(水) 02:22:55 ID:wpIpnjnJ (+41,+29,-15)
>>914
> 運が良ければそのままL2キャッシュにそのまま保持。
なんでそんな望み薄いことにかけるん?
テッセレータ死んでしもたん?
917 : Socket77 - 2009/11/25(水) 07:16:35 ID:jDb1580z (+30,+29,-58)
キャッシュ内タイルレンダで帯域ハッピーなんて
とてもじゃないがLarrabee世代で実現できるような話じゃない。
後プロセス3世代くらい進めば物になるのかもしれんが。
918 : ,,・´∀`・, - 2009/11/25(水) 08:10:36 ID:XnXiDy9n (+40,+30,-230)
>>916
なんで「賭け」?
あったらあったでトラフィック削れるし、無いなら無いでかまわんのだよ。
キャッシュにないなら、メモリからとってくればいいじゃない。
そこは従来のGPUと変わらん。
ロードして必要データがキャッシュにある別の部位を処理するタスクに切り替えて間を繋ぐ。
そこも従来のGPUとかわらんし、むしろ条件は良い。

だが大丈夫、その程度で望み薄いとか言ったら、10分の1以下のL2キャッシュ容量しかないGeForceやRadeonは
「絶望的にありえない」から。

なぜ運任せになるかって、OSが入るから。カーネルタイムで処理が遮られるし、場合によってキャッシュが流される。
しかし全部のコアでカーネルが動くわけじゃない。
そこを避けさえすれば、明示的にコントロールすることすら可能だ。


あとFermiも含めテッセレータはソフト実装だから安心しろ。
FermiではCUDAで実装するんじゃね?
ソフト実装ではHull Shaderステージと内部処理レベルで統合してしまってもかまわんのだよ。
むしろそっちのほうが好都合だろう。
919 : ,,・´∀`・, - 2009/11/25(水) 08:19:40 ID:XnXiDy9n (+37,+29,-115)
>>917
俺が言ってることを復唱しなくても十分だよ。行間読めない人?

>ゆくゆくはCPUコアと統合し、
が1世代の話に見えるか?


いずれにせよストリーム処理には変わりないが、きわめて高確率で処理対象の近傍のデータが
キャッシュに載ってるからメモリまで取りに行く頻度は激減する。
920 : Socket77 - 2009/11/25(水) 08:51:26 ID:Ef07keRK (+6,+16,-5)
で、一世代目はいつ出るの?
921 : Socket77 - 2009/11/25(水) 09:13:41 ID:qLJteFOD (-5,+29,-3)
早かれ遅かれ来年の中頃
922 : Socket77 - 2009/11/25(水) 09:25:44 ID:ntSsR84y (+24,+29,-4)
なにげに楽しみだったんだけど、結構遅いんだな。
924 : Socket77 - 2009/11/25(水) 11:56:18 ID:DwMNJha2 (+27,+29,-49)
その論文のことじゃないが、
論文て肯定的な時だけ出すんじゃないぞ。±どちらでも書く。
これはこのように駄目でした、でも業績一つ稼げるんだから
925 : Socket77 - 2009/11/25(水) 12:04:41 ID:DwMNJha2 (+32,+29,-66)
こういう人達は素人fanboyみたいに、知らないまま否定する、ということは
しない。必ず検討する。そして検討に時間を費やした以上は
その労力を自分のキャリア・業績としてカウントされる形で残そうとする。
検討したということと、採用へ傾いたということとはほとんど独立している。
926 : Socket77 - 2009/11/25(水) 12:22:47 ID:qLJteFOD (-7,+22,-24)
その言い分だと、彼に研究すらされてない
TeslaやFireStreamは検討にすら値しないってことだけどな
927 : Socket77 - 2009/11/25(水) 12:29:50 ID:30IufTra (-15,+29,-122)
>>924
君が思ってる以上に米国の企業研究所は利益性に関してシビアだぞ。
なんで他社の製品の有用性を誇示し、自社製品のCellの商売上
不利益になりかねないレポートをIBMの名前で書かせる必要がある?

IBMが給料を出して研究者にLarrabeeの応用法を示させたことが
何を意味するのか、いくら鈍感でもわからないわけがないだろう。
928 : Socket77 - 2009/11/25(水) 13:15:19 ID:DwMNJha2 (+24,+29,-67)
>>927
IntelはLarabeeがx86であることを大きな柱として宣伝してるけど
>923 には既存の資産ではだめで新たに書き下ろさないと性能を
発揮させられないという意味の事が書かれている。
それなのに>927の目には、Intelの主張全肯定の”有用性の誇示”にみえるのか?
931 : Socket77 - 2009/11/25(水) 15:41:51 ID:30IufTra (-20,+29,-4)
↓これは自分自身のことを言ってたんだね

> 素人fanboyみたいに、知らないまま否定する
932 : Socket77 - 2009/11/25(水) 21:52:18 ID:sNlazQoU (+24,+29,-13)
テッセレータって結局分割自体より
増大後の頂点処理のほうが重かったりする
933 : Socket77 - 2009/11/25(水) 22:41:45 ID:96O39zqu (+16,+21,-21)
IBMがXeonサーバーばんばん売ってる間はインテル様もヨイショしないとな
Larrabeeお願いしますだぁって
934 : ,,・´∀`・, - 2009/11/25(水) 22:53:09 ID:XnXiDy9n (+27,+29,-54)
滑らかな曲線描くために頂点を増やすとかやんなくてもソフト実装されるラスタオペレーション側で
補完したほうがよっぽど処理は軽いと思うんだがね。
とか燃料投下してみる
936 : ,,・´∀`・, - 2009/11/25(水) 23:33:20 ID:XnXiDy9n (+23,+29,-39)
そもそもIBMは半導体製造業である前にソリューション屋だから
ソニー東芝の3馬鹿連合の腐れ縁引きずって商機を逃すような馬鹿な真似はしない。
937 : Socket77 - 2009/11/26(木) 00:08:55 ID:Cr5sHBSq (+38,+30,-267)
>>918
> >>916
> なんで「賭け」?
> あったらあったでトラフィック削れるし、無いなら無いでかまわんのだよ。
> キャッシュにないなら、メモリからとってくればいいじゃない。
> そこは従来のGPUと変わらん。

従来のGPUのグラフィクスはストリーム処理だから、そこでメモリにアクセスすることはないでしょ。
GPUの中をぐるぐる回るんだよ。

一方Larrabeeはタイルレンダのためそれができない。
VRAMに一時バッファを設けないといけない。
例えばテッセレーションする場合、分割しうる最大頂点数分バッファ確保しないといけない。
でそれが終わってタイルレンダ始めるときにL2に頂点が残ってる可能性なんて考えるだけ無駄。

Larrabeeでタイルを使うのは>>910のような積極的な理由でなく、
そうしないといわゆるROPの処理(特にZCull)で性能が出ないから仕方なくという面が
強いと思うな。

団子さんもGPUとしはLarrabeeに期待してないでしょ?
939 : ,,・´∀`・, - 2009/11/26(木) 00:15:30 ID:Y7m0S63w (-20,+29,-38)
Larrabeeに批判的なひとって
Larrabeeに対する理解どころか
GPUの構造に対する理解も無いんですね
940 : ,,・´∀`・, - 2009/11/26(木) 00:21:49 ID:Y7m0S63w (-24,+25,-45)
メモリ(VRAM)はGPUの「外」にあります。カード上には溶接されてますけどね。

残念なことに、GPUの「中」に全部データ置いておけるほどFLIP-FLOP回路無いんですよ
941 : Socket77 - 2009/11/26(木) 00:22:02 ID:Cr5sHBSq (+24,+23,-90)
>>938
> >従来のGPUのグラフィクスはストリーム処理だから、そこでメモリにアクセスすることはないでしょ。
> >GPUの中をぐるぐる回るんだよ。
>
> はぁ~?

あ団子さんいたw
テクスチャとかのことでなく>>913のことね。
だいたい従来のGPUはメモリに置き場所確保しないから置きようがないよ。
943 : ,,・´∀`・, - 2009/11/26(木) 00:48:38 ID:Y7m0S63w (-16,+29,-49)
>分割しうる最大頂点数分バッファ確保しないといけない。
ちなみにこれは換言するならば、キャッシュ上にバッファの断片を確保できる分だけの頂点単位で
分割処理すればキャッシュミスなしでステージ間を繋ぐことができるってことね
946 : Socket77 - 2009/11/26(木) 01:08:53 ID:Cr5sHBSq (+27,+29,-6)
そりゃ全く同じじゃないけどさ、
そこは言葉のあやってことで許してよ。
947 : ,,・´∀`・, - 2009/11/26(木) 01:23:19 ID:Y7m0S63w (-7,+30,-126)
あ、ちなみにL2にヒットするようにスケジューリングして動かすってのはLarrabee側の
タスクスケジューラの仕事であって、「専用」に組む必要は無いっしょ。
高級言語ランタイムで提供されるAPIで遣り繰りだけならね。


だが敢えてDirectXなどクソ食らえと言っておく。
音楽配信におけるApple、検索エンジンにおけるGoogleがそうであるように
猫も杓子もMSに主導権持たせる必要など無い。
948 : Socket77 - 2009/11/26(木) 01:36:51 ID:Cr5sHBSq (-3,+9,-20)
しまった2bitじゃなくて4bitだった。

>>947
DX11は結構長く使われそうな雰囲気。
レイトレ時代は早くてその後だろなー。
949 : Socket77 - 2009/11/26(木) 01:38:44 ID:qJQYxatM (+23,+29,-3)
>>947
クソ言う暇があったら自分で作れや
950 : ,,・´∀`・, - 2009/11/26(木) 01:51:30 ID:Y7m0S63w (-15,+29,-79)
コンシューマ優先のうちは、Xbox独り勝ちにでもならない限りは
どのみちクロスプラットフォームのミドルウェアで対応することになるからね。
柵の多いDirectXに囚われず自由にカスタムエンジン書きたい酔狂なエンジン屋さんがいるかぎり
ソフトウェアレンダラはそれなりに使われることになるでしょうよ

ちなみにEPICはLarrabeeべた褒め
←前へ 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 次へ→ / 要望・削除依頼は掲示板へ / 管理情報はtwitterで / Intel スレッド一覧へ
スレッド評価: スレッド評価について
みんなの評価 :
タグ : 追加: タグについて ※前スレ・次スレは、スレ番号だけ登録。駄スレにはタグつけず、スレ評価を。荒らしタグにはタグで対抗せず、タグ減点を。

類似してるかもしれないスレッド


トップメニューへ / →のくす牧場書庫について