私的良スレ書庫
不明な単語は2ch用語を / 要望・削除依頼は掲示板へ。不適切な画像報告もこちらへどうぞ。 / 管理情報はtwitterでログインするとレス評価できます。 登録ユーザには一部の画像が表示されますので、問題のある画像や記述を含むレスに「禁」ボタンを押してください。
元スレcellプログラミングしちゃいなよ3
cell スレッド一覧へ / cell とは? / 携帯版 / dat(gz)で取得 / トップメニューみんなの評価 : ☆
レスフィルター : (試験中)
128bitあたり、15サイクルのスループットで済むと仮定して、オーバーヘッド抜きのスループットは5.47M切るくらい?でいいのかな?
えーと、絶望させちゃっていいかな?
【とっくに切ってるよ】
逆にどこに限界があるのかわからなくなってきたよ。
えーと、絶望させちゃっていいかな?
【とっくに切ってるよ】
逆にどこに限界があるのかわからなくなってきたよ。
だんごに勝つにはtemperingの命令数減らすことを本気で考えたほうが良い。
そこから道が開けると思う。
アンロールしてタイミング詰めるのはそれからでも遅くない。
そこから道が開けると思う。
アンロールしてタイミング詰めるのはそれからでも遅くない。
具体的な方法論は誰も公開してないんだぜ。
5M台叩き出してる人はアルゴリズムレベルでは殆ど同じコードになってると思う。必然的に。
あとは0.1パーセント単位のチューンってことになるわけだが
最後まで粘ったもん勝ちになりそうだな。
5M台叩き出してる人はアルゴリズムレベルでは殆ど同じコードになってると思う。必然的に。
あとは0.1パーセント単位のチューンってことになるわけだが
最後まで粘ったもん勝ちになりそうだな。
ってかさぁ、15cycle とかホントに出来んの?
ってか、みんなマジでこんなとこに書いてんの?w
ってか、みんなマジでこんなとこに書いてんの?w
とりあえず、良くも悪くもこのスレに書き込まれたことで、ここら辺の性能が
スタンダードになってしまったな。
まだ2か月近くあるしね。
スタンダードになってしまったな。
まだ2か月近くあるしね。
ORIGNAL: sum=3c927c56, 294426736 ticks
MINE: sum=3c927c56, 5470853 ticks
ORIGNAL: sum=2e987a4d, 424726988 ticks
MINE: sum=2e987a4d, 7891991 ticks
ORIGNAL: sum=ef1b6aef, 312523179 ticks
MINE: sum=ef1b6aef, 5807115 ticks
ORIGNAL: sum=eedd2516, 290445788 ticks
MINE: sum=eedd2516, 5396877 ticks
ORIGNAL: sum=f7e967a8, 14386174 ticks
MINE: sum=f7e967a8, 267359 ticks
ORIGNAL: sum=1f37a7db, 214504754 ticks
MINE: sum=1f37a7db, 3985803 ticks
ORIGNAL: sum=c7d41f36, 295361550 ticks
MINE: sum=c7d41f36, 5488220 ticks
ORIGNAL: sum=aa9d2e9f, 259914712 ticks
MINE: sum=aa9d2e9f, 4829583 ticks
ORIGNAL: sum=8abd398a, 251182134 ticks
MINE: sum=8abd398a, 4667315 ticks
ORIGNAL: sum=a374bd58, 6118517 ticks
MINE: sum=a374bd58, 113731 ticks
このスコアをここに晒せるって意味を理解してくれ。
MINE: sum=3c927c56, 5470853 ticks
ORIGNAL: sum=2e987a4d, 424726988 ticks
MINE: sum=2e987a4d, 7891991 ticks
ORIGNAL: sum=ef1b6aef, 312523179 ticks
MINE: sum=ef1b6aef, 5807115 ticks
ORIGNAL: sum=eedd2516, 290445788 ticks
MINE: sum=eedd2516, 5396877 ticks
ORIGNAL: sum=f7e967a8, 14386174 ticks
MINE: sum=f7e967a8, 267359 ticks
ORIGNAL: sum=1f37a7db, 214504754 ticks
MINE: sum=1f37a7db, 3985803 ticks
ORIGNAL: sum=c7d41f36, 295361550 ticks
MINE: sum=c7d41f36, 5488220 ticks
ORIGNAL: sum=aa9d2e9f, 259914712 ticks
MINE: sum=aa9d2e9f, 4829583 ticks
ORIGNAL: sum=8abd398a, 251182134 ticks
MINE: sum=8abd398a, 4667315 ticks
ORIGNAL: sum=a374bd58, 6118517 ticks
MINE: sum=a374bd58, 113731 ticks
このスコアをここに晒せるって意味を理解してくれ。
あれからパイプラインの空きを半分くらいまで詰められたけど、
コンパイラが糞でどうにもならない状態。
.L9: ; メインループの先頭
lqr $81,mt+X
lqr $84,mt+X
lqr $53,mt+X
lqr $41,mt+X
lqr $47,mt+X
lqr $48,mt+X
lqr $59,mt+X
lqr $68,mt+X
lqr $24,mt+X
lqr $71,mt+X
lqr $113,mt+X
lqr $42,mt+X
lqr $43,mt+X
lqr $45,mt+X
lqr $46,mt+X
lqr $58,mt+X
lqr $55,mt+X
lqr $93,mt+X
lqr $104,mt+X
shufb $106,$73,$81,$127
>>312
数日前のスコアですか?
コンパイラが糞でどうにもならない状態。
.L9: ; メインループの先頭
lqr $81,mt+X
lqr $84,mt+X
lqr $53,mt+X
lqr $41,mt+X
lqr $47,mt+X
lqr $48,mt+X
lqr $59,mt+X
lqr $68,mt+X
lqr $24,mt+X
lqr $71,mt+X
lqr $113,mt+X
lqr $42,mt+X
lqr $43,mt+X
lqr $45,mt+X
lqr $46,mt+X
lqr $58,mt+X
lqr $55,mt+X
lqr $93,mt+X
lqr $104,mt+X
shufb $106,$73,$81,$127
>>312
数日前のスコアですか?
15clkが本当なら>>312は99%突破してるわけだが
このスレで期限前に最速コードを公開して、コンテストを無効化して、そして伝説へ…
なんてストーリーがあるのかなと妄想してたよ。2chっぽくさ。いやいや、全然勧めてないからやらないでね。
いや、でも、なかなか燃える展開だな。がんばれ、団子3兄弟。
なんてストーリーがあるのかなと妄想してたよ。2chっぽくさ。いやいや、全然勧めてないからやらないでね。
いや、でも、なかなか燃える展開だな。がんばれ、団子3兄弟。
58156364 / 4(SIMD) * 15(cycle) / 40(ticks) = 5452159.125 か。
だれか 15cycle の壁をやぶってくれw
だれか 15cycle の壁をやぶってくれw
きそう、この週末丁度暇になったのにPS3は会社のだから事務所に置きっぱなしだ……
尤も、半年以上放置しているから今更勘が戻らないけどね。
尤も、半年以上放置しているから今更勘が戻らないけどね。
>>328
大丈夫、俺なんてCellプログラミングは初めてだ。
リモートの開発環境も用意してくれるよ。
・・・べ、別に誘ってるわけじゃないんだからねっ!
どっちかっていうとライバルが増えると困るんだからねっ!
大丈夫、俺なんてCellプログラミングは初めてだ。
リモートの開発環境も用意してくれるよ。
・・・べ、別に誘ってるわけじゃないんだからねっ!
どっちかっていうとライバルが増えると困るんだからねっ!
あ、>>301 の 5.47M は間違いだと思われ
>>312は2日前の成果。日増しに(わずかながらではあるが)性能は伸びてる
理論スループット15になる方法思いついたときは俺SUGEEEEEEEEEEって思ったけど
そこまでは案外みんな気づくの早かったな。
そこまでは案外みんな気づくの早かったな。
>てっきり15サイクル切ったと思ったけど、本気で15サイクルのコードで
それは秘密。
ただ、部分的に式の変形はしてる。高速化のためにどうしても必要だった。
それは秘密。
ただ、部分的に式の変形はしてる。高速化のためにどうしても必要だった。
ど素人ですけど、CELLに悪戦苦闘してる方々に質問。
CELLのメモリ構成の扱いにくさって、将来LSの容量が増えて
各SPUが特定の仕事に専心するようになったら、それほど
大きな足かせにならない気がするんですけど、どうでしょうか?
今はLSの容量が少なすぎて、頻繁に書き換えが必要だから超面倒だけど。
クタはそこまで考えて、LSにしたんじゃないんでしょうか?
CELLのメモリ構成の扱いにくさって、将来LSの容量が増えて
各SPUが特定の仕事に専心するようになったら、それほど
大きな足かせにならない気がするんですけど、どうでしょうか?
今はLSの容量が少なすぎて、頻繁に書き換えが必要だから超面倒だけど。
クタはそこまで考えて、LSにしたんじゃないんでしょうか?
なんか書き込みがゲハ臭いから回答すべきか「帰りな」と言うべきか迷うが。
クタだけに焦点を当てるなら、PS3を設計している最中に「LSが増えたら」が無いのは考えれば分かる話だよな?
クタだけに焦点を当てるなら、PS3を設計している最中に「LSが増えたら」が無いのは考えれば分かる話だよな?
ほんとゲハ臭いなw
>>344
ここで Hack the Cell やるような人は扱いにくいとか思ってないんじゃん?
扱いにくいってなるのは、プロジェクトが大きくなって C# あがりの
へたれプログラマも使わなきゃいけなくなった時じゃないかな?
Hack the Cell やるような職人にとっては LS の容量が少なくて超面倒って
事はなくて(ちょっと面倒くらいw)、へたれにとっては LS の容量が増えても、
ヘテロだったり cache じゃなかったりの時点で超面倒なんだと思われ。
今だったら Larrabee みたいな方がいいに決まってるっしょ。
>>344
ここで Hack the Cell やるような人は扱いにくいとか思ってないんじゃん?
扱いにくいってなるのは、プロジェクトが大きくなって C# あがりの
へたれプログラマも使わなきゃいけなくなった時じゃないかな?
Hack the Cell やるような職人にとっては LS の容量が少なくて超面倒って
事はなくて(ちょっと面倒くらいw)、へたれにとっては LS の容量が増えても、
ヘテロだったり cache じゃなかったりの時点で超面倒なんだと思われ。
今だったら Larrabee みたいな方がいいに決まってるっしょ。
今だったら => 今から作るんだったら
LarrabeeってCell扱うのはマンドクセッと思ってる
ヘタレ(と言うよりPCのCPUのみ扱い慣れている)
プログラマに取ってはいかにも扱いやすそうに見えるが
キャッシュレベルで勝手に同期が取られる事を良い事に
ついスレッドのあちこちで頻繁に同期を取るプログラムを
書いてしまってそれがキャッシュ用リング?バスの帯域を
圧迫してパフォーマンスが出ないと言う罠に陥りそうな希ガス。
ヘタレ(と言うよりPCのCPUのみ扱い慣れている)
プログラマに取ってはいかにも扱いやすそうに見えるが
キャッシュレベルで勝手に同期が取られる事を良い事に
ついスレッドのあちこちで頻繁に同期を取るプログラムを
書いてしまってそれがキャッシュ用リング?バスの帯域を
圧迫してパフォーマンスが出ないと言う罠に陥りそうな希ガス。
前へ 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 次へ / 要望・削除依頼は掲示板へ / 管理情報はtwitterで / cell スレッド一覧へ
みんなの評価 : ☆類似してるかもしれないスレッド
- cellプログラミングしちゃいなよ4 (607) - [97%] - 2009/3/24 11:04 ○
- CELL鬯ッ?ゥ隰ウ?セ??ス??オ????コ?????ッCore2 QX6700鬯ッ?ゥ隰ウ?セ??ス??オ????コ???? (92) - [18446744073709551581%] - 2012/1/21 0:39
トップメニューへ / →のくす牧場書庫について