のくす牧場
コンテンツ
牧場内検索
カウンタ
総計:127,062,831人
昨日:no data人
今日:
最近の注目
人気の最安値情報

    私的良スレ書庫

    不明な単語は2ch用語を / 要望・削除依頼は掲示板へ。不適切な画像報告もこちらへどうぞ。 / 管理情報はtwitter
    ログインするとレス評価できます。 登録ユーザには一部の画像が表示されますので、問題のある画像や記述を含むレスに「禁」ボタンを押してください。

    元スレcellプログラミングしちゃいなよ3

    cell スレッド一覧へ / cell とは? / 携帯版 / dat(gz)で取得 / トップメニュー
    スレッド評価: スレッド評価について
    みんなの評価 :
    タグ : 追加: タグについて ※前スレ・次スレは、スレ番号だけ登録。駄スレにはタグつけず、スレ評価を。荒らしタグにはタグで対抗せず、タグ減点を。
    レスフィルター : (試験中)
    ←前へ 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 次へ→ / 要望・削除依頼は掲示板へ / 管理情報はtwitter
    251 : ,,・´∀`・, - 2009/01/09(金) 00:16:43 (-6,-24,+0)
    4.3でやれ。
    252 : ,,・´∀`・, - 2009/01/09(金) 00:17:14 (+29,-29,-2)
    一番上が29Mticksくらい
    253 : 227 ◆eZQ - 2009/01/09(金) 00:17:58 (+70,+20,-12)
    何とか6MTick突破。spu_timing 見る限りもっと詰められそうな気もする…。
    これからドルアーガの中継見て寝る。

    >>228
    今は3Dプログラミングだけに集中したいと思っていたりもします。
    254 : デフォルトの名無 - 2009/01/09(金) 00:21:06 (-1,-29,-7)
    spu_timing ってなんですか?とググらずに聞いてみるテスト。
    255 : ,,・´∀`・, - 2009/01/09(金) 00:35:28 (+138,+29,-4)
    もっと画期的なモン使えよ
    256 : 250 - 2009/01/09(金) 02:25:25 (+66,+29,-38)
    >>252
    ども。29M って事は、50 倍だとやっぱとりあえずの目標が 6M なのね。
    いま、ちょっとやったら 10M@gcc4.1 にはなった。さっきは 20M。
    さらに半減かぁ。だんだん最適化できる所が減ってきたなぁ。
    257 : 202 - 2009/01/09(金) 10:38:25 (+55,+29,-77)
    アンローリングしまくったら遅くなって、アセンブラ見るとローカル変数をLSに読み書きしてる・・・
    コンパイラがバカなのか、レジスタ128個じゃパイプライン詰められないのか、よく判らん。
    258 : デフォルトの名無 - 2009/01/09(金) 11:02:56 (+116,-29,-3)
    5.6M切ったよ
    259 : 202 - 2009/01/09(金) 11:05:40 (+57,+29,-2)
    うぁー、5M台増えてきたな。
    みんなすげー。
    260 : 202 - 2009/01/09(金) 11:13:40 (+65,+29,-29)
    現在確認されている5M台は、だんごさん、俺、>>227>>258 と、リーク情報の提出者か。
    提出者 = >>258 だったりしないのかな?
    261 : 202 - 2009/01/09(金) 11:18:35 (+56,+28,-45)
    トリップ付けて、コードのコメントにトリップパスつけるという手もあるな。
    262 : 258 - 2009/01/09(金) 11:48:22 (+57,-4,-4)
    団子先生(笑)と同じチームだったりします。
    263 : デフォルトの名無 - 2009/01/09(金) 11:58:18 (+70,+29,-84)
    >>262
    名前貸してPS3をゲットを狙ってる人か
    >>247の書き込みみると,学生部門じゃなく社会人部門で参加してるのね


    ところでCellチャレやってる人はいないのかな
    ここ学生少ないんかね?
    264 : デフォルトの名無 - 2009/01/09(金) 13:47:18 (+41,-29,-49)
    トリップで mt_mine.c の sha1sum 書き込んどきゃいいじゃん
    265 : ,,・´∀`・, - 2009/01/09(金) 17:17:15 (+63,+30,-83)
    証明する気など更々ないんだが

    中の人は中の人名義で別の活動やってるからこっちの名前で技術的名声得ても何のメリットもないし。
    だんごやさんとは所詮「記号」だ。tanasinnなみに退廃的な概念だ。
    なによりでしゃばりすぎだ、だんごやさんは
    266 : 202 - 2009/01/09(金) 22:38:08 (+62,+29,-17)
    >>264
    一度トリップ付けたら、その後ソース改変できなくなるじゃん。
    267 : 264 - 2009/01/09(金) 22:44:14 (+57,+29,-7)
    ん??改変したらまた新しいの書き込めばいんじゃん?
    268 : デフォルトの名無 - 2009/01/10(土) 01:09:01 (+101,+24,-52)
    >212
    「45nmで32コア+PPE2コアのCell」がどこかで発表されたの?
    論理設計してみただけとか言う話じゃなく、試作チップくらい作られた?

    検索したけど見つからなかったので差し支えなければソースを教えてくれ。
    269 : デフォルトの名無 - 2009/01/10(土) 03:45:46 (+60,+30,+0)
    270 : ,,・´∀`・, - 2009/01/10(土) 03:46:09 (+50,-8,-6)
    勘違いだった。投入は来年(2010年)ごろらしいよ。
    271 : 227 ◆eZQ - 2009/01/10(土) 04:50:14 (+117,+30,-35)
    今日と月曜休日出勤命令が出たと言うのに、こんな時間まで現実逃避して
    しまって良いのだろうか…。

    >>255
    何この芸術的な画面。こっちは一画面分片側無しとか有るんですがw

    >>258
    ようやく追いつけた、けど次にやるべき事が見えてこない罠。
    272 : ,,・´∀`・, - 2009/01/10(土) 07:05:00 (-1,-29,-14)
    一番綺麗なところ見せてるに決まってるじゃんか。

    Odd側でレイテンシ1なのはlnopかhbrだと思っていいよ。
    273 : 202 - 2009/01/10(土) 10:42:06 (+34,-27,-5)
    5.6M切ったところに壁があるのかな?
    274 : ,,・´∀`・, - 2009/01/10(土) 13:16:46 (+57,+29,-9)
    なんで速くなったのかわかんねーが理論限界にまた一歩近づいた
    275 : ,,・´∀`・, - 2009/01/10(土) 17:56:53 (+96,+29,-5)
    >>273
    1%上げるのすら絶対無理な境地に達した。
    276 : 202 - 2009/01/10(土) 18:13:37 (+70,+29,-22)
    >>275
    mjd!? 優勝候補ブチ抜けるんじゃない?
    俺も準優勝以上目指して頑張ろう。

    プライベートがゴタゴタしまくってて、せっかくの休みなのに殆ど弄れねー。
    277 : ,,・´∀`・, - 2009/01/10(土) 18:32:08 (+62,+29,-51)
    っていうかね

    コアループの内側の片方パイプ側が全部隙間無く埋まっちゃって
    これ以上どうしようもないんだよね

    外側をどうにかするとかいうレベルでのチューンしかできない。

    とはいってもTick数が10とか20変わるレベルなんだけど
    278 : ,,・´∀`・, - 2009/01/10(土) 20:29:05 (+91,+29,-1)
    優勝候補ってのはオレのチームに決まってるだろ
    279 : 202 - 2009/01/10(土) 22:05:00 (+73,+29,-53)
    >>278
    ちょw、>>243の優勝候補って団子さん自身だったのかよwww

    他人のスコアをリークするfixstars社員がいるのかと思ったよ。
    280 : ,,・´∀`・, - 2009/01/10(土) 22:18:04 (+107,+29,-17)
    っていうか>>271見て焦った
    だが、普通無理だろっていう境地に達した

    敢えて言う
    spu-gcc43の特性見切った
    281 : デフォルトの名無 - 2009/01/10(土) 22:24:15 (+72,+29,-23)
    >>280
    のちの団子氏によると、ここが真のスタートラインだったという。
    282 : ,,・´∀`・, - 2009/01/10(土) 22:48:46 (+44,+29,-34)
    スタートラインに立ってる人間いくらいるんだろうな?
    ループ内で片方のパイプ全部埋まってる状態なんだが。
    埋めるのしんどかった。アセンブラ使わずにだからな。
    283 : デフォルトの名無 - 2009/01/10(土) 23:00:01 (+57,+29,-9)
    というコメントを書き込み、団子氏はふと気付いた。
    「アセンブラを使ったら…」
    284 : ,,・´∀`・, - 2009/01/10(土) 23:05:56 (+57,+29,-14)
    じゃあ質問してきてよ。
    アセンブラ使っていいかどうか

    っていうか変数おっかけるのめんどくせぇ
    285 : デフォルトの名無 - 2009/01/10(土) 23:16:34 (+57,+29,-7)
    というコメントを残しており、
    動機は未だに不明。
    では、次のニュースです。
    286 : デフォルトの名無 - 2009/01/10(土) 23:17:57 (+57,+29,-29)
    まさか、そこまで普通しないだろう。
    そう、普通はしない。
    しかし、Cellをいじる様な人種に常識は通用しないのだ。
    287 : デフォルトの名無 - 2009/01/10(土) 23:22:24 (+101,+29,-70)
    今までなんとなく、心にぼんやりとあった、疑問が脳裏をよぎる。

    "なぜ、MTの限られた最適化で、LSの容量も制限するという、こんなにもきつい制限の課題なのか。"

    そう。実は要求レベルは、その領域にあったのだ。
    288 : デフォルトの名無 - 2009/01/10(土) 23:30:06 (+103,+30,-35)
    スタート地点に立てた人間は、そうは多くない。しかし、そこまで行きついたものは確実に、"次"に気づいた。
    だが、それらの人間とは別に、ごく一部、初めからその道を進んでいたものもいた。

    そして、その先には、さらなる波乱が待っていた。
    289 : デフォルトの名無 - 2009/01/10(土) 23:48:48 (+8,-29,-14)
    ってかさぁ、1 tick って何 cycle くらいなの?
    そっから逆算すると、5.6 M の時って平均何 cycle / 32bit 生成くらい?
    290 : 268 - 2009/01/11(日) 01:37:26 (+58,+28,+0)
    >270
    納得した。
    291 : 202 - 2009/01/11(日) 01:58:42 (+0,-29,-18)
    >>289
    知ってるが、教えたくない情報の一つだなw

    ヒント: cpuinfo
    293 : デフォルトの名無 - 2009/01/11(日) 02:36:26 (+50,-30,-40)
    >>289, 291
    40cycle/1tickだろ。5.6Mだと3.85cycle/32bitくらいか。
    最低限SIMD化したとして15.4cycle/128bit。
    unroll効いてるとして16~7cycle/128bitくらいか。
    ホントにそんなんで出来るんか???
    294 : 227 ◆eZQ - 2009/01/11(日) 02:45:23 (+0,-30,-75)
    >>282
    少ない方が100ぐらい空いてるので、全部詰められれば0.25MTickか…。
    コンパイラが糞なら asm volatile を使って手動スケジューリングでも
    しようかと考え中です。

    >>292
    while( spu_read_decrementer() < ~16384 ) rand();
    295 : ,,・´∀`・, - 2009/01/11(日) 04:57:09 (-1,-29,-33)
    SPU_Decrementerは内部的にチャンネル使ってます。
    296 : ,,・´∀`・, - 2009/01/11(日) 05:07:17 (+57,+29,-37)
    配列にマシン語記述ってのどうかな?

    ありがちな方法だな。
    いけないプログラマ丸出し
    297 : 202 - 2009/01/11(日) 07:55:31 (+43,-29,-118)
    >>293
    unrollするとってくだりからアレだが、そこまでの推測は正しいと思うよ。

    15.4という数値がでてきたとすると、15cycle+0.4cycleで0.4がオーバーヘッドになる。
    オーバーヘッドは1%くらいに抑えたいから、目標は5.51Mticksを切ること。
    トップクラスはそのあたりにある壁にどこまで近づけるかというチキンレース中。

    というところまで推測できちゃうから、みんなticks数は有効数字一桁しか出さなかったんだけど、
    だんごさんが有効数字二桁の情報を出してきたのは、「cycle数で並ばれても壁までの近さなら
    負けない」という意思表示かな。カッコイイ。
    298 : 202 - 2009/01/11(日) 07:56:41 (+31,+3,-3)
    普段使ってるのと違うPCで書き込みしたらsage忘れた。スマソ。
    299 : ,,・´∀`・, - 2009/01/11(日) 08:15:21 (+3,-29,-72)
    >unroll効いてるとして16~7cycle/128bitくらいか。
    これが意味不明なんだけどね。

    アンロールしようが何しようが演算ユニットが増えるわけじゃない。
    演算ユニットの稼働率をいくらまで詰めるかって課題なわけで。
    300 : ,,・´∀`・, - 2009/01/11(日) 08:29:36 (+57,+29,-26)
    っていうか
    「15サイクル」って具体的な数字が出てきたけど、本当にそれでいいのか、そこから考えないといけない。
    ←前へ 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 次へ→ / 要望・削除依頼は掲示板へ / 管理情報はtwitterで / cell スレッド一覧へ
    スレッド評価: スレッド評価について
    みんなの評価 :
    タグ : 追加: タグについて ※前スレ・次スレは、スレ番号だけ登録。駄スレにはタグつけず、スレ評価を。荒らしタグにはタグで対抗せず、タグ減点を。

    類似してるかもしれないスレッド


    トップメニューへ / →のくす牧場書庫について