のくす牧場
コンテンツ
牧場内検索
カウンタ
総計:127,062,838人
昨日:no data人
今日:
最近の注目
人気の最安値情報

    私的良スレ書庫

    不明な単語は2ch用語を / 要望・削除依頼は掲示板へ。不適切な画像報告もこちらへどうぞ。 / 管理情報はtwitter
    ログインするとレス評価できます。 登録ユーザには一部の画像が表示されますので、問題のある画像や記述を含むレスに「禁」ボタンを押してください。

    元スレcellプログラミングしちゃいなよ3

    cell スレッド一覧へ / cell とは? / 携帯版 / dat(gz)で取得 / トップメニュー
    スレッド評価: スレッド評価について
    みんなの評価 :
    タグ : 追加: タグについて ※前スレ・次スレは、スレ番号だけ登録。駄スレにはタグつけず、スレ評価を。荒らしタグにはタグで対抗せず、タグ減点を。
    レスフィルター : (試験中)
    ←前へ 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 次へ→ / 要望・削除依頼は掲示板へ / 管理情報はtwitter
    401 : ,,・´∀`・, - 2009/01/14(水) 02:20:52 (+64,+29,-7)
    2のべき乗ならいいんじゃないの?
    テキトーに言ってみるけど。
    402 : デフォルトの名無 - 2009/01/14(水) 09:07:02 (+0,-29,-24)
    >>400
    そこだけでいいと思うけど・・・
    PS3なら個数は1~6までSPEが利用できる
    403 : デフォルトの名無 - 2009/01/14(水) 12:06:10 (+24,-21,-4)
    >>389
    SFMTより速いんじゃね?
    404 : デフォルトの名無 - 2009/01/14(水) 12:42:54 (+45,-29,-114)
    >>401-402
    ありがとうございます。
    変更箇所はこちらであっているみたいですね
    タイム関数を利用して処理時間を測定しても、逆にSPEを利用したほうが時間が延びてしまいます。
    理論上ではSPE1からSPE4にしたら1/4になるはずですよね?
    ppeのメイン関数にあるresultをかこって測定しているのですが適切ではないのかな
    すみません、出力に要した時間を測定するにはどこが適切なのでしょう
    http://cell.fixstars.com/pukiwiki/index.php?tips_timebase タイム関数はこれを使用しています
    405 : デフォルトの名無 - 2009/01/14(水) 13:21:25 (+64,+29,-26)
    >>404
    そもそもこの問題ってそんな大規模な数を計算してないから
    下手にSPE増やすとデータ転送時間やらその他もろもろが増えて
    逆に遅くなる可能性のほうが高いよ
    406 : デフォルトの名無 - 2009/01/14(水) 14:42:22 (+57,+29,-36)
    そうですか…わかりました。測定するプログラム自体が間違いだったんですかw
    性能を見るために適したプログラム・・・どっかありますかね?
    探してみます。
    407 : デフォルトの名無 - 2009/01/14(水) 16:03:39 (+96,+29,-128)
    質問です。
    CELLとLarrabee ってどの程度性能差があるんですか?
    大して性能差がないとしたら、仮にPS4が出るとして、
    ソニーがCELLに拘る意味って、もはや無いのでは?
    むしろPCの世界で主流になるであろう、Larrabeeに
    切り替えた方がコスト的にも有利なのでは?
    408 : デフォルトの名無 - 2009/01/14(水) 16:50:01 (+34,+11,+0)
    ゲハ板にお帰りください。
    409 : ,,・´∀`・, - 2009/01/14(水) 17:16:08 (+43,-26,-151)
    >>403
    逆説的だけど、並列演算を前提にした場合、実はオリジナルのMTのほうが並列度の高い
    (高くしないと性能の出ない)アーキテクチャに向いてるってのはある。

    MTの配列のうち、先頭から224個、残りの400個は並列演算可能だ。
    これはCUDAの実装についての説明。
    ソースはCUDA SDKのサンプルにも入ってる。
    http://developer.download.nvidia.com/compute/cuda/sdk/website/projects/MersenneTwister/doc/MersenneTwister.pdf

    それに対して、対してSFMTは4要素(=128ビット)の計算をしないとその次の4要素の計算ができない。
    要するに依存関係があって、128ビット性能が出ない。
    各命令のレイテンシが大きいとSFMTは相対的に不向きってことになるかもね。
    410 : ,,・´∀`・, - 2009/01/14(水) 17:18:53 (+0,-28,-56)
    × 要するに依存関係があって、128ビット性能が出ない。
    × 要するに依存関係があって、128ビットSIMD演算を低レイテンシで実行できるアーキでないとが出ない。
    411 : デフォルトの名無 - 2009/01/14(水) 17:38:23 (+51,+28,+0)
    つっこみたいんだが
    412 : ,,・´∀`・, - 2009/01/14(水) 17:44:30 (+3,-29,-66)
    どうぞ


    今回の課題のMTはSFMTと比べてレイテンシを埋めるためのテクニックが使いやすいのは事実だよ。
    っていうか誰かCUDAにSFMT移植してごらん?4論理スレッドしか並列実行できない悲惨なことになる。
    413 : デフォルトの名無 - 2009/01/14(水) 17:45:45 (+57,+29,-2)
    いや、どっちも×なところになんだがw
    414 : ,,・´∀`・, - 2009/01/14(水) 17:48:20 (+53,+25,-70)
    ○ 要するに依存関係があって、128ビットSIMD演算を低レイテンシで実行できるアーキでないと性能が出ない。

    タイピングしすぎで腱鞘炎になりそう
    415 : デフォルトの名無 - 2009/01/14(水) 18:36:35 (+70,+29,-127)
    >407
    Larrabeeはまだ世の中に出ていないので誰にも分かりません。
    性能比較は用途によって変わるので今、Cellが使われている用途に
    そのままLarrabeeが使われたらどうなるかなんて仮定の話は
    Intelの中の人ですら分からないでしょう。

    またPC用のCPUの世界でLarrabeeのような
    シンプルなコアをたくさん集積したメニーコアが
    すぐに流行る事も無いでしょう。

    流行るとしてもだいぶ先の話(10年先か20年先か?)
    416 : デフォルトの名無 - 2009/01/14(水) 20:19:04 (+63,+29,-18)
    >>409
    速さもランダム性も優れているなんて虫が良すぎるんじゃないかとは思っていたんだ。
    ふつーなら、どっちかのはずだもんな。元がひどくない限りは。
    417 : 227 ◆eZQ - 2009/01/14(水) 22:15:12 (-4,-27,-1)
    99%超えたおー
    418 : デフォルトの名無 - 2009/01/15(木) 10:44:32 (-1,-29,-42)
    http://cell.fixstars.com/challenge/faq.html#kadai4
    > インラインアセンブラは使用してもよいですか?
    > インラインアセンブラは禁止としていましたが、使用していただいて構いません。(1/15 更新)
    419 : デフォルトの名無 - 2009/01/15(木) 10:46:52 (+52,+29,+0)
    中の人このスレ見てるな。
    420 : デフォルトの名無 - 2009/01/15(木) 11:23:12 (+57,+29,-17)
    なんか、いきなり競争のルールが変わってしまったな。
    421 : デフォルトの名無 - 2009/01/15(木) 11:33:29 (+57,+29,-9)
    いちいちルールなんて再確認しないだろうから、このスレ見てない人が可哀想だよな。
    422 : デフォルトの名無 - 2009/01/15(木) 11:38:36 (+57,+29,-45)
    迷走してるな。
    アセンブラレベルでCellを熟知してない人間にはチャンスを与えない試験に成り果てた。
    コンパイルオプション変更許可しない意味が既に無い。
    423 : デフォルトの名無 - 2009/01/15(木) 11:58:29 (+58,+30,-53)
    >アセンブラレベルでCellを熟知してない人間にはチャンスを与えない試験に成り果てた。
    そのレベルの人には元々「勝つ」チャンスは無いと思います。
    参加する事に意義がある。
    424 : デフォルトの名無 - 2009/01/15(木) 12:05:30 (+57,+29,-16)
    アセンブラ許可自体は歓迎だが、こんなことをやると

    「受賞者は最初から決めてあったんだよ!」

    と言われかねない。
    425 : デフォルトの名無 - 2009/01/15(木) 12:11:38 (+91,+29,-50)
    >>アセンブラレベルでCellを熟知してない人間にはチャンスを与えない試験に成り果てた。
    >そのレベルの人には元々「勝つ」チャンスは無いと思います。

    202がんがれ、超がんがれ
    426 : デフォルトの名無 - 2009/01/15(木) 12:18:14 (+70,+29,-8)
    >>425
    いやいや、202は既に熟知「した」だろ。
    427 : デフォルトの名無 - 2009/01/15(木) 12:19:00 (+57,+29,-40)
    うーん、確かにコンテストを始めてからルールを変えるのはなんだかな。
    再提出のチャンスがあるとは言えど。

    主催者はルールが変わった事をメールなどで周知徹底すべきだろう。
    428 : 202 - 2009/01/15(木) 12:25:20 (+39,-30,-93)
    ちょ、許可になったのかよ!!

    アセンブラを生成するスクリプトをCソース吐くように改変して、
    どうやって最適化昨日によるデチューンから逃れるか試行錯誤してたのに!
    #pragma GCC optimize ("-O0") も、 __attribute__ ((optimize(0))) も使えない、
    変数をvolatileにしたらスタックにpush/popするから超遅い、etcetc、、、

    俺の2日間かえせーー!
    429 : 250 - 2009/01/15(木) 12:45:16 (-1,-29,-30)
    まぁ、でも本当に Hack the spu-gcc43 になってたからな…
    おいらも 4.1 だとうまくいった最適化抑制手法が、4.3 だと
    使えなかったりして結構虚しくなってたからよかったかも。
    430 : ,,・´∀`・, - 2009/01/15(木) 12:48:42 (+52,+29,-1)
    敢えて言う。
    今までのは全部Cだ。
    431 : 250 - 2009/01/15(木) 12:53:01 (+61,+29,-41)
    あ、コンテスト終わったらでいいから、だんごさんがどうやって
    最適化抑制してたのか教えてほしいかも。おいらがやってたのは
    4.3 にしたら even にまで命令追加されて使えなかったっす。
    432 : デフォルトの名無 - 2009/01/15(木) 12:54:18 (+91,+29,-12)
    どうせ、そこまでやるんならコンパイラオプションも変更可能にして
    何でもアリアリの条件で競争させて欲しい。
    433 : 202 - 2009/01/15(木) 12:57:42 (+104,+29,-19)
    >>432
    インラインアセンブラ解禁=何でもアリだよ。
    別のコンパイラで、別のコンパイルオプションでアセンブリソース吐かせて、
    それをインラインアセンブラで埋め込めば良いんだから。
    434 : 250 - 2009/01/15(木) 12:58:21 (+40,-29,-14)
    >>431
    あ、even に追加されたのは、ori $n,$n,0 ね。
    even に追加することねーだろ、って叫びたいw
    435 : 202 - 2009/01/15(木) 12:58:23 (+57,+29,-10)
    あ、ごめん。
    実質なんでもアリなら、本当に何でもアリにしてくれっていう意味ね。
    436 : 202 - 2009/01/15(木) 12:59:15 (+63,+29,-10)
    >>434
    ありすぎて困るwww
    ソース破壊しない命令ばっかだから、絶対いらないのにねー。
    437 : デフォルトの名無 - 2009/01/15(木) 13:00:04 (+71,+29,-16)
    >433
    うん、だからもはや意味の無い形式だけのコンパイルオプションを
    いじるなと言う制約を外した方が分かりやすいだろ?
    438 : デフォルトの名無 - 2009/01/15(木) 13:19:20 (-1,-29,-24)
    やるなら mt_mine.c だけオプション分離しないと、
    オリジナルの速度とかテストベンチにまで影響が…
    439 : ,,・´∀`・, - 2009/01/15(木) 18:47:17 (+88,+22,-22)
    SPUのアセンブリ言語はちょっとだけ読めるけどあれだけのコードをまともに書ける気がしない。
    うまく飼いならせばspu-gcc43こそ最強の高級アセンブラ
    440 : 250 - 2009/01/15(木) 19:30:29 (-1,-29,-20)
    未だに 4.3 は飼いならし方がわからんす。attribute とかじゃないんすよね?
    441 : 250 - 2009/01/15(木) 19:47:31 (+96,+29,-20)
    って、コンテスト前なんだから聞いてる場合じゃないかw
    おいらは asm 行くけど、やり方が気になって気になって。
    ちなみに 4.1 なら >>383 の率超えました!! 意味ないけどw
    442 : ,,・´∀`・, - 2009/01/15(木) 20:54:44 (+73,+29,-4)
    >>441
    >>383は超えたところで意味が無い数字だぞ。
    実は>>389もだけど
    443 : デフォルトの名無 - 2009/01/15(木) 20:59:19 (+57,+29,-1)
    なんでそういうの黙ってられないんだろう。
    444 : デフォルトの名無 - 2009/01/15(木) 21:07:59 (-6,-29,-6)
    俺SUGEEEEEEEEEE だからじゃん?w
    445 : デフォルトの名無 - 2009/01/15(木) 21:12:55 (+57,+29,-3)
    せめて締め切られてからにしたらどうかね。
    446 : デフォルトの名無 - 2009/01/15(木) 21:33:05 (+91,+29,-13)
    締切後フカシだった事がばれて「俺参加してねーし」とか言いそうな感じ
    447 : デフォルトの名無 - 2009/01/15(木) 21:37:21 (+52,+29,-5)
    ここらで擁護がきそうな感じ
    448 : デフォルトの名無 - 2009/01/15(木) 23:48:57 (+57,+29,-3)
    いやいい加減うざいと思ってただろみんな
    449 : 202 - 2009/01/15(木) 23:53:34 (+57,+29,-27)
    Cellプログラミングに関係してるだけマシだと思ってたんだけど、
    ウザかった?
    他になんか話題ある?
    450 : デフォルトの名無 - 2009/01/16(金) 00:34:34 (+55,+29,-7)
    糞団子に餌を与えるのはいかがなものか。もそもそ。
    ←前へ 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 次へ→ / 要望・削除依頼は掲示板へ / 管理情報はtwitterで / cell スレッド一覧へ
    スレッド評価: スレッド評価について
    みんなの評価 :
    タグ : 追加: タグについて ※前スレ・次スレは、スレ番号だけ登録。駄スレにはタグつけず、スレ評価を。荒らしタグにはタグで対抗せず、タグ減点を。

    類似してるかもしれないスレッド


    トップメニューへ / →のくす牧場書庫について