私的良スレ書庫
不明な単語は2ch用語を / 要望・削除依頼は掲示板へ。不適切な画像報告もこちらへどうぞ。 / 管理情報はtwitterでログインするとレス評価できます。 登録ユーザには一部の画像が表示されますので、問題のある画像や記述を含むレスに「禁」ボタンを押してください。
元スレcellプログラミングしちゃいなよ3
cell スレッド一覧へ / cell とは? / 携帯版 / dat(gz)で取得 / トップメニューみんなの評価 : ☆
レスフィルター : (試験中)
>>389
SFMTより速いんじゃね?
SFMTより速いんじゃね?
>>401-402
ありがとうございます。
変更箇所はこちらであっているみたいですね
タイム関数を利用して処理時間を測定しても、逆にSPEを利用したほうが時間が延びてしまいます。
理論上ではSPE1からSPE4にしたら1/4になるはずですよね?
ppeのメイン関数にあるresultをかこって測定しているのですが適切ではないのかな
すみません、出力に要した時間を測定するにはどこが適切なのでしょう
http://cell.fixstars.com/pukiwiki/index.php?tips_timebase タイム関数はこれを使用しています
ありがとうございます。
変更箇所はこちらであっているみたいですね
タイム関数を利用して処理時間を測定しても、逆にSPEを利用したほうが時間が延びてしまいます。
理論上ではSPE1からSPE4にしたら1/4になるはずですよね?
ppeのメイン関数にあるresultをかこって測定しているのですが適切ではないのかな
すみません、出力に要した時間を測定するにはどこが適切なのでしょう
http://cell.fixstars.com/pukiwiki/index.php?tips_timebase タイム関数はこれを使用しています
そうですか…わかりました。測定するプログラム自体が間違いだったんですかw
性能を見るために適したプログラム・・・どっかありますかね?
探してみます。
性能を見るために適したプログラム・・・どっかありますかね?
探してみます。
質問です。
CELLとLarrabee ってどの程度性能差があるんですか?
大して性能差がないとしたら、仮にPS4が出るとして、
ソニーがCELLに拘る意味って、もはや無いのでは?
むしろPCの世界で主流になるであろう、Larrabeeに
切り替えた方がコスト的にも有利なのでは?
CELLとLarrabee ってどの程度性能差があるんですか?
大して性能差がないとしたら、仮にPS4が出るとして、
ソニーがCELLに拘る意味って、もはや無いのでは?
むしろPCの世界で主流になるであろう、Larrabeeに
切り替えた方がコスト的にも有利なのでは?
>>403
逆説的だけど、並列演算を前提にした場合、実はオリジナルのMTのほうが並列度の高い
(高くしないと性能の出ない)アーキテクチャに向いてるってのはある。
MTの配列のうち、先頭から224個、残りの400個は並列演算可能だ。
これはCUDAの実装についての説明。
ソースはCUDA SDKのサンプルにも入ってる。
http://developer.download.nvidia.com/compute/cuda/sdk/website/projects/MersenneTwister/doc/MersenneTwister.pdf
それに対して、対してSFMTは4要素(=128ビット)の計算をしないとその次の4要素の計算ができない。
要するに依存関係があって、128ビット性能が出ない。
各命令のレイテンシが大きいとSFMTは相対的に不向きってことになるかもね。
逆説的だけど、並列演算を前提にした場合、実はオリジナルのMTのほうが並列度の高い
(高くしないと性能の出ない)アーキテクチャに向いてるってのはある。
MTの配列のうち、先頭から224個、残りの400個は並列演算可能だ。
これはCUDAの実装についての説明。
ソースはCUDA SDKのサンプルにも入ってる。
http://developer.download.nvidia.com/compute/cuda/sdk/website/projects/MersenneTwister/doc/MersenneTwister.pdf
それに対して、対してSFMTは4要素(=128ビット)の計算をしないとその次の4要素の計算ができない。
要するに依存関係があって、128ビット性能が出ない。
各命令のレイテンシが大きいとSFMTは相対的に不向きってことになるかもね。
× 要するに依存関係があって、128ビット性能が出ない。
× 要するに依存関係があって、128ビットSIMD演算を低レイテンシで実行できるアーキでないとが出ない。
× 要するに依存関係があって、128ビットSIMD演算を低レイテンシで実行できるアーキでないとが出ない。
どうぞ
今回の課題のMTはSFMTと比べてレイテンシを埋めるためのテクニックが使いやすいのは事実だよ。
っていうか誰かCUDAにSFMT移植してごらん?4論理スレッドしか並列実行できない悲惨なことになる。
今回の課題のMTはSFMTと比べてレイテンシを埋めるためのテクニックが使いやすいのは事実だよ。
っていうか誰かCUDAにSFMT移植してごらん?4論理スレッドしか並列実行できない悲惨なことになる。
○ 要するに依存関係があって、128ビットSIMD演算を低レイテンシで実行できるアーキでないと性能が出ない。
タイピングしすぎで腱鞘炎になりそう
タイピングしすぎで腱鞘炎になりそう
>407
Larrabeeはまだ世の中に出ていないので誰にも分かりません。
性能比較は用途によって変わるので今、Cellが使われている用途に
そのままLarrabeeが使われたらどうなるかなんて仮定の話は
Intelの中の人ですら分からないでしょう。
またPC用のCPUの世界でLarrabeeのような
シンプルなコアをたくさん集積したメニーコアが
すぐに流行る事も無いでしょう。
流行るとしてもだいぶ先の話(10年先か20年先か?)
Larrabeeはまだ世の中に出ていないので誰にも分かりません。
性能比較は用途によって変わるので今、Cellが使われている用途に
そのままLarrabeeが使われたらどうなるかなんて仮定の話は
Intelの中の人ですら分からないでしょう。
またPC用のCPUの世界でLarrabeeのような
シンプルなコアをたくさん集積したメニーコアが
すぐに流行る事も無いでしょう。
流行るとしてもだいぶ先の話(10年先か20年先か?)
http://cell.fixstars.com/challenge/faq.html#kadai4
> インラインアセンブラは使用してもよいですか?
> インラインアセンブラは禁止としていましたが、使用していただいて構いません。(1/15 更新)
> インラインアセンブラは使用してもよいですか?
> インラインアセンブラは禁止としていましたが、使用していただいて構いません。(1/15 更新)
迷走してるな。
アセンブラレベルでCellを熟知してない人間にはチャンスを与えない試験に成り果てた。
コンパイルオプション変更許可しない意味が既に無い。
アセンブラレベルでCellを熟知してない人間にはチャンスを与えない試験に成り果てた。
コンパイルオプション変更許可しない意味が既に無い。
>アセンブラレベルでCellを熟知してない人間にはチャンスを与えない試験に成り果てた。
そのレベルの人には元々「勝つ」チャンスは無いと思います。
参加する事に意義がある。
そのレベルの人には元々「勝つ」チャンスは無いと思います。
参加する事に意義がある。
アセンブラ許可自体は歓迎だが、こんなことをやると
「受賞者は最初から決めてあったんだよ!」
と言われかねない。
「受賞者は最初から決めてあったんだよ!」
と言われかねない。
>>アセンブラレベルでCellを熟知してない人間にはチャンスを与えない試験に成り果てた。
>そのレベルの人には元々「勝つ」チャンスは無いと思います。
202がんがれ、超がんがれ
>そのレベルの人には元々「勝つ」チャンスは無いと思います。
202がんがれ、超がんがれ
>>425
いやいや、202は既に熟知「した」だろ。
いやいや、202は既に熟知「した」だろ。
うーん、確かにコンテストを始めてからルールを変えるのはなんだかな。
再提出のチャンスがあるとは言えど。
主催者はルールが変わった事をメールなどで周知徹底すべきだろう。
再提出のチャンスがあるとは言えど。
主催者はルールが変わった事をメールなどで周知徹底すべきだろう。
ちょ、許可になったのかよ!!
アセンブラを生成するスクリプトをCソース吐くように改変して、
どうやって最適化昨日によるデチューンから逃れるか試行錯誤してたのに!
#pragma GCC optimize ("-O0") も、 __attribute__ ((optimize(0))) も使えない、
変数をvolatileにしたらスタックにpush/popするから超遅い、etcetc、、、
俺の2日間かえせーー!
アセンブラを生成するスクリプトをCソース吐くように改変して、
どうやって最適化昨日によるデチューンから逃れるか試行錯誤してたのに!
#pragma GCC optimize ("-O0") も、 __attribute__ ((optimize(0))) も使えない、
変数をvolatileにしたらスタックにpush/popするから超遅い、etcetc、、、
俺の2日間かえせーー!
まぁ、でも本当に Hack the spu-gcc43 になってたからな…
おいらも 4.1 だとうまくいった最適化抑制手法が、4.3 だと
使えなかったりして結構虚しくなってたからよかったかも。
おいらも 4.1 だとうまくいった最適化抑制手法が、4.3 だと
使えなかったりして結構虚しくなってたからよかったかも。
あ、コンテスト終わったらでいいから、だんごさんがどうやって
最適化抑制してたのか教えてほしいかも。おいらがやってたのは
4.3 にしたら even にまで命令追加されて使えなかったっす。
最適化抑制してたのか教えてほしいかも。おいらがやってたのは
4.3 にしたら even にまで命令追加されて使えなかったっす。
どうせ、そこまでやるんならコンパイラオプションも変更可能にして
何でもアリアリの条件で競争させて欲しい。
何でもアリアリの条件で競争させて欲しい。
あ、ごめん。
実質なんでもアリなら、本当に何でもアリにしてくれっていう意味ね。
実質なんでもアリなら、本当に何でもアリにしてくれっていう意味ね。
やるなら mt_mine.c だけオプション分離しないと、
オリジナルの速度とかテストベンチにまで影響が…
オリジナルの速度とかテストベンチにまで影響が…
SPUのアセンブリ言語はちょっとだけ読めるけどあれだけのコードをまともに書ける気がしない。
うまく飼いならせばspu-gcc43こそ最強の高級アセンブラ
うまく飼いならせばspu-gcc43こそ最強の高級アセンブラ
未だに 4.3 は飼いならし方がわからんす。attribute とかじゃないんすよね?
Cellプログラミングに関係してるだけマシだと思ってたんだけど、
ウザかった?
他になんか話題ある?
ウザかった?
他になんか話題ある?
前へ 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 次へ / 要望・削除依頼は掲示板へ / 管理情報はtwitterで / cell スレッド一覧へ
みんなの評価 : ☆類似してるかもしれないスレッド
- cellプログラミングしちゃいなよ4 (607) - [97%] - 2009/3/24 11:04 ○
- CELL鬯ッ?ゥ隰ウ?セ??ス??オ????コ?????ッCore2 QX6700鬯ッ?ゥ隰ウ?セ??ス??オ????コ???? (92) - [18446744073709551581%] - 2012/1/21 0:39
トップメニューへ / →のくす牧場書庫について