私的良スレ書庫
不明な単語は2ch用語を / 要望・削除依頼は掲示板へ。不適切な画像報告もこちらへどうぞ。 / 管理情報はtwitterでログインするとレス評価できます。 登録ユーザには一部の画像が表示されますので、問題のある画像や記述を含むレスに「禁」ボタンを押してください。
元スレcellプログラミングしちゃいなよ4
cell スレッド一覧へ / cell とは? / 携帯版 / dat(gz)で取得 / トップメニューみんなの評価 : ○
レスフィルター : (試験中)
コンテストと関係なくて初心者質問で恐縮ですが
SPEプログラムってマルチスレッドのみならず関数呼び出しの場合も
レジスタ全部退避するんでしょうか
もしそうなら全部main()で済ますのが正解?
SPEプログラムってマルチスレッドのみならず関数呼び出しの場合も
レジスタ全部退避するんでしょうか
もしそうなら全部main()で済ますのが正解?
70番~127番までのレジスタは関数呼び出しの前後で保存されてなきゃならないって決まりがあるっぽい
って事はレジスタが余ってる限りは退避しないようになってるんじゃないかと
確かめたわけじゃないから絶対とは言えんけどもレジスタ大量にあるのがSPEの特長だしね
って事はレジスタが余ってる限りは退避しないようになってるんじゃないかと
確かめたわけじゃないから絶対とは言えんけどもレジスタ大量にあるのがSPEの特長だしね
小さい関数なら__inlineキーワード付けなくとも最大の最適化オプションならインライン展開される
素晴らしい解法を思いついたと思ったが
最終段がDLPだよ......orz.....検討し直し
最終段がDLPだよ......orz.....検討し直し
http://ja.wikipedia.org/wiki/DLP
プロジェクタの一種
プロジェクタの一種
>>261
ニヤニヤ
ニヤニヤ
普通にやって10%切るの難しいって誰か書いてなかったっけ?
土曜から始めて、今、mtテーブルの初期化が終わった。
ループ展開などする前でも10%切るんだけど。かなりハードル低くないか?
それとも、このあとのTemperingがきついのかな?
土曜から始めて、今、mtテーブルの初期化が終わった。
ループ展開などする前でも10%切るんだけど。かなりハードル低くないか?
それとも、このあとのTemperingがきついのかな?
>>267 普通そうだよな。それに、今回の課題はオリジナルがいちいち
関数呼び出しているからオーバヘッドが大きい。
だから、オリジナルの3%を切るくらいが普通の書き換え組みの最低ラインだろう。
とはいえ、俺がそのラインに届くかどうかどうか知らんが。
関数呼び出しているからオーバヘッドが大きい。
だから、オリジナルの3%を切るくらいが普通の書き換え組みの最低ラインだろう。
とはいえ、俺がそのラインに届くかどうかどうか知らんが。
3%はSIMD化してアンロールするだけで届く
普通の書き換えならそこからさらに倍速になってからが勝負
普通の書き換えならそこからさらに倍速になってからが勝負
課題の制限で、mt_mine.c 以外のファイルを変更してはならないというのがあって、
spe 用のファイルの追加ができなくて困っているのだけど、
http://cell.fixstars.com/ps3linux/index.php/3.2%E3%80%80簡単なSPEプログラム
や
http://cell.fixstars.com/ps3linux/index.php/4.6%E3%80%80埋め込みSPEプログラム
以外で、どうやって spe 用のコードを書くのでしょうか。
spe 用のファイルの追加ができなくて困っているのだけど、
http://cell.fixstars.com/ps3linux/index.php/3.2%E3%80%80簡単なSPEプログラム
や
http://cell.fixstars.com/ps3linux/index.php/4.6%E3%80%80埋め込みSPEプログラム
以外で、どうやって spe 用のコードを書くのでしょうか。
>>272
spe 用の main を mt_mine.c に書くと一つのバイナリに二つ main が入ることになってシンボルが衝突してしまいます。
また、spe2 のライブラリにリンクしないと、spe_program_load などがリンカエラーを起こします。
Makefile を変更しないとどうにもならない気がするのですが、何か根本的に間違えているのでしょうか。
spe 用の main を mt_mine.c に書くと一つのバイナリに二つ main が入ることになってシンボルが衝突してしまいます。
また、spe2 のライブラリにリンクしないと、spe_program_load などがリンカエラーを起こします。
Makefile を変更しないとどうにもならない気がするのですが、何か根本的に間違えているのでしょうか。
SIMD化したら単純に4倍になるだけじゃないからな
SPEでスカラ演算しようとしたらそれ以上のコストがかかる
SPEでスカラ演算しようとしたらそれ以上のコストがかかる
デバッグプリントはさむと実行できるのに
そのコードをコメントアウトすると10回に6回位実行が止まりやがる
どうやらSPEがDMA転送するあたりで止まってしまっているみたいだ
デバッグ難しいねえ
そのコードをコメントアウトすると10回に6回位実行が止まりやがる
どうやらSPEがDMA転送するあたりで止まってしまっているみたいだ
デバッグ難しいねえ
>>280
昔のPCだと、CPUクロックが上がった所為で周辺ICがついてこれず、ハングアップするなんてことがあった。
対処方法は、I/O制御インストラクションの間にnopインストラクションを幾つか挟むことだったり。
昔のPCだと、CPUクロックが上がった所為で周辺ICがついてこれず、ハングアップするなんてことがあった。
対処方法は、I/O制御インストラクションの間にnopインストラクションを幾つか挟むことだったり。
>>280
PCでもデバッグするのにprintf入れたらバグがでなくなるとか遭遇しないか?w
PCでもデバッグするのにprintf入れたらバグがでなくなるとか遭遇しないか?w
あ、printf入れたらか。そっちもないけどさ。
そんなシビアな環境でやってないからかな。。。
そんなシビアな環境でやってないからかな。。。
止まらなくなった。何が何やら分からない。きっと今日は風が強かったからCellBE様のご機嫌がちょっと
悪かったんだな、うん
悪かったんだな、うん
printfでうまくいくケースはメモリ周りだろ
アロケーションしてないとこの参照とかあるとそうなる
アロケーションしてないとこの参照とかあるとそうなる
今回はprinf( )デバッグだけで済んだ。
というか、リモート・デバッガ動かなかったから
prinf( )デバッグしただけなんだな。
というか、リモート・デバッガ動かなかったから
prinf( )デバッグしただけなんだな。
コンテストの目的って何なの?
Cellでなければ不可能な最適化や高速化の技術があるはずだ、って事なの?
SFMTとは違う事をやるの?
Cellでなければ不可能な最適化や高速化の技術があるはずだ、って事なの?
SFMTとは違う事をやるの?
F1みたいに厳しい制限の中でトップを争うレースかと思ってたのに、
何でもあり or 曖昧な評価基準 のレースになってしまって、やる気が
無くなった。ここ2週間何もしてない。
一応提出できるレベルには持っていく積もりだけど、Fixstars賞すら狙えない
レベルに落ちぶれてしまった。
何でもあり or 曖昧な評価基準 のレースになってしまって、やる気が
無くなった。ここ2週間何もしてない。
一応提出できるレベルには持っていく積もりだけど、Fixstars賞すら狙えない
レベルに落ちぶれてしまった。
>>298
俺もやってんだがこっちはツールキットの10倍すら厳しい・・・
しかもOpenCafe上でやるとたまにだが実行時間がめちゃめちゃ遅くなるし
今ホームページみたらQ&Aが更新されてた
遅くなる事象が報告されてるみたいだな
俺もやってんだがこっちはツールキットの10倍すら厳しい・・・
しかもOpenCafe上でやるとたまにだが実行時間がめちゃめちゃ遅くなるし
今ホームページみたらQ&Aが更新されてた
遅くなる事象が報告されてるみたいだな
類似してるかもしれないスレッド
- cellプログラミングしちゃいなよ3 (1001) - [97%] - 2009/1/27 2:23 ☆
- CELL鬯ッ?ゥ隰ウ?セ??ス??オ????コ?????ッCore2 QX6700鬯ッ?ゥ隰ウ?セ??ス??オ????コ???? (92) - [18446744073709551581%] - 2012/1/21 0:39
トップメニューへ / →のくす牧場書庫について