私的良スレ書庫
不明な単語は2ch用語を / 要望・削除依頼は掲示板へ。不適切な画像報告もこちらへどうぞ。 / 管理情報はtwitterでログインするとレス評価できます。 登録ユーザには一部の画像が表示されますので、問題のある画像や記述を含むレスに「禁」ボタンを押してください。
元スレCELL
cell スレッド一覧へ / cell とは? / 携帯版 / dat(gz)で取得 / トップメニューみんなの評価 : ○
レスフィルター : (試験中)
サイズを128なのか、アドレスを128なのかで話は違うが
パフォーマンスって意味だとアドレス128だよな
とすると、pad[108]じゃ128バイトアライメントにならん希ガス
spe_params_t param __attribute__((aligned(128)))
とか
typedef struct{
unsigned long long sum __attribute__((aligned(128)));
(ry
にしないとだめじゃね
パフォーマンスって意味だとアドレス128だよな
とすると、pad[108]じゃ128バイトアライメントにならん希ガス
spe_params_t param __attribute__((aligned(128)))
とか
typedef struct{
unsigned long long sum __attribute__((aligned(128)));
(ry
にしないとだめじゃね
>>304
自動生成っていう便利なテクニックがあってだな
http://dango.chu.jp/hiki/?Enhanced+Bitslice+DES
xorとeqvを置換すれば1命令節約できる箇所があるのは知ってる。
自動生成っていう便利なテクニックがあってだな
http://dango.chu.jp/hiki/?Enhanced+Bitslice+DES
xorとeqvを置換すれば1命令節約できる箇所があるのは知ってる。
typedef struct{
unsigned long long int sum;
char trip[11];
char pad[109];
} spe_params_t;
spe_params_t spe_params[SPE_NUM] __attribute__((aligned(128)));
に変えたけれどやはりバスエラー
spe_context_runが出力されないってことはまだ構造体がおかしいのかな?
unsigned long long int sum;
char trip[11];
char pad[109];
} spe_params_t;
spe_params_t spe_params[SPE_NUM] __attribute__((aligned(128)));
に変えたけれどやはりバスエラー
spe_context_runが出力されないってことはまだ構造体がおかしいのかな?
arg[i].spe_params = &spe_params[i];
この一文を初期化用ループに入れ忘れていた
入れたらバスエラーはなくなったみたいです
この一文を初期化用ループに入れ忘れていた
入れたらバスエラーはなくなったみたいです
CELLプログラミングやりたいなーと思ったらHDDフォーマットしてパーティション分けないといけないのか
めんどいな
めんどいな
あるゲームのセーブデータ99個作っててそれを1個1個USBメモリにコピーするのがめんどい
あ、フォルダごとコピーできたっけ
あ、フォルダごとコピーできたっけ
ここはゲハじゃねえんだ。巣に帰れ。
つうかCell自体には何にも関係がないじゃねえかよ。糞ガキが。
つうかCell自体には何にも関係がないじゃねえかよ。糞ガキが。
>>310
パテ切らなくてもUSBメモリーに入れる方法あるぞ
パテ切らなくてもUSBメモリーに入れる方法あるぞ
Cで書いたマインスイーパーの盤面を列挙して
一番左上を最初にクリックしたらその盤面だと一発でクリアできるかどうかを調べて
全盤面について数え上げるプログラムをSPEで実行してみたら
(ほぼ(SPEのmainの書き方とか以外))同じコードでcore2duo E7400(2.8GHz)で実行したときにくらべて
3~4倍くらい遅かった
どんなコードでもローカルストア上だから速くなるとは限らないのかー
周りに爆弾0個の場合を再帰で開く部分を再帰じゃなくしてベクトル化すれば速くなるかもだけど
それはE7400でも同じだしなー
一番左上を最初にクリックしたらその盤面だと一発でクリアできるかどうかを調べて
全盤面について数え上げるプログラムをSPEで実行してみたら
(ほぼ(SPEのmainの書き方とか以外))同じコードでcore2duo E7400(2.8GHz)で実行したときにくらべて
3~4倍くらい遅かった
どんなコードでもローカルストア上だから速くなるとは限らないのかー
周りに爆弾0個の場合を再帰で開く部分を再帰じゃなくしてベクトル化すれば速くなるかもだけど
それはE7400でも同じだしなー
と思ったらCELLのSPEって整数除算命令がないのか
爆弾の位置を(9x9の盤面で)0-80の整数で持って
一発で開くか調べる前に9x9の2次元配列に配置するとき9で割る除算してた
これのせいなのかなアセンブラ見てみるか
爆弾の位置を(9x9の盤面で)0-80の整数で持って
一発で開くか調べる前に9x9の2次元配列に配置するとき9で割る除算してた
これのせいなのかなアセンブラ見てみるか
SPEはSIMD化しないとまず速くならない。
あと、整数演算は得意じゃないのと、除算命令がないので、
整数はすべて浮動小数で扱い、9で割るなら0.11111111111111を掛け、
整数にキャストしてあげる方が速いはず。
あと、整数演算は得意じゃないのと、除算命令がないので、
整数はすべて浮動小数で扱い、9で割るなら0.11111111111111を掛け、
整数にキャストしてあげる方が速いはず。
>>315
ソースコード見せて?
ソースコード見せて?
隅々までアーキテクチャを理解する必要は無いが、
少なくともどんな処理が向いているかいないかを調べた方がいいぞ。
ちなみにCellのベクトル化とCore MAでのベクトル化では伸び率が全然違うから。
Cellの場合は単純に4倍とかならん。なぜか4倍以上になることが多い。
おかしなCPUだな。もちろんアプリによるけどな。
少なくともどんな処理が向いているかいないかを調べた方がいいぞ。
ちなみにCellのベクトル化とCore MAでのベクトル化では伸び率が全然違うから。
Cellの場合は単純に4倍とかならん。なぜか4倍以上になることが多い。
おかしなCPUだな。もちろんアプリによるけどな。
PPEから値を送る→SPEで計算→結果をPPEに送って保存→PPEから値を送る
をしてるんだが、SPE側で結果をためることってできない?
をしてるんだが、SPE側で結果をためることってできない?
SPEで変数用意しても、PPEから値送って、SPEで計算させるたびに空になってる。
PPEから値を送る→SPEで計算
を繰り返して、最後に→結果をPPEに送って保存。
にしたいんだが無理か?
PPEから値を送る→SPEで計算
を繰り返して、最後に→結果をPPEに送って保存。
にしたいんだが無理か?
>>323
SIMD演算器しかなくて、スカラ演算を1スロットだけ使ってエミュレートしてるから遅い。
特に32ビット以下単位のデータ読み書きなんて最も苦手とする処理。常に128ビット単位でしか読み書きできないからな。
SIMD演算器しかなくて、スカラ演算を1スロットだけ使ってエミュレートしてるから遅い。
特に32ビット以下単位のデータ読み書きなんて最も苦手とする処理。常に128ビット単位でしか読み書きできないからな。
>>324
SPU側で計算に使うべき値が既にあるのなら、SPUからDMA転送命令を発行して
順に値をとってきて処理すればいいんでないの?
なんかその書き方だと、SPUを待たせておいて、PPU側で必要なデータを一つ一つ生成、
それができ次第、順にSPU側へ渡していく、という風にも見えるんだけど。
SPU側で計算に使うべき値が既にあるのなら、SPUからDMA転送命令を発行して
順に値をとってきて処理すればいいんでないの?
なんかその書き方だと、SPUを待たせておいて、PPU側で必要なデータを一つ一つ生成、
それができ次第、順にSPU側へ渡していく、という風にも見えるんだけど。
継続させたいならSPU主導で値を取りに行けばいいだけで、なんでわざわざPPUに
やらせようとするのか理解に苦しむ。
やらせようとするのか理解に苦しむ。
同じ半導体投じればクアッドCellが作れるな
このくらいありゃRSXエミュしてもお釣りきそうなもんだが
PS3のワンチップ化どうすんだろうね
このくらいありゃRSXエミュしてもお釣りきそうなもんだが
PS3のワンチップ化どうすんだろうね
そんなことやったら消費電力が増えそうだなと思ってたら
PS2の時に消費電力が増えたとか書いてあった
http://ja.wikipedia.org/wiki/%E3%83%97%E3%83%AC%E3%82%A4%E3%82%B9%E3%83%86%E3%83%BC%E3%82%B7%E3%83%A7%E3%83%B32#SCPH-70000.E7.B3.BB.EF.BC.88.E4.BB.A5.E5.BE.8C.E3.82.B9.E3.83.AA.E3.83.A0.E5.8C.96PS2.EF.BC.89
>EEとGSのワンチップ化が行われた。ただし、本体とは別に大型のACアダプタが
>必要となった上に、消費電力は45Wと増加した。実勢価格は19,800円。
PS2の時に消費電力が増えたとか書いてあった
http://ja.wikipedia.org/wiki/%E3%83%97%E3%83%AC%E3%82%A4%E3%82%B9%E3%83%86%E3%83%BC%E3%82%B7%E3%83%A7%E3%83%B32#SCPH-70000.E7.B3.BB.EF.BC.88.E4.BB.A5.E5.BE.8C.E3.82.B9.E3.83.AA.E3.83.A0.E5.8C.96PS2.EF.BC.89
>EEとGSのワンチップ化が行われた。ただし、本体とは別に大型のACアダプタが
>必要となった上に、消費電力は45Wと増加した。実勢価格は19,800円。
仮にあの規模でPPEも含めてAtom9個相当の性能があったとしたら
それはそれでかなり高性能だよ。
それはそれでかなり高性能だよ。
それが分かっているから「仮に」と書いたのが読めないのかねぇ?
そもそも「Atom未満で6コア」なんて意味不明なことを書いておいて
それがCellを指していると理解してもらえるって思っていること自体が
間違ってるけどな。
そもそも「Atom未満で6コア」なんて意味不明なことを書いておいて
それがCellを指していると理解してもらえるって思っていること自体が
間違ってるけどな。
面倒なことはプログラマに全部押しつけます
たまたまハマる並列処理だけは得意だけど、WebやDBは早い遅い以前に動きすらしません
そんなCPUが許される市場じゃないんだよPCやサーバの市場ってのは
たまたまハマる並列処理だけは得意だけど、WebやDBは早い遅い以前に動きすらしません
そんなCPUが許される市場じゃないんだよPCやサーバの市場ってのは
類似してるかもしれないスレッド
- cellプログラミングしちゃいなよ3 (1001) - [18446744073709551533%] - 2009/1/27 2:23 ☆
トップメニューへ / →のくす牧場書庫について