のくす牧場
コンテンツ
牧場内検索
カウンタ
総計:127,062,853人
昨日:no data人
今日:
最近の注目
人気の最安値情報

    私的良スレ書庫

    不明な単語は2ch用語を / 要望・削除依頼は掲示板へ。不適切な画像報告もこちらへどうぞ。 / 管理情報はtwitter
    ログインするとレス評価できます。 登録ユーザには一部の画像が表示されますので、問題のある画像や記述を含むレスに「禁」ボタンを押してください。

    元スレCELL

    cell スレッド一覧へ / cell とは? / 携帯版 / dat(gz)で取得 / トップメニュー
    スレッド評価: スレッド評価について
    みんなの評価 :
    タグ : - IBM + 追加: タグについて ※前スレ・次スレは、スレ番号だけ登録。駄スレにはタグつけず、スレ評価を。荒らしタグにはタグで対抗せず、タグ減点を。
    レスフィルター : (試験中)
    ←前へ 1 2 3 4 5 6 7 8 9 10 11 次へ→ / 要望・削除依頼は掲示板へ / 管理情報はtwitter
    301 : ,,・´∀`・, - 2010/01/20(水) 02:27:03 (+48,-16,-1)
    アルゴリズム自体が(ry
    302 : デフォルトの名無 - 2010/01/20(水) 02:38:35 (+64,+29,-21)
    >>300
    なんでpadが8バイトなのかマジで自分でもわからないけど助言ありがとうです

    >>301
    それはいうなよ・・・
    303 : デフォルトの名無 - 2010/01/20(水) 03:00:40 (+10,-30,-146)
    サイズを128なのか、アドレスを128なのかで話は違うが
    パフォーマンスって意味だとアドレス128だよな
    とすると、pad[108]じゃ128バイトアライメントにならん希ガス
    spe_params_t param __attribute__((aligned(128)))
    とか
    typedef struct{
    unsigned long long sum __attribute__((aligned(128)));
    (ry
    にしないとだめじゃね
    304 : デフォルトの名無 - 2010/01/20(水) 03:38:27 (+13,-30,-144)
    >>301
    まだとりあえず動かすってレベルなんだろう。
    SIMD化とかすごく大変そうだけど。

    >>303
    >>300だけど、ソースの中で、spe_params_t param __attribute__((aligned(16)))
    になっていたので、128と書いたよ。
    typedef struct{
    unsigned long long sum __attribute__((aligned(128)));
    だと、構造体を沢山使うなら、アライメントの設定し忘れが無くなるからいいかもね。
    305 : ,,・´∀`・, - 2010/01/20(水) 07:28:06 (+0,-28,-12)
    >>304
    自動生成っていう便利なテクニックがあってだな
    http://dango.chu.jp/hiki/?Enhanced+Bitslice+DES

    xorとeqvを置換すれば1命令節約できる箇所があるのは知ってる。
    306 : デフォルトの名無 - 2010/01/20(水) 08:43:46 (+51,+23,-15)
    そもそもCell使ってる時点で何も期待できない
    307 : 299 - 2010/01/20(水) 12:16:23 (+3,-30,-130)
    typedef struct{
    unsigned long long int sum;
    char trip[11];
    char pad[109];
    } spe_params_t;

    spe_params_t spe_params[SPE_NUM] __attribute__((aligned(128)));

    に変えたけれどやはりバスエラー
    spe_context_runが出力されないってことはまだ構造体がおかしいのかな?
    308 : 299 - 2010/01/20(水) 12:59:35 (-2,-30,-40)
    arg[i].spe_params = &spe_params[i];
    この一文を初期化用ループに入れ忘れていた
    入れたらバスエラーはなくなったみたいです
    309 : デフォルトの名無 - 2010/01/28(木) 01:12:22 (+48,+30,+0)
    310 : デフォルトの名無 - 2010/01/28(木) 06:51:29 (+86,+29,-25)
    CELLプログラミングやりたいなーと思ったらHDDフォーマットしてパーティション分けないといけないのか
    めんどいな
    311 : デフォルトの名無 - 2010/01/28(木) 07:24:23 (+57,+29,-24)
    たったそれだけで出来るのに一体何が面倒?
    評価キットだけでやるよかずっとましだろうに。
    312 : デフォルトの名無 - 2010/01/28(木) 08:02:52 (+55,+27,-39)
    あるゲームのセーブデータ99個作っててそれを1個1個USBメモリにコピーするのがめんどい
    あ、フォルダごとコピーできたっけ
    313 : デフォルトの名無 - 2010/01/28(木) 08:05:51 (+55,+29,-35)
    ここはゲハじゃねえんだ。巣に帰れ。
    つうかCell自体には何にも関係がないじゃねえかよ。糞ガキが。
    314 : デフォルトの名無 - 2010/01/28(木) 22:29:53 (+59,+20,-41)
    >>310
    パテ切らなくてもUSBメモリーに入れる方法あるぞ
    315 : デフォルトの名無 - 2010/01/29(金) 08:27:08 (+17,-29,-152)
    Cで書いたマインスイーパーの盤面を列挙して
    一番左上を最初にクリックしたらその盤面だと一発でクリアできるかどうかを調べて
    全盤面について数え上げるプログラムをSPEで実行してみたら
    (ほぼ(SPEのmainの書き方とか以外))同じコードでcore2duo E7400(2.8GHz)で実行したときにくらべて
    3~4倍くらい遅かった
    どんなコードでもローカルストア上だから速くなるとは限らないのかー

    周りに爆弾0個の場合を再帰で開く部分を再帰じゃなくしてベクトル化すれば速くなるかもだけど
    それはE7400でも同じだしなー
    316 : デフォルトの名無 - 2010/01/29(金) 08:39:04 (+3,-29,-68)
    と思ったらCELLのSPEって整数除算命令がないのか
    爆弾の位置を(9x9の盤面で)0-80の整数で持って
    一発で開くか調べる前に9x9の2次元配列に配置するとき9で割る除算してた
    これのせいなのかなアセンブラ見てみるか
    317 : デフォルトの名無 - 2010/01/30(土) 01:37:05 (+50,+17,-52)
    SPEはSIMD化しないとまず速くならない。
    あと、整数演算は得意じゃないのと、除算命令がないので、
    整数はすべて浮動小数で扱い、9で割るなら0.11111111111111を掛け、
    整数にキャストしてあげる方が速いはず。
    318 : デフォルトの名無 - 2010/01/31(日) 04:51:06 (+20,-4,-2)
    >>315
    ソースコード見せて?
    319 : デフォルトの名無 - 2010/01/31(日) 21:52:22 (+57,+29,-8)
    そんなことしないと速くならないのか。
    なんていうか人間的な仕事じゃない気がする。
    320 : デフォルトの名無 - 2010/01/31(日) 22:02:12 (+57,+29,-24)
    というか、実数より遅い整数演算って
    何の為にあるのかわからんな。
    321 : デフォルトの名無 - 2010/02/01(月) 03:56:20 (+19,-8,-23)
    アーキテクチャ理解して使えよ。
    CPUならx86と全部同じ構造だとでも思ってんのか?
    322 : デフォルトの名無 - 2010/02/01(月) 20:59:42 (+16,-1,+0)
    ??
    323 : デフォルトの名無 - 2010/02/02(火) 02:41:09 (+69,+29,-96)
    隅々までアーキテクチャを理解する必要は無いが、
    少なくともどんな処理が向いているかいないかを調べた方がいいぞ。
    ちなみにCellのベクトル化とCore MAでのベクトル化では伸び率が全然違うから。
    Cellの場合は単純に4倍とかならん。なぜか4倍以上になることが多い。
    おかしなCPUだな。もちろんアプリによるけどな。
    324 : デフォルトの名無 - 2010/02/02(火) 04:55:37 (+4,-29,-41)
    PPEから値を送る→SPEで計算→結果をPPEに送って保存→PPEから値を送る
    をしてるんだが、SPE側で結果をためることってできない?
    325 : デフォルトの名無 - 2010/02/02(火) 09:32:07 (+57,+29,-3)
    いくらでも変数用意すりゃいいんじゃねーの?
    326 : デフォルトの名無 - 2010/02/02(火) 17:41:49 (-1,-29,-59)
    SPEで変数用意しても、PPEから値送って、SPEで計算させるたびに空になってる。
    PPEから値を送る→SPEで計算
    を繰り返して、最後に→結果をPPEに送って保存。
    にしたいんだが無理か?
    327 : デフォルトの名無 - 2010/02/02(火) 18:33:01 (+7,-29,-18)
    SPEにPPE側のポインタの値を送ることってできますか?
    328 : ,,・´∀`・, - 2010/02/03(水) 00:37:06 (+12,-29,-89)
    >>323
    SIMD演算器しかなくて、スカラ演算を1スロットだけ使ってエミュレートしてるから遅い。
    特に32ビット以下単位のデータ読み書きなんて最も苦手とする処理。常に128ビット単位でしか読み書きできないからな。
    329 : ,,・´∀`・, - 2010/02/03(水) 00:38:07 (+9,-19,-20)
    >>327
    MFCIOで送ればいいよ
    ポインタっていうよりは実アドレスになるけど。
    330 : デフォルトの名無 - 2010/02/03(水) 13:20:53 (+75,+13,-6)
    DMA転送でポインタを送ってもだめ?
    331 : デフォルトの名無 - 2010/02/04(木) 03:30:39 (+68,+29,-27)
    >>330
    ポインタってアドレスじゃん。
    アライメントがとれていたらいいよ。
    あっポインタのアドレスを送るなよ。
    332 : デフォルトの名無 - 2010/02/04(木) 12:44:16 (+3,-29,-63)
    >>324
    SPU側で計算に使うべき値が既にあるのなら、SPUからDMA転送命令を発行して
    順に値をとってきて処理すればいいんでないの?
    なんかその書き方だと、SPUを待たせておいて、PPU側で必要なデータを一つ一つ生成、
    それができ次第、順にSPU側へ渡していく、という風にも見えるんだけど。
    333 : デフォルトの名無 - 2010/02/04(木) 17:19:33 (+57,+29,-9)
    わざわざ、そうしてないんだから、次の計算に前の結果が必要なんだろ
    334 : デフォルトの名無 - 2010/02/05(金) 04:19:05 (+57,+29,-13)
    継続させたいならSPU主導で値を取りに行けばいいだけで、なんでわざわざPPUに
    やらせようとするのか理解に苦しむ。
    335 : デフォルトの名無 - 2010/02/15(月) 12:51:42 (+57,+29,-3)
    理解できないなら書かなければいいのに
    336 : デフォルトの名無 - 2010/02/15(月) 18:52:36 (+57,+29,-21)
    SPUの使い方を正しく理解してないから、頓珍漢な使い方してるんだろう。
    マヌケが。
    337 : デフォルトの名無 - 2010/03/12(金) 01:58:54 (-8,-26,+0)
    test
    338 : デフォルトの名無 - 2010/03/30(火) 20:48:35 (-8,-26,+0)
    test
    339 : デフォルトの名無 - 2010/04/01(木) 12:41:14 (+57,+29,-4)
    誰にも理解されないまま消えていったとさ
    340 : デフォルトの名無 - 2010/04/01(木) 17:25:56 (+54,+26,-20)
    6コアのx86が出ようとしている今CELLの存在理由は薄くなってきてるな
    341 : デフォルトの名無 - 2010/04/01(木) 18:52:12 (+139,+29,-85)
    同じ半導体投じればクアッドCellが作れるな
    このくらいありゃRSXエミュしてもお釣りきそうなもんだが
    PS3のワンチップ化どうすんだろうね
    342 : デフォルトの名無 - 2010/04/01(木) 20:37:14 (+3,-30,-118)
    そんなことやったら消費電力が増えそうだなと思ってたら

    PS2の時に消費電力が増えたとか書いてあった

    http://ja.wikipedia.org/wiki/%E3%83%97%E3%83%AC%E3%82%A4%E3%82%B9%E3%83%86%E3%83%BC%E3%82%B7%E3%83%A7%E3%83%B32#SCPH-70000.E7.B3.BB.EF.BC.88.E4.BB.A5.E5.BE.8C.E3.82.B9.E3.83.AA.E3.83.A0.E5.8C.96PS2.EF.BC.89
    >EEとGSのワンチップ化が行われた。ただし、本体とは別に大型のACアダプタが
    >必要となった上に、消費電力は45Wと増加した。実勢価格は19,800円。
    343 : デフォルトの名無 - 2010/04/01(木) 21:31:03 (+51,+23,-17)
    Intelが3年たってようやくCell追いついたとも言える。
    344 : デフォルトの名無 - 2010/04/02(金) 14:42:12 (-1,-29,-20)
    1コアあたりの性能がAtom未満で6コアって言ってもね~
    345 : デフォルトの名無 - 2010/04/02(金) 14:42:57 (+48,+30,+0)
    346 : デフォルトの名無 - 2010/04/02(金) 15:01:01 (+56,+28,-22)
    仮にあの規模でPPEも含めてAtom9個相当の性能があったとしたら
    それはそれでかなり高性能だよ。
    347 : デフォルトの名無 - 2010/04/02(金) 15:10:59 (+56,+28,-3)
    Atom程もないから未満と言ってるわけだが
    348 : デフォルトの名無 - 2010/04/02(金) 15:35:18 (+63,+29,-42)
    それが分かっているから「仮に」と書いたのが読めないのかねぇ?

    そもそも「Atom未満で6コア」なんて意味不明なことを書いておいて
    それがCellを指していると理解してもらえるって思っていること自体が
    間違ってるけどな。
    349 : デフォルトの名無 - 2010/04/02(金) 15:56:19 (-1,-29,-16)
    SPEって使えるの6コアじゃなかったのか
    350 : デフォルトの名無 - 2010/04/02(金) 16:06:46 (+58,+30,-70)
    面倒なことはプログラマに全部押しつけます
    たまたまハマる並列処理だけは得意だけど、WebやDBは早い遅い以前に動きすらしません

    そんなCPUが許される市場じゃないんだよPCやサーバの市場ってのは
    ←前へ 1 2 3 4 5 6 7 8 9 10 11 次へ→ / 要望・削除依頼は掲示板へ / 管理情報はtwitterで / cell スレッド一覧へ
    スレッド評価: スレッド評価について
    みんなの評価 :
    タグ : - IBM + 追加: タグについて ※前スレ・次スレは、スレ番号だけ登録。駄スレにはタグつけず、スレ評価を。荒らしタグにはタグで対抗せず、タグ減点を。

    類似してるかもしれないスレッド


    トップメニューへ / →のくす牧場書庫について