元スレcellプログラミングしちゃいなよ3
cell覧 / PC版 /みんなの評価 : ☆
201 = :
劇的ではないものの、ちょっと弄ってみただけでも1割くらい平気で性能伸びるな
202 = :
一個目、7Mticks切った。
だんごさんに勝てる気はしないけど、準優勝を目指す。
203 = :
そこまでは軽くいけるのか。やっぱり。
俺も自分の変態テクニックがどこまで通用するのかはわからん。
本格的に壁にぶち当たったから使える命令がないか手当たり次第に探ってるところ。
収穫がないようならとりあえず提出一番乗りさせてもらうよ。
暫定だけどレポート書いちゃったし。
これ以上は時間かけても無駄かもと思っている。
マイクロ秒単位の勝負に持ってこられると正直きつい。いろいろ手抜きしてる部分が響いてきそう
204 = :
>>203
なんかもう行き詰った。
>>202のあともいろいろやったんだけど、あれからどうしても 7M 切れない。
何を工夫しても逆に遅くなる。
アセンブラで書けば >>202 を超えられるかもしれないけど、そこまでする気力は無いや。
odd パイプがきついよね。 even パイプが add と shift だけでも受け付けてくれると助かるのに。
205 = :
また7Mtics切れるようになった。
ループ一回をマクロにして十数個並べたりとか、お決まりだな。
こっちも、もうそろそろレポート書くか。
206 = :
早く提出した方がいいとかあるの???
207 = :
ないね。
考えて答えが見つかるモンでもないし
考えすぎて仕事が手に付かなくなるくらいなら諦めた方がいい。
208 = :
7Mticsていうと30倍以上かすげーな
アルゴリズムは基本のままでそこまでいけるの?
209 = :
>>208
アルゴリズムはそのままだけど、生成した乱数をチェックサム計算だけして直ぐに
捨たりと、実用性を削って速度を稼いでる。
210 = :
いいこと思いついたぞ!
ビットスライスして処理すればいいんじゃね?
(混乱させようとしてるからあぼーん推奨)
211 = :
ぶっちゃけCellって将来性はどうなの?
なんかPCのGPUでトリップ計算がCellの10倍の性能たたき出したとか
聞いたんだけど
212 = :
45nmで32コア+PPE2コアのCellが出てるね
自作の改良版Bitslice DESを使うと、PS3でSPE 6コアだけ使って12MTrips/sec程度はいける。
32コア全部使えば64MTrips/sec程度は出る
でもその32コアCellはアホみたいに高いおwwwwww
213 = :
当分安くはなりそうもないしねぇ。
214 = :
>>210
spu_sel() ?
もう使ってるよ (謎笑
7Mまで苦労したのに、「そこまでは軽く」とか言っちゃう人が、さらに速くなるのか・・・
ひょっとして6M切ってる?
215 = :
>>202
ミスリードしているぞ。「そこまでは軽くいっちゃう」のはあんたのことだろ。団子は自分のことだとは書いてないぞ。
216 = :
流石にヒントはやれん
>>214
当然
217 = :
>>215
だんごさんは、 1/4 にhttp://tripper.kousaku.in/20090104.html#p01 までいってて、
1/5 に >>201 とかいってるから、 7M は切ってるハズ。
という前提の元に、 7M 切れた! と言ったら、「そこまでは軽く」と返されたので、
6Mまでいってるのかな、と。
6M逝かれると、逆立ちしても勝てる気がしない。
218 = :
32コア版も新型GPUも8~10億トランジスタ、
ダイサイズは同じくらいになるだろ
歩留まり率はまあアレで同じとして、
SPEだけでも本当に5~6GHzで動かせるならアドバンテージになるな
メモリ帯域も拡張しないとあんまり意味ないけど
221 = :
>>218
それって本当?
じゃあ、32コアCellはGPUとトランジスタ資源は同じで、現行の周波数でも同性能になるの?
感覚的に、GPUのほうが単純な構造だから、同じトランジスタ数ならピークの性能はGPUが上かと思っていた。
もし同等なら、LSの容量の大きさが結構あるってだけで、Cellの強みはすでにあるよね。あと倍精度も上になる。
価格は全然だめだめだろうけど。
222 = :
初代の改良ということで、LS1MBとか、SPEのスカラ性能アップとか、PPEの強化とか実現したら結構いいものになるだろうな。
でも、PPEが強化ぐらいしか現実的に無理だろうけど。
まあ、IBMのことだからそういう反省点はちゃっかりPowerに反映してくるだろうなと予測。
223 = :
>>222
LSは256KBのままでその分SPE数を増やしてもらった方が嬉しいな。
LS増やしたら確実にSPE載せられる数減るし。
224 = :
227 = :
oddとevenの違いが分かってきて、何とか7Mtick切れた@gcc43。
# 課題の再提出って出来るんだろうか…。フライングしすぎて失敗してもうたorz
228 = :
はやく提出して得することなんてあるのか?
フィックスターズからのスカウトでも狙ってるの?
231 = :
再提出可になってる。@FAQ
っていうおいらはリモート開発環境に scp できない次元で奮闘中。
みんな出来てんのかなぁ???
232 = :
>>228
フィックスターズからのスカウトでも狙ってるの?
233 = :
どっちにしろ再提出何度もできるなら、しないよりはした方が得だな
234 = :
50倍超えたおwww
もう削れる気がしねぇ。だんごさんに並べてたら嬉しいな。
236 = :
そもそもORIGINAL側がコロコロ変わるからなぁ
まあ、やることはコンパイラの機嫌取りの作業だな
237 = :
次はCUDAに取りかかるかな
238 = :
ところで顔と名前晒して表彰台に立つの?
239 = :
ってか、社名も晒されるのかなぁ…
240 = :
>>239
会社名で申し込んだのか?
241 = :
さすがに必須項目で嘘書くのも憚られるっしょ。
242 = :
どうせだんごの50倍とかフカシだろ?
なんだかんだ理由付けて結局は提出しないと見た。
コンテスト終了後にだんごがソース公開しなかったらフカシ確定
243 = :
俺の中の人も本質を求める人間だ
たとえばさ、学生部門の優勝者って奨学金を年60万円もらえるでしょ。
社会人枠でたかだか42インチのテレビっていうか15万円相当のギフト券優勝狙うよりは、
より額が大きい学生枠で聞き分けのいい後輩に入れ知恵したほうが得
ってのは極論。しかし、特に勝つことには拘ってない。
ちなみに優勝候補は5x倍の圧倒的な性能をたたき出した上で既に提出済みって情報ならあるよ。
ビット演算の論理式レベルで最適化したレポートをひっさげて、ね。
#だんごやさんのマイミクにガチのフィックスターズ社員さんがいます。今回の出題者かもね?
244 = :
>>238-239はたぶんCell Speed Challengeのほうだろ。あれは大学・企業対決の意味合いが強いから当然だ。
フィックスターズのほうは会社の名義を書く必要がないので自宅警備員ですら応募可能です。
245 = :
なんか心理戦になってるw
圧倒的な性能って、、、だんごさんも 5x倍でしょーに。
だんごさんが優勝候補でないとすると、俺は準優勝すらムリポだが、
一応50倍逝ったので終了後ソース公開するよ。
246 = :
っていうかIPC上限考えれば論理式レベルで手を入れない限り限界突破は不可能
247 = :
ちなみに「団子厨」は優勝云々以前に参加登録すらしてませんので。
偽名はまずいらしいからね。
2人までのチーム参加OKなの知ってた?
今回はだんごやさんではない代表名義で、実質俺だけでやってます。
優勝か準優勝になったらPS3を彼にあげるってことで手を打った。
248 = :
っていうか、優秀者のコードはBSDライセンスで公開されることになってるから
終了後に公開ってのも無意味だと思うんだ。
アセンブリ出力と実行形式一式を暗号化ZIPでアップロードして
コンテスト終了後にパスワード公開するってのはどうかな?
250 = :
おいらまだ普通に並列化しただけで10倍の状態… orz
50倍はしんどそうだなぁ。あ、今 gcc 4.1 なんだけど、
4.3 にしたらどんくらい違うんだろ? 4.3 のオリジナルって
何 ticks くらい?
みんなの評価 : ☆
類似してるかもしれないスレッド
- cellプログラミングしちゃいなよ4 (607) - [97%] - 2009/3/24 11:04 ○
- CELL鬯ッ?ゥ隰ウ?セ??ス??オ????コ?????ッCore2 QX6700鬯ッ?ゥ隰ウ?セ??ス??オ????コ???? (92) - [18446744073709551581%] - 2012/1/21 0:39
トップメニューへ / →のくす牧場書庫について