元スレcellプログラミングしちゃいなよ3
cell覧 / PC版 /みんなの評価 : ☆
152 = :
STI?
スバルテクニカインターナショナルとAMDが何か関係があるとは
聞いた事無いな。
153 = :
>>150
>理想的にはCPU+Cell+GPUになるべき。
この理想っていうのは何に使うつもりなの?たしかに、GPUで得意なところとCellで得意なところが
補えるという意味では理想かもしれないが、そんな複雑なシステムを使おうっていう人や状況は
本当に限られていると思う。
計算機センターで、いろんな人に対応する共有計算機ならまだわかるが、そんなん使う人いるかどうか…。
154 = :
ATIはAMDが買った。良い買い物だったと思うよ。
157 = :
http://en.wikipedia.org/wiki/Cell_(microprocessor)
Cell is a microprocessor architecture jointly developed by Sony Computer Entertainment, Toshiba, and IBM, an alliance known as "STI".
159 = :
そういえばSTIは今回の金融危機でかなりの痛手を負っててリストラを余儀なくされてるけど、
MicrosoftとIntelだけはなぜか不自然なほど傷が浅いんだ。。。
160 = :
IntelはAtom馬鹿売れだったからな。小さくて歩留まりもいい製品だから、数さえ捌ければ儲かる。
MSのVista不人気は今に始まったことじゃない。
ソフト事業自体、もともと利益率がすさまじいし。
十分な利益率で十分な労働者を雇えるだけの貯蓄がある。
日本企業だと任天堂がリストラ知らずなのと同じ。
Xbox事業が今期から黒字計上してるのも大きいね(累積だとまだまだ赤だけど)
ドル安は短期的には外貨稼ぎにプラスに働く。
161 = :
しかし、STIでも
一番おいしいところはIBMが持っていくと。PC部門の売り時もうまかったし
HDDも・・・IBMはすげーよ。
164 = :
Hack the Cellの課題発表された
http://cell.fixstars.com/challenge/challenge.html
課題はメルセンヌ・ツイスタの最適化
使用SPE1基、LS256KBのうち210KBが使用禁止。
165 = :
あんまり工夫のしどころが無い気が…
167 = :
>>164
もち団子さんに期待
168 = :
まるでだんごのために用意したような課題
前書いてたしな
だんご入賞したら尊敬してやる
169 = :
だが断る
170 = :
さすが団子さん!
171 = :
質問なのですが、Cell SDK のインストールされているFedora 9 にて、
SPE用のCソースプログラム上からpthread_create関数でスレッド生成出来ますか?
要するにSPEのプログラムはマルチスレッドが出来るかどうかと言うことなのですが、
手元にCell環境がないので教えてください。
172 = :
>>171
SPEで、まともなプログラミングができると言う甘い幻想はとっとと捨てましょう。
POSIXはおろか、C標準の関数でさえ殆ど使えませんから。
つーか、なんでスレッド生成なんて発想に?
そんなのは、PPEにやらせてSPEは計算に専念するのがCBEの基本ですぜ。
173 = :
>>172
ある処理を行う裏側で、SPEからPPEに書き込むデータが50区画ぐらいありまして、
tag番号が32までしかないので、別スレッドでデータを送ろうと思ったのですが・・・。
データの配置を連続的になるように考え直したいと思います。
174 = :
>>173
DMAタグをローテーションさせて転送させたらいいと思う
175 = :
>>173
あ、裏側でか。
関数を交互に呼んで疑似マルチスレッド、かな。
177 = :
そりゃ当たり前だな。
パソコン上のCでtime関係の関数が普通に使えるのはPCが
ハードウェアでリアルタイム・クロックを持ってるからだ。
で、CPUから直接読める空間にレジスタを置いている。
ハードウェアのリアルタイム・クロックがなけりゃ
例えPCのCPUであってもどうしようも無い。
178 = :
まあ使いたいのは時刻よりは時間計測なんだけどな
そこはSPU Decrementerうまく使って代用して欲しかったね
PS3のCellはベースクロックが79.8MHzだっけ
いちおうLinux上からはとれてるみたいだけど
180 = :
clock()でも実装しておいてくれれば楽なんだけどねぇ。
まぁ、所要時間計測はどっちみち環境依存するものと思っているから未だいいのだけれど。
181 = :
>>164
ちょっと弄ったら4倍速くらいになった。
ここまでは当然として、締切ぎりぎりまで粘るかな
182 = :
>>181
応募するには最低10倍速だな。さてさて。
183 = :
>>182
実行結果見せてみ?w
コードみせろとは言わない。
184 = :
どっちかというとコードサイズ制限の中でどれだけアンロールするかっていうテーマになりそう
185 = :
いやいや、俺は参加してないよ。応募条件だったか、入賞の条件かが、Fixstarsのサイトに10倍速って書いなかった?
186 = :
>>184
SFMTをそのまま移植してる?
187 = :
>>184
あれは生成式が別物だからそもそも使い物にならない。
しかし意外と並列化できるね。それこそアンロールしまくれば。
Makefileは弄っちゃ駄目だけど#pragmaは使っていいんだろ?
188 = :
189 = :
movdquみたいな気の利いたミスアラインデータを処理するユーティリティ関数がなくてうぜーと思いました
shufbですませたけど。
191 = :
乱数の種と生成する乱数列の長さを決めるseed_tableに含まれるデータは例です。 実際の計測時は変更する場合があります。任意の値で動作するようにしてください。
ただし、以下の二点は仮定して構いません。
- num_randは4の倍数
- num_randは10000以上
なーんだ、仮定して良かったのか
193 = :
しかし、コンテストが2つもあるのにこの過疎りよう…。もうちょっと盛り上がっても
いいような気がするぜい。
194 = :
GCC4.3の吐くコードはたまに神がかった最適化をやってくれるんだけどピーキーだな。
速くなったり遅くなったり。
最適化フラグの指定方法によって変わるから、1関数毎に細かく最適化オプションを指定していく必要がある。
これはCellに限らずだけど。
195 = :
>>164
これの
>使用SPE1基、LS256KBのうち210KBが使用禁止。
ってどこに書いてある?
196 = :
あーなるほど、壊れるのか
197 = :
>>193
もう一つのコンテストって何?
198 = :
やべー俺優勝しちゃうかも
200 = :
>>198
大丈夫、きっとみんながそう思っている。
みんなの評価 : ☆
類似してるかもしれないスレッド
- cellプログラミングしちゃいなよ4 (607) - [97%] - 2009/3/24 11:04 ○
- CELL鬯ッ?ゥ隰ウ?セ??ス??オ????コ?????ッCore2 QX6700鬯ッ?ゥ隰ウ?セ??ス??オ????コ???? (92) - [18446744073709551581%] - 2012/1/21 0:39
トップメニューへ / →のくす牧場書庫について