私的良スレ書庫
不明な単語は2ch用語を / 要望・削除依頼は掲示板へ。不適切な画像報告もこちらへどうぞ。 / 管理情報はtwitterでログインするとレス評価できます。 登録ユーザには一部の画像が表示されますので、問題のある画像や記述を含むレスに「禁」ボタンを押してください。
元スレcellプログラミングしちゃいなよ3
cell スレッド一覧へ / cell とは? / 携帯版 / dat(gz)で取得 / トップメニューみんなの評価 : ☆
レスフィルター : (試験中)
>>252
ども。29M って事は、50 倍だとやっぱとりあえずの目標が 6M なのね。
いま、ちょっとやったら 10M@gcc4.1 にはなった。さっきは 20M。
さらに半減かぁ。だんだん最適化できる所が減ってきたなぁ。
ども。29M って事は、50 倍だとやっぱとりあえずの目標が 6M なのね。
いま、ちょっとやったら 10M@gcc4.1 にはなった。さっきは 20M。
さらに半減かぁ。だんだん最適化できる所が減ってきたなぁ。
アンローリングしまくったら遅くなって、アセンブラ見るとローカル変数をLSに読み書きしてる・・・
コンパイラがバカなのか、レジスタ128個じゃパイプライン詰められないのか、よく判らん。
コンパイラがバカなのか、レジスタ128個じゃパイプライン詰められないのか、よく判らん。
うぁー、5M台増えてきたな。
みんなすげー。
みんなすげー。
トリップ付けて、コードのコメントにトリップパスつけるという手もあるな。
団子先生(笑)と同じチームだったりします。
証明する気など更々ないんだが
中の人は中の人名義で別の活動やってるからこっちの名前で技術的名声得ても何のメリットもないし。
だんごやさんとは所詮「記号」だ。tanasinnなみに退廃的な概念だ。
なによりでしゃばりすぎだ、だんごやさんは
中の人は中の人名義で別の活動やってるからこっちの名前で技術的名声得ても何のメリットもないし。
だんごやさんとは所詮「記号」だ。tanasinnなみに退廃的な概念だ。
なによりでしゃばりすぎだ、だんごやさんは
ん??改変したらまた新しいの書き込めばいんじゃん?
>212
「45nmで32コア+PPE2コアのCell」がどこかで発表されたの?
論理設計してみただけとか言う話じゃなく、試作チップくらい作られた?
検索したけど見つからなかったので差し支えなければソースを教えてくれ。
「45nmで32コア+PPE2コアのCell」がどこかで発表されたの?
論理設計してみただけとか言う話じゃなく、試作チップくらい作られた?
検索したけど見つからなかったので差し支えなければソースを教えてくれ。
一番綺麗なところ見せてるに決まってるじゃんか。
Odd側でレイテンシ1なのはlnopかhbrだと思っていいよ。
Odd側でレイテンシ1なのはlnopかhbrだと思っていいよ。
5.6M切ったところに壁があるのかな?
>>273
1%上げるのすら絶対無理な境地に達した。
1%上げるのすら絶対無理な境地に達した。
っていうかね
コアループの内側の片方パイプ側が全部隙間無く埋まっちゃって
これ以上どうしようもないんだよね
外側をどうにかするとかいうレベルでのチューンしかできない。
とはいってもTick数が10とか20変わるレベルなんだけど
コアループの内側の片方パイプ側が全部隙間無く埋まっちゃって
これ以上どうしようもないんだよね
外側をどうにかするとかいうレベルでのチューンしかできない。
とはいってもTick数が10とか20変わるレベルなんだけど
>>280
のちの団子氏によると、ここが真のスタートラインだったという。
のちの団子氏によると、ここが真のスタートラインだったという。
スタートラインに立ってる人間いくらいるんだろうな?
ループ内で片方のパイプ全部埋まってる状態なんだが。
埋めるのしんどかった。アセンブラ使わずにだからな。
ループ内で片方のパイプ全部埋まってる状態なんだが。
埋めるのしんどかった。アセンブラ使わずにだからな。
じゃあ質問してきてよ。
アセンブラ使っていいかどうか
っていうか変数おっかけるのめんどくせぇ
アセンブラ使っていいかどうか
っていうか変数おっかけるのめんどくせぇ
まさか、そこまで普通しないだろう。
そう、普通はしない。
しかし、Cellをいじる様な人種に常識は通用しないのだ。
そう、普通はしない。
しかし、Cellをいじる様な人種に常識は通用しないのだ。
今までなんとなく、心にぼんやりとあった、疑問が脳裏をよぎる。
"なぜ、MTの限られた最適化で、LSの容量も制限するという、こんなにもきつい制限の課題なのか。"
そう。実は要求レベルは、その領域にあったのだ。
"なぜ、MTの限られた最適化で、LSの容量も制限するという、こんなにもきつい制限の課題なのか。"
そう。実は要求レベルは、その領域にあったのだ。
スタート地点に立てた人間は、そうは多くない。しかし、そこまで行きついたものは確実に、"次"に気づいた。
だが、それらの人間とは別に、ごく一部、初めからその道を進んでいたものもいた。
そして、その先には、さらなる波乱が待っていた。
だが、それらの人間とは別に、ごく一部、初めからその道を進んでいたものもいた。
そして、その先には、さらなる波乱が待っていた。
ってかさぁ、1 tick って何 cycle くらいなの?
そっから逆算すると、5.6 M の時って平均何 cycle / 32bit 生成くらい?
そっから逆算すると、5.6 M の時って平均何 cycle / 32bit 生成くらい?
>>289, 291
40cycle/1tickだろ。5.6Mだと3.85cycle/32bitくらいか。
最低限SIMD化したとして15.4cycle/128bit。
unroll効いてるとして16~7cycle/128bitくらいか。
ホントにそんなんで出来るんか???
40cycle/1tickだろ。5.6Mだと3.85cycle/32bitくらいか。
最低限SIMD化したとして15.4cycle/128bit。
unroll効いてるとして16~7cycle/128bitくらいか。
ホントにそんなんで出来るんか???
>>293
unrollするとってくだりからアレだが、そこまでの推測は正しいと思うよ。
15.4という数値がでてきたとすると、15cycle+0.4cycleで0.4がオーバーヘッドになる。
オーバーヘッドは1%くらいに抑えたいから、目標は5.51Mticksを切ること。
トップクラスはそのあたりにある壁にどこまで近づけるかというチキンレース中。
というところまで推測できちゃうから、みんなticks数は有効数字一桁しか出さなかったんだけど、
だんごさんが有効数字二桁の情報を出してきたのは、「cycle数で並ばれても壁までの近さなら
負けない」という意思表示かな。カッコイイ。
unrollするとってくだりからアレだが、そこまでの推測は正しいと思うよ。
15.4という数値がでてきたとすると、15cycle+0.4cycleで0.4がオーバーヘッドになる。
オーバーヘッドは1%くらいに抑えたいから、目標は5.51Mticksを切ること。
トップクラスはそのあたりにある壁にどこまで近づけるかというチキンレース中。
というところまで推測できちゃうから、みんなticks数は有効数字一桁しか出さなかったんだけど、
だんごさんが有効数字二桁の情報を出してきたのは、「cycle数で並ばれても壁までの近さなら
負けない」という意思表示かな。カッコイイ。
普段使ってるのと違うPCで書き込みしたらsage忘れた。スマソ。
>unroll効いてるとして16~7cycle/128bitくらいか。
これが意味不明なんだけどね。
アンロールしようが何しようが演算ユニットが増えるわけじゃない。
演算ユニットの稼働率をいくらまで詰めるかって課題なわけで。
これが意味不明なんだけどね。
アンロールしようが何しようが演算ユニットが増えるわけじゃない。
演算ユニットの稼働率をいくらまで詰めるかって課題なわけで。
っていうか
「15サイクル」って具体的な数字が出てきたけど、本当にそれでいいのか、そこから考えないといけない。
「15サイクル」って具体的な数字が出てきたけど、本当にそれでいいのか、そこから考えないといけない。
前へ 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 次へ / 要望・削除依頼は掲示板へ / 管理情報はtwitterで / cell スレッド一覧へ
みんなの評価 : ☆類似してるかもしれないスレッド
- cellプログラミングしちゃいなよ4 (607) - [97%] - 2009/3/24 11:04 ○
- CELL鬯ッ?ゥ隰ウ?セ??ス??オ????コ?????ッCore2 QX6700鬯ッ?ゥ隰ウ?セ??ス??オ????コ???? (92) - [18446744073709551581%] - 2012/1/21 0:39
トップメニューへ / →のくす牧場書庫について