安藤氏の「最近の話題 2006年11月11日」

安藤氏の「最近の話題」に、GRAPE-DRについて書かれていた。

http://www.geocities.jp/andosprocinfo/wadai06/20061111.htm

Linpackに必要なメモリ帯域の見積もりについて記載がある。

公開された試作ボードではDIMMが1枚載っており,また,PCI-XボードではCypress社のSRAMチップが搭載されているのが見えます。このSRAMチップは最大でも36ビット幅なので裏側にももう1個搭載されているのかも知れませんが,いずれにしてもメモリへのバスは64ビット+(パリティー?)といったところで,転送速度はDDR-2並でしょう。

という前提があった上で、

,64ビット幅でDDR-2並の速度とすると,5GB/s程度のメモリアクセスしか出来ないので,ここで性能が1/4以下に制限されてしまいます。ということで,筆者は,Grape-DRチップ100個で,線形方程式に対して,地球シミュレータ並の性能が出るというのは,疑問だと思っています

という結論を導いている。しかしながら、PC Watchにある写真を見ると、DIMMは二本あるように見えるので、ラフな見積もりでも 1/2程度は行きそうにも見える。

http://pc.watch.impress.co.jp/docs/2006/1106/tokyou12.jpg

真相やいかに。一方で牧野先生の日記を見ると、

DGEMM で理論ピークの 1/3 しかでませんでは恥ずかしいので、理論ピークをいわないことにしただけかも。 LINPACK ですらでないようなピーク性能を一体どんなアプリケーションで使えるかというと、例えば GRAPE のエミュレーションなら使えるわけだ。実際問題として、 GRAPE-DR では DGEMM でピーク性能が実現できるようにするのはすさまじく大変であった、というかまだ本当に実現できるかどうか、困難が一杯あるの。

http://grape.astron.s.u-tokyo.ac.jp/~makino/journal/journal-2006-07.html#5

とあり、GRAPE-DR(SINGチップ)における DGEMM実行でピーク値に近い性能が出ている、ないし出す気があることが示唆されている。

SC終わるまでよくわからないってことかなあ。ううむ。