SX-9発表

SXの新型が出ましたよ、と。

最大の特徴は、単一コア当たり10億回/秒の浮動小数演算性能に値する102.4GFLOPS(ギガフロップス)を実現した、新規開発のSX CPU。最大16GFLOPSのSX-8と比べて、6倍強の性能である。

 拡張性としては、同CPUを最大16個搭載し、演算性能1.6TFLOPS、1TBの容量からなる大規模共有メモリを搭載したノードが構築可能。さらに同ノードを最大512台までつなげることで、839TFLOPS(テラフロップス)まで性能を引き上げられる。自動並列化にも対応するため、安定した実効性能を実現できるという。


ノードあたり 1.6TF, 1TBか。あれ、1.6 [F/B]てメモリ少なくない?こんなもんかな。

これだけ高い演算処理能力を持つ新規SX CPUだが、その能力を最大限まで引き出すためには、メモリ間との通信速度も重要である。NECはこの点に着目し、新規SX CPUでは、256GB/秒の広いメモリバンド幅を実現した。これも特長の1つである。

ノードあたりでは 1.6TF, 1TB, 2Tbpsか。1.25 [F/bit]と。
「CPUあたり 256GB/s」なので、ノード(16 CPU)あたりでは 1.6TF, 1TB, 4TB/sらしい。すると 0.4 F/Bか。
競争相手ってどんくらいなんじゃろ。

NECはCPUから、LSIインターフェイスに至るまで、すべてを自社開発している。例えば、PCI-Ex比2倍の電力効率のシリアルインターフェイス回路技術や、LSI内のノイズを減らす解析技術、さらにはPCI-Ex比6倍の高速伝送が可能なケーブル技術などだ。こうした技術の結晶が、256GB/秒のメモリバンド幅であると西川氏は語った。

PCI Express x16比で 6倍ってことは、えーと 192Gbpsかな。
192Gbpsの外付けケーブルってどんな嫌なケーブルなんだろ。

335 :名無しさん@5周年:2007/04/21(土) 02:10:57
>>334
ただ、最近は並列計算機をしゃぶりつくす技術がかなり発展してきているから、
SX系はかなり大変じゃないかという気もする。

SX-9は今までのサイクルから言うと今秋発表じゃないかと思うけど、それなりにピーク値狙いでくると思う。
数字的には1ノード1Tflopsを狙いたいところだろうし、となるとチップ128Gflopsくらいは欲しい。
そう考えると、ベクトル演算器を四基搭載して4GHz駆動が目標になるんじゃないかな。
製造は65nmプロセスだろうから、これでもダイ面積的にはそれほど拡大しないと思う。
もっとも、この構成だと演算能力にメモリ帯域が付いてこれない可能性がけっこうあるんで、
その辺をどう解決するかだなあ。

ベクトルレジスタを増設してレジスタ間演算を積極的に行うという手もあるけど、メモリ帯域が遅いと
場合によってはLinpackスペシャルになりかねない。

いやー、半年前に 2chで見かけたこの書き込み、割とあってるなあ。

落札したのは NEC で、システムは NEC SX の次期システム(未発表)と Crayの XT4, NEC のは要求仕様が 1.6 Tflops 以上、XT4 はクレイジャパンの資料によると 824 ノード、 29 Tflops のシステムです(予備ノード含む)。レンタル費は月額 2000万ちょっとで 60ヶ月なので総額12億円となります。XT4 と SX 次期システムのレンタル費の配分は内緒なのですが、 SX 分が例えば 2 億円とすると(これは実際の数字ではありませんが)、 XT4 は 10億となって 1 Tflops 3400万円です。 SX の数字が正確ではないのでこの数字は誤差があり、かなり値段が高い目の推定値です。


牧野先生の「スーパーコンピューティングの将来」に国立天文台で調達した「NEC SXの次期システム」についての言及がある。
今回発表された SX-9がノードあたり 1.6TFだから、16CPUモデルを調達したのかなあ。