2009年08月25日

自宅にスパコン?

個人向けスパコンMicrowulfは単に安くPCクラスターを作ろうという話だったが、PC+拡張ボードでスパコン機能を搭載する新製品登場。

《日本HP、「NVIDIA Tesla C1060コンピューティングプロセッサ」を発売》

「HP、GPGPUボード搭載ワークステーション提供開始」

《GPUの処理能力を計算処理に応用し、高速化を実現する「NVIDIA Tesla C1060コンピューティングプロセッサー」を発売》

応用事例の説明はnVIDIA任せ。
nVIDIA:「計算ファイナンス」

しかし、計算ファイナンスの例だがモンテカルロ法。つまりは乱数によるシミュレーション。
乱数を振っても現実の事象に収束していくことの利用。

ほかにフリーの統計ソフト「R」にも対応というから、Rが重くなるような処理をWIndowsOS上でサクサク実行できるということか?と資料を読むとソースコードをLinuxとMacOSXに提供しているだけのようだ。


日本HPは「NVIDIA Tesla C1060」を組み込んだデスクトップパソコンをワークステーションとして売り出すようだ。
演算精度はどんなものだろうか?

牧野氏辺りがNVIDIAを用いたアクセラレーター付きスパコンについて「速いけれど演算精度が低い」とか「速度向上に限界がある」なんて書いていたようにウロ覚え。

「【SC08】東工大がGPUでスーパーコン構築,単精度性能は世界上位に」2008年11月21日

によればベンチマークソフトは倍精度演算だから条件があわない。nVIDIAのGPUを用いた倍精度演算はこれからの課題とある。

その後のフォロー情報では、
「東工大TSUBAMEが2009年6月のスパコン性能ランキングで国内大学1位を達成」
とあるが、更新された地球シミュレータなどに抜かれて、現在は国内4位らしい。

「NVIDIA Teslaでデスクトップ・スパコンを実現?」2008年07月24日

「QTの日記:GPUスパコン」

といった記事もあり、デスクトップスパコンの可能性について、そこそこの関心が世間には存在するようだ。

■理研が今現在整備したスパコン群の一つがNVIDIAのGPUを使っている。

http://w3cic.riken.go.jp/ricc/20090713.html
RICC (RIKEN Integraded Cluster of Clusters)

以下仕様を引用。
------------------------------------------
超並列PCクラスタ:

Linux OSを採用したPCクラスタで、最大8000並列の大規模並列ジョブが実行可能です。

* 96TFLOPS = 93.0GFLOPS/node×1024nodes
* 1024nodes = 8192cores (2CPU/node, 4core/CPU)
* CPU : Intel Xeon X5570 (2.93GHz) quad-core
* Memory : 12GB/node, HDD : 500GB/node
* インターコネクト : DDR InfiniBand×1/node

多目的PCクラスタ:

商用・フリーのアプリケーションの実行で利用します。また、GPUアクセラレータを利用したアプリケーションも実行可能です。

* 9.3TFLOPS = 93.0FLOPS/node×100nodes (800cores)
* CPU : Intel Xeon X5570 (2.93GHz) quad-core
* Memory : 24GB/node, HDD : 250GB/node
* GPUアクセラレータ(NVIDIA Tesla C1060) : 93.3TFLOPS = 933GFLOPS(単精度)×100
* インターコネクト : DDR InfiniBand×1/node

MDGRAPE-3クラスタ:

理研で開発した分子動力学専用計算機(MDGRAPE-3)を接続し、分子動力学計算を加速します。特にMDGRAPE-3を利用できるアプリケーション、Amber(sander)を予め用意していますので、これまで使用されていたAmber(sander)の入力データセットがあれば、 MDGRAPE-3がすぐに利用できます。

* 3TFLOPS = 96.0GFLOPS/node×32nodes (256cores)
* CPU : Intel Xeon 5472 (3GHz) quad-core
* Memory : 32GB/node, HDD : 750GB/node
* MDGRAPE-3ボード : 64TFLOPS = 2TFLOPS/bord×32
* インターコネクト : DDR InfiniBand×1/node

大容量メモリ計算機:

商用アプリケーションやアルゴリズム的に並列化が難しいプログラムで、大きなメモリ容量を必要とするジョブを実行します。

* SGI Altix 450 1Node
* 0.24TFLOPS = 13GFLOPS×18CPUs(36cores)
* CPU : Intel Itanium 9140M 1.66GHz dual-core
* Memory : 512GB/nodes

------------------------------------------
1PFLOPS越えを狙うかどうかはさておいて、現有スパコンでできることを公開している。「維持費がかかるから、無意味なことには使わせられない」とする事前審査は、ほかに費用を取らないのなら当然か?

■その他、NVIDIAのGPGPU関連の記事は、

「【レポート】見えてきた日本の次世代スパコン - GPUなどのアクセラレータを活用」



「GPUが開くHPCの新たな世界」は金融ビジネスへの利用も含めて紹介。

NVIDIAのGPGPUがゲームアプリをそのまま高速で実行できる訳でもなさそうだ。対応するDirectXにまでDirectXの世代交代が進まなくてはならないといったところか?

どこからかタダでデータを引っ張ってきて、カブロボが先読みして取引を補助してくれるといったことには、すぐにはなりそうにもないのか?

HP Z800 Workstation (製品詳細ページ)


「未来を予測する技術」佐藤哲也、ソフトバンク新書
未来を予測する技術 (ソフトバンク新書 46)
ソフトバンククリエイティブ
2007-08-16

倉鉢徹のサイエンス館トップ

人気ブログランキングへ

人気ブログランキングへ

ブログランキング・にほんブログ村へ
posted by kurapat at 18:12| Comment(1) | TrackBack(0) | 新製品 | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
はじめまして。
ブログうろうろしていたらこのブログにたどり着きました。
書き込みしようか、しまいか迷ったのですが、書き込みしていきます
更新がんばってください^^
Posted by PHPMyAdmin at 2009年09月05日 19:53
コメントを書く
お名前:

メールアドレス:

ホームページアドレス:

コメント:

認証コード: [必須入力]


※画像の中の文字を半角で入力してください。
※ブログオーナーが承認したコメントのみ表示されます。

この記事へのトラックバック
キャッシング
×

この広告は180日以上新しい記事の投稿がないブログに表示されております。