マルチコアの内部はどうなるのか? |
|
| Hammer-info経由の話だが 8/26日付の情報では 『4coreOpteronに問題が発生しているかも』 という噂があるらしい
ま、それは別として4コアだとCPU内部ではどんな構造になっているか 興味が湧いたので考えてみた
AMDの場合ノースブリッジは内蔵しているので
コア0 コア1 コア2 コア3 | | | | L 2 L 2 L 2 L 2 | | | | [ ノースブリッジ ]
になるのでは無いかと思うがよく考え見ると 『1個で4CPUに対応したノースブリッジは 知っている限りでは存在しない』点が浮上した ここで二つ目の案が浮上する
コア0 コア1 コア2 コア3 | | | | L 2 L 2 L 2 L 2 | | | | [Nブリッジ]-[Nブリッジ]
しかしこの方法だとノースブリッジ同士の接続にHTを1本使うので8CPUは無理 そこで考えついたのが第三の方法
コア0 コア1 コア2 コア3 | | | | L 2 L 2 L 2 L 2 | | | | [Nブリッジ] [Nブリッジ] | | [ I/F ]
※ I/FはIntelのPentiumDに搭載されている物と 似たものでFSBを分割する為の物 但し各ノースブリッジへの転送速度は現在のデュアルコアと同じである必要がある
この場合だとI/Fにメモリコントローラーと外部用HTを取り付ける事になる 従ってI/Fがノースブリッジと化しノースブリッジにノースブリッジを接続するという もの凄く変な構成になるし ダイサイズも肥大する(大して変わらないだろうけど)
とにかく来年には仕様が公開されると思うが 多分この3つの内のどれかではないかと思われる
| |
|
8月30日(火)01:35 | トラックバック(0) | コメント(0) | パソコン関連:AMD | 管理
|
IDF 2005秋 |
|
| http://pc.watch.impress.co.jp/docs/2005/0825/kaigai206.htm サーバーが80W デスクトップが65W 通常電圧版モバイルが35W サブノートが5W ・・・それで消費電力を下げたと言えるのだろうか? ちなみにAMD製品でこの数字だと現状では大体2GHz位が当てはまる (Intel製CPU+対応ノースブリッジの消費電力を踏まえての話 TDP自体がランク別になっているのでTDPを参考に計算した結果) プロセスの細分化によって1.4倍までは同じ消費電力で行けるので 3.4GHz(実際には3GHz程度)までは現状と変わらない事になる Intelがもし実クロックでAMD製品を上回る製品もしくは 同クロックでも性能が1ランク上の物を作る事が出来るのなら話は別だが パイプラインが14段だと言う事はK8アークテキチャの段数と殆ど変わらず ほぼ同じクロックしか実現出来ない
更に問題なのはサーバー用 Opteronを初めとするK8アークテキチャは ノースブリッジを内蔵する事によってメモリのレイテンシを下げている と言うのが一般的な見解だが CPUのコア数、CPU数が増えれば増えるほど本来の効果を発揮する 複数のコア、CPUを搭載する場合、最も重要な事は 如何にして効率よくCPUを使うか?である AMDは次世代XeonとデュアルコアOpteronの対決をIntelに要請した 自分が負けると思う試合を切り出すバカは先ず居ない
ここで考えてみる 次世代XeonはデュアルコアなのだがNetburstの流れを汲んでいるので 限界は3.4GHzか3.6GHz位 既存のCPUで考えるとしてAMDはOpteron x75があるので Xeon3.4GHzを対象としてみる デュアルコアによる性能の向上は Xeonは通常の1.8倍、Opteronは通常の1.9倍 (この差は各コアが連結する相手が共用バスかノースブリッジかの違い) デュアル構成ならXeonは1個時の1.7倍、Opteronは1個時の1.8倍 (この差はCPU~ノースブリッジ間の共用バスと独立バスの違い) Xeon3.4GHz×1.8×1.7 =10.404GHz Opteron3.4GHz相当×1.9×1.8 =11.628GHz デュアル構成で既に1.224GHzの差が出ている 更にクワッド構成なら 10.404×1.7=17.6868 11.628×1.8=20.9304 その差は3.2436GHz XeonはOpteronに比べ4CPU(8コア)利用時には1コア分無駄になっている CPUが4コアになればデュアル構成時で既に1コア分無駄になり 8コアになればCPU1個でも1コア分は無駄になる
ノースブリッジの統合が結論とは言えないが メニイコアかヘテロジニアスマルチコアを目指すのならば FSBを現状の10倍位は高速化させる必要がある AMDの場合ハイパートランスポートの最終的な最高転送能力は 現状で32bit幅で双方向、1.4GHzの22.4GB/s 現状の16bit幅で双方向、1GHzの8GB/sに比べても2.8倍ある 更にver3.0が策定されれば64bit、2.2GHzなので70.4GB/s IntelがもしPCI-Express互換のFSBを作って利用したとして ver1.1での最高転送能力はx32、5Gbpsなので8GB/s もしver2.0でx64が作られ5Gbpsまで上がれば32GB/s 70.4GB/sには到底追いつかない やはり根本的な解決が必要だと思われる
一部訂正 Opteronとの対決はIntelの最新鋭のサーバ向けCPUという事になっている まぁ、Intelが受けると言えば完成したばかりのデュアルコアXeon持ってくるだろうけど しかしAMDが何故そんな事を言うのかが一番疑問である 個人的にはXeonと対決する&したベンチ結果と言うより Intel寄りのプログラム(正確にはコード)を駆逐する為ではないかと思われる IntelはCPUの性能をソフトウェアでカバーする事によって 自分達のCPUが優れていると見せかけている部分がある 一部のベンチマークでもその結果は見て取れる つまりAMDが目指したいのは 如何なるプログラムでも高速に動作させる事が出来る= 純粋なCPU性能での勝利= 優れたCPUを作れる会社 だと推測する (だって結果を見れば拡張命令を使わなければ役に立たないXeonと それなりに高速なOpteronと言う結果になるのは事実 それはPentiumD 840とAthlon64 X2 3800+を 照らし合わせれば分かる事)
| |
|
8月25日(木)21:40 | トラックバック(0) | コメント(0) | パソコン関連:ハード | 管理
|
Opteron系統、やっと潤沢か? |
|
| http://www.amd.com/jp-ja/Processors/ProductInformation/0,,30_118_609,00.html http://www.amdcompare.com/us%2Den/opteron/Default.aspx Opteronの種類がかなり増えている この中で相変わらずなのはOpteron1xxシリーズの値段 基本的にOpteron1xxシリーズはAthlon64&X2より安く設定されている その内Opteron165と170はAthlon64 X2シリーズに存在しない為 かなり高めに設定されている しかしSocket939版Opteron1xxシリーズの電圧は 最低1.30VとAthlon64&X2&FXより低い この事からSocket939のCPUで Athlon64 X2 4400+ Athlon64 FX-55 Athlon64 4000+(FX-53) Athlon64 3700+ を買うなら同じ仕様の Opteron 175 Opteron 152 Opteron 150 Opteron 148 を買った方が安い上に安定した物が手に入るし Athlon64 3200+ Athlon64 3000+ を買うなら上位版の Opteron 146 Opteron 144 を買った方が安い上に安定して2次キャッシュ倍増 ただOpteron対応Socket939マザーボード& ECC対応メモリが必要なので新規に組むには良いが 載せ替えには手厳しい (ECC対応に関してはよく分からない。第一ECC“のみ”対応のDDRメモリってあるのか?)
| |
|
8月21日(日)00:44 | トラックバック(0) | コメント(0) | パソコン関連:AMD | 管理
|
Intelの次世代CPU |
|
| 23日にIDF(インテルデベロッパーフォーラムだっけ?)があり 来年後半に発売予定の新型CPUの説明があるらしい http://pc.watch.impress.co.jp/docs/2005/0816/kaigai203.htm しかし消費電力がMAX90Wメインストリームで65Wだとすると 次世代Athlon64シリーズと性能的に大差はない 違う点があるとすれば小さい塊のコードを3つ?同時に通しそのまま実行するか 上のコードの4倍大きい塊のコードを1つコアに入れ分割して計算、実行するかの違いでしかない ただ4倍の大きさのコードを読み込む時間はメモリが高速化したとは言え ダイレクトコネクトアークテキチャを採用しているAthlon64に比べ時間が掛かる事は必死 結局SSE命令を実行する為だけのCPUである事に変わりはない 別にSSEを極めるのも良いがIntel自体 『HTよりマルチコア。理由はエンコードに有利』と言ったのに 極める意味があるかどうかも疑問である (先を見据えるなら一時的に損はするがコア数を AMDより先に増やした方がエンコードには有利 XEは初めから4コアとか) その上当初はSocket775を利用するという Intelらしくないソケットの使い回しがよく分からない 別に同じソケットを使うライバルがいないから そんな無駄な事をする必要は無いとも思えるが アークテキチャの違うソケットを使い回しても FSBの向上は見込めないので性能を主張するには不十分 (もしかすると外部データバス幅を倍にして外見上はSocket775ではあるが 載せられるのは次世代CPUのみというマザーボードが出る可能性がある) ただパイプラインが長かったPentium4の場合 軽い動作でも一度止まるような仕草を見せるが それが次世代CPUでは改善されている点は買うべきだと思う (それでもAthlon64より反応速度は遅いけど)
結論として次世代CPUが出たとしてもSocket775では 大した性能向上は見込めない 新しいソケットで発売された時にその性能は最大限に発揮される 具体的な例を上げるとすれば Socket423から478へ変更した時と同じ事が起こるという事
| |
|
8月17日(水)23:21 | トラックバック(0) | コメント(0) | パソコン関連:ハード | 管理
|
置いてけぼり?熟成中? |
|
| nVIDIA、ATI、S3、XGIとビデオカードチップは色々あるが 完全に忘れられているMatrox とは言っても新型チップはWindowsVistaが出るまで出ないだろうし 出る時にはきっとフル512bitGPUを完成させるだろう パイプラインに関しても他のメーカーは24本で構築するのが当面の予定となっているが Matroxは30本・・・いや、36本かも知れない そんな『描画の正確さ』を追求したMatroxが好き
と言う訳で最近は色々なパソコンで搭載出来るように様々なバス用で発売されている ただ発売前からMilleniumP750だけは人気がないので1種類しかない 多分1280×1024のトリプルディスプレイで32bit表示だと 64MBしかないメモリを50MB消費し128bitバス幅が更に性能を低下させる事になるからだろう
それにしてもMatroxだけは一度使うと病み付きになる パソコン用パーツでこんなに危険なのはそうそう無い 今度給料が入ったらMatroxビデオカードに合うマザーボードでも買いますかな
| |
|
8月9日(火)21:34 | トラックバック(0) | コメント(0) | パソコン関連:Matrox | 管理
|
今年の夏のAMD その2 |
|
| http://pc.watch.impress.co.jp/docs/2005/0802/amd.htm Opteron1xxは予定通りSocket939になった でもOpteron1xxをAthlon64系の派生品として作ると 他のOpteronブランドとの統一性が取れない 確かにK8シリーズは『速い、安い、旨い』が合い言葉だが Opteronで手に入れた『信頼』を低下させる事になりかねない 確かにレジスタートメモリは高い でもそれなら全てのOpteronの対応メモリの種類を 増やせばよいだけではないか? そうすればメモリの選択肢が増え安全性を手に入れたければレジスタート対応 そうでなければアンバッファードと 全てのユーザーにおいて『顧客第一主義』を貫けると思うのだが・・・ (単にOpteron 2xxで組もうとしてもレジスタートしか使えないので AthlonMPより出費がかさむ事を苦に組みきれない自分の為かも知れないが)
| |
|
8月5日(金)02:41 | トラックバック(0) | コメント(0) | パソコン関連:AMD | 管理
|
今年の夏のAMD |
|
| http://pc.watch.impress.co.jp/docs/2005/0801/amd.htm http://pc.watch.impress.co.jp/docs/2005/0801/amd2.htm 一番の目玉はやはりAthlon64 X2 3800+の発表 Athlon64 3200+のデュアルコア版なので Pentium4 540のデュアルコア版である PentiumD 840の対抗馬である (正確にはXE 840だけど価格的に言ってもX2の勝利は目に見えている) とりあえず新しい比率 4000+:X2 4800+=1:2.40 3800+:X2 4600+=1:2.13 3700+:X2 4400+=1:1.97 3500+:X2 4200+=1:2.16 3200+:X2 3800+=1:1.82 対Intel比になっているみたい 多分PentiumD 9xxシリーズに対抗しての事だろうけど 間違ってならない事はPentium4のデュアルコア版は PentiumDではなくPentiumXEだと言う事 今から3年前にIntelはPentium4の場合 3GHz以上になればCPUの実行稼働率が半分以下になるから ハイパースレッティングを導入した訳で それを使っていないと言う事はいくらデュアルコアでも シングルスレッドの場合はもの凄く無駄なCPUだと言う事になる エンコードでしか使えないCPUと エンコード以外は最速のCPU どちらを取るかをよく考えよう
| |
|
8月1日(月)20:29 | トラックバック(0) | コメント(0) | パソコン関連:その他 | 管理
|