Rev.F以降で分かっている事 その2 |
|
| 前回の訂正としてSocketFはDDR2 667MHzのデュアルチャンネル つまりHT速度1.4GHzとなる この場合、リビジョンに関してはEステップではないかと思われ ハイパートランスポート3.0が完成すれば速度は向上するだろう (要するにB3コアOpteronを出した時と同じ状況)
で、問題はRev.FでConroeに勝てるのか?と言う事である 90nm、2コアでは先ず勝てない AMDは90nm、2コアで2.6GHzが限界としている 計算式 130nmの最高速2.4GHz プロセスの細分化によるクロック向上分1.4倍を掛け 消費電力を半減させる為にクロック比を0.8倍にしている 2400×1.4×0.8=2688MHz 65nmプロセスなら 2688×1.4×0.8=3011MHzだがこれは多分FXシリーズになるので 1グレード下の2.8GHzが妥当だと思われる ConroeはAMDの2.8GHzに対して ベンチ結果では平均1.23倍なので 2800×1.23=3447MHz 少なくとも65nm、2コアでも勝つ事は出来ないが、 4コアになると少し変わる AMD 2800×1.9×1.9=5320MHz相当 Intel 3447×1.9×1.8=6205MHz相当 比率としては2コアだと同じだが4コアだと1.16倍と 未だCPUの未完成度が浮き彫りになる 少なくとも3GHz時代に1.16倍程度変わるとすれば その差は2グレード分となる 更にIntelはAMDのシェアを奪い返す為、安売りに入りシェアの低下は免れない が、AMD自体は巻き返しの戦略を既に練っているので これと言って問題視していないが クワッドコアが出るまで苦しいのは間違いない 丁度この時期はWindowsVistaが発売される Vistaで新規に組むならAthlonが安くて良い塩梅かも
一部訂正 Athlon64シリーズの最高クロックを3.0GHzから2.8GHzに変更
| |
|
3月15日(水)01:08 | トラックバック(0) | コメント(0) | パソコン関連:AMD | 管理
|
Rev.F以降で分かっている事 |
|
| Rev.FはDDR2 800MHz(もしかしたら1066MHz)対応 今年は90nmで65nmは来年から クワッドコアをデスクトップにも投入する予定 そして次世代CPUコアのSocketM3があるのではないかという話
情報を整理し解釈してみると 先ずRev.FではSocketFのHT速度は1.6GHz、 SocketAM2はHT速度2.0GHzに上げるのではないか?と言う事 少なくとも現時点で1.6GHzは実現可能だと思われるし 2.0GHzもそう遠くない内に可能になると思われるから (しかしAMDはこれをハイパートランスポート3.0と呼ばず 2.0の拡張版として搭載するのだろう) その後2007年に65nmプロセスでクワッドコアを発売し 2008年の中盤でHT速度を更に高速化し DDR3に対応したSocketM3へと向かい 2009年に45nmプロセスに突入&K10投入し 8コアが出るかはどうかは不明だが2010年末にK8系は終焉を迎え 次々世代Windows(Vistaの次)ではK10系が主力製品となるのだろう
| |
|
3月14日(火)01:46 | トラックバック(0) | コメント(0) | パソコン関連:AMD | 管理
|
かなり欲しいけど・・・問題は値段だな |
|
| とりあえずIntelの次世代CPUは凄い事になっているな でもこの方式だとクロックは上げられない 一度に実行できる命令が増えると言う事はその分だけ電力を必要とし 限られた電力内でそれをこなそうとすれば プロセスを細分化しない限りクロックを上げる事が出来ない 逆に言えば同じコアを使ったCeleronとのクロック差は無いに近いし コアを故意に弄ったとしても性能差はさほど変わらない つまりCeleronバカ売れの状況は変わらない
AMDのK8系は2次キャッシュやFSBの違いだけで Athlon系とSempronと分かれている コア自体は全く同じ物なので現時点で性能差は殆ど無い だがメモリコントローラの違いでマザーボードとメモリが違う そして最初はAthlon系、のちにSempronへと移行する この構図はAthlon系がDDR3、SempronがDDR2となり どちらもSocketAM2になるがやはりマザーボードとメモリは違う AMDはこれからコア以外の部分を強化するので シングルスレッドは同じでもマルチスレッドになると話は変わる これによって差別化は生まれると思われる
『百聞は一見に如かず』 これだけパソコンが普及すれば昔の様に周波数や ベンチ結果だけで決める事は無くなり 現在使っているCPUとどう違うのか?で決める事になる だがコアを弄っていればその感覚は分かり難い 少なくともCeleronを使っている人が今のPentiumや次世代のCPUを 比較するには難しい所がある そう考えるとCeleronユーザーは同じ低価格帯であるSempronを選ぶ Sempronを選べばコアが同一のAthlon系の事が分かる様になるので その性能が必要となればAthlon系へと進む事になる 一度Athlon系に進むとIntel製へ戻る事はあまり無い気がするし 個人的にも戻る気は殆ど無い
で、タイトルの話 http://pcweb.mycom.co.jp/articles/2006/03/11/cebit3/ Socket754の組込用マザーボードだがかなり欲しい 確かに組込用となれば値が張るのは確かだが物はSocket754 Pentium-Mマザーボードに比べて独自の設計も不要だし コストも普通のマザーボードを作るより安いだろう 作っているメーカーもメーカーだしリテール販売を視野に入れている以上 1万円程度で発売する可能性も・・・ 欲しい・・・かなり欲しい・・・
| |
|
3月12日(日)00:23 | トラックバック(0) | コメント(0) | パソコン関連:AMD | 管理
|
やっぱりK8LはK6-III? その2 |
|
| そう言えばXDRって256bitチップなのよね つまり1個で256bit÷8=32MB 3次キャッシュ32MBってどうよ? まぁ、それはそれで面白いけど
仮に65nmプロセスで3次キャッシュ4MBを搭載するとなると 2コアで200平方mm、4コアで300平方mmになる CPUが最も消費電力を食う場所はキャッシュなので 消費電力を減らす為にはある程度熟成させる必要がある だから来年まで先送りという事なのだろうか? とりあえずAthlon64FXは90nmで3.0GHz 65nmプロセスで3.4GHzまで行くと思うので ConroeXEが強ければ 今年中に3.0GHzは行くと予想する 3次キャッシュはそれからだろう (理由としてAthlon64 X2の最高クロックは計算上3.0GHzで止まり コイツは来年のQ1発売となるがFXは上位版として消費電力が高くとも 1ランク上である3.0GHzの登場があり得る為)
| |
|
3月10日(金)01:18 | トラックバック(0) | コメント(0) | パソコン関連:AMD | 管理
|
やっぱりK8LはK6-III? |
|
| AMD64 Architecture Programmer's Manual Volume 1の 121ページにある図を見る限り3次キャッシュはCPUの外側にある もしこの方法で接続されるのならばK6-IIIと同じ機能を搭載する事になる K6-IIIの時はFSB=3次キャッシュの速度=メモリの速度だったので あまり高速ではなかったがK8系の場合 HTの転送速度=3次キャッシュの速度≧メモリ2枚の速度なので 少しは高速になるのではないかと思われる 例えば現行のCPU-メモリ間は1.4GHzだが 実際にはDDR400×2の800MHzである だが3次キャッシュは1.4GHzで駆動すると思われるので 確実にCPUクロック>3次キャッシュ>メモリ速度×2が成り立つ この事から言える事は外付けにする事に対して CPUのダイサイズを巨大化させる必要が無く消費電力も押さえられ 3次キャッシュの量を容易に増やす事ができるし CPU-3次キャッシュをシリアル接続にすれば高速化も可能である もしかして『今後メモリコントローラを外付けにするかもしれない』という発言は 3次キャッシュにメモリコントローラを載せ CPUは3次キャッシュを介してメモリにアクセスする そういう事なのではないだろうか? (でもこの場合3次キャッシュ量は変更できないしK10の話での話だろう)
しかしこの文書を読んでみるとどうも単なる説明の様な気がしてならない でも現行のアークテキチャに3次キャッシュの説明が必要だとは思えないし 3次キャッシュを明確に外部キャッシュと言っている点も気に掛かる (サーバー用の場合、3次キャッシュは大抵内部に組み込まれている) それにラムバスとAMDが特許ライセンス契約を締結した事も気になる 仮にラムバスのXDRを3次キャッシュにすれば 3.2GHzの速度でも対応可能だし XDIMMを使えば大容量のキャッシュにする事も可能 しかもデータバス幅は16bitなのである
個人的にはAthlon64FXがこの機能を搭載すれば かなり面白いと思うのだがSocketM2じゃ無理か? ・・・いや、無理じゃない 940ピンならピンは余っているはずだから 外部キャッシュとして接続する事は可能だろう マザーボードに関しては3次キャッシュのXDIMMスロットと Ahlon64FXと認識された場合にBIOSで3次キャッシュを 利用可能にするかどうかを決めれば良いだけだし そうなればIntelのXE相手にかなり面白い勝負をすると思うんだけどな・・・
| |
|
3月9日(木)02:48 | トラックバック(0) | コメント(0) | パソコン関連:AMD | 管理
|
SocketAM2のCPUは・・・ |
|
| http://www.tomshardware.com/2006/02/21/a_look_at_amds_socket_am2_platform/page5.html
他のサイトでもAM2のDDR2ベンチ結果として書かれているが 気になったのはSocketAM2用CPUの消費電力 何で2種類あるのだろうか? 色々考えた結果 『AMDはサーバーやモバイル用では普通となっている 低電圧版CPUをデスクトップで普及させる気ではないか?』 現在デスクトップ用CPUはプロセスとかの違いで消費電力は違うが 一概に低電圧版という物は存在していない そしてAthlonXPを組み込み用として電圧を下げたGeodeNXは かなり売れまくっているし オーバークロッカーよりは少ないかもしれないが 低電圧で動かす事に情熱を燃やす人も居る だとすればユーザーが求める物に対してそれなりに答えるべく 『正式なサポートが受けられる低電圧CPU』を作る気なのだろう そしてCPUにプレミアを付け儲ける事も考えていると思われる
一応表の数字をまとめると Athlon64FX 125W Athlon64 X2 89W Athlon64 X2 65W版 Athlon64 63W Athlon64 35W版 となっている。となれば 消費電力に関係なく最高性能が欲しいと言うのなら Athlon64FX 消費電力と性能を両立したいと言うのなら Athlon64 X2 89W版 Athlon64 63W版 消費電力が一番で性能はその次と言うのなら Athlon64 X2 65W版 Athlon64 35W版 この流れを2006年の年末にかけて行うのではないかと思う (従って初めに登場するのは全ての通常版と低電圧の低クロック品 あとは通常版のクロックが1ランク上がる度に低電圧版も1クロック上がる?)
この事によって得られる最高の結果は IntelのConroeが65Wたど明言している以上 65W以上のCPUはXE版(Woodcrest 80W)でしか出せず Meromも35Wだと言っている そして来年にはクワッドコアで結局MAX130Wまで上昇し 他のCPUもそれに対してTDPは上がる それに対しK8系は65nmプロセスに突入すれば 今まで125Wでしか動かなかった物が91Wで動くようになり 89Wは65W、63Wは35Wとどんどん下がっていくように見え 初めに90nmプロセスで89WのCPUを搭載するとして 65nmプロセスでも89WのCPUを選べは最大1.4倍の性能が 同じ消費電力で受けられる事になる これはPentium4のWillamette→Northwood時や AthlonXPのPalomino→Thoroughbred時と同じ現象である どちらも後者は『近年では最高のCPU』と言われている物 AMDが65nmで梃子摺っているのも130nmの時と同じ こうなるとSocketAM2からは絶対に目が離せない
| |
|
3月6日(月)19:01 | トラックバック(0) | コメント(0) | パソコン関連:AMD | 管理
|
とは言ってもRev.Fも気に掛かる その5 |
|
|
| 32個構成の図(予想) 左図の方法だとハイパートランスポート数は最大で5本 1つのCPUを起点として全てのCPUへ行くのに 通過するCPUは最大4個で済むがこの配線は無理があるか? やはり右図の方法で最大5個なのか? 仮に左図の状態で接続する事が可能なら良いが 右図だとするとハイパートランスポートが6本必要で余る所がかなり増える でもハイパートランスポートは各3本ずつ計6本だからな・・・ いや、中央のサウスブリッジへのバスを入れると7本か・・・ サッパリ見当が付かない 配線の接続方法が違うのかな?
| |
|
3月3日(金)02:53 | トラックバック(0) | コメント(0) | パソコン関連:AMD | 管理
|
とは言ってもRev.Fも気に掛かる その4 |
|
| よく考えると前回の考えが根本的に間違っている事に気付いた それを思い出させてくれたのは3個のPLLジェネレータ 今までのPLLジェネレータは1個 その1個のジェネレータからは 内部のコアに接続するバスが2本 外部のCPUとサウスブリッジを結ぶバスが3本 つまり計5本である そのジェネレータが3個になっているという事だから 中央のジェネレータは 内部のコアに接続するバスが2本 サウスブリッジに接続するバスが1本 残り2本はその両脇にあるジェネレータに使われる 問題は両脇にあるジェネレータだがわざわざ配線を減ら(増や)して 元々持っているジェネレータと違うジェネレータを入れるとは思えない と言う事は両脇のジェネレータには中央と結ぶバス以外に4本ある だから各3本のハイパートランスポートがあると言うのは 『外部+内部』ではなく『全部内部』だと思われる 残った1本が外部接続用 つまり外部にはそれぞれのジェネレータから1本ずつ計3本で 今までのOpteronと変わらない
となるとピン数だが32bitになるのは転送量の関係上必然なので 198(66×3)-102(34×3)=96本 1207-940-96=171本余る事になる そこで考えたのがクワッドチャンネルメモリ対応 CPUとメモリは速度が向上しない限り高速化できないので 転送量を増やそうと思えば現在の128bitから256bitにする必要がある これによってデュアルチャンネル時ではCPU同士の転送量より メモリの転送量は超えられないが クワッドチャンネルならメモリとの接続がボルトネックになる事もない どのみちサーバー、ワークステーション用だからメモリは大量にいるだろうし あり得ない事ではない
追記 AMDの話だと“CPU”を16&32個接続可能だと言っている そうなると前回のが正しくてクワッドチャンネル構想はないのか? そしてDDR3対応はハイパートランスポートver4.0を待つ必要があるか? 新しい情報はSocketF版Opteronが発売された時だろうな・・・
| |
|
3月1日(水)20:58 | トラックバック(0) | コメント(0) | パソコン関連:AMD | 管理
|
DualGeodeNX with TigerMP 続き その2 |
|
| BIOSを1.03から1.05に書き換えるがその後起動しなくなる つまりサラブレッドコアだと認識させるとエラーとなるのだろう (サラブレッドコアで倍率5倍はGeodeNX1250@6Wしかないので) となるとBIOS上では180nmプロセスのCPUとして 認識されている事になる となると実クロック1GHzのGeodeNX1500@6Wも同様だと判断できる (サラブレッドで倍率7.5倍のCPUも存在しないので)
| |
|
2月26日(日)18:19 | トラックバック(0) | コメント(0) | パソコン関連:AMD | 管理
|
方向性の違い |
|
| http://www.theinquirer.net/?article=29890 浮動小数点処理装置を2倍にして全体で1.5倍の性能向上が見込まれる K8L(仮)か・・・ま、当然といえば当然かも知れない 少なくともIntelのConroeやMeromの4命令同時実行は 確か『整数演算のみ』だったはずなので方向性が違うのだろう ここでCPUが行う演算を考えてみる CPUは整数演算と浮動小数点演算が実行できる 整数演算とは別名固定小数点演算と言って ・表現できる範囲が狭い ・誤差のない数値 ・小数点以下は表現できない そして浮動小数点演算は ・表現できる範囲が広い ・誤差を含む ・小数点以下も表現できる とそれぞれ全く違うのである 整数演算で行える命令の一つに『int』という物があり これは32bitで計算できる値である 実際の数値は-2,147,483,648 ~ +2,147,483,647であり これだと数十、数百億単位で計算を実行している 金融機関等のシステムでは不足している 従って64bitで計算できる『long』という命令を作り 数値を-9,223,372,036,854,775,808 ~ +9,223,372,036,854,775,807まで計算できる様にしたのである x86系CPUは今までは32bitCPUだったので 64bitの計算をするとなると32bitより時間が掛かっていた (実際には拡張命令を使って高速化するが64bitCPUなら 拡張命令を使う必要がない) 従って金融機関等のメインサーバー等にはx86命令より先に 64bit化していたRISCプロセッサが使われていた ただ今やx86命令も一部のCPUを除き64bit化している つまり『int』でも『long』でも同じ時間で計算できる様になったのである そうなってくるとライバルはサーバー用途として君臨している RISCプロセッサという事になる RISCプロセッサの強みはCPUを連結して並列処理が出来る点 IntelのCPUで最も接続する数が多いのはXeonMPの4個 AMDのOpteronは現時点で8個なのでXeonMPには勝っている (実際には特注品なんかもあるので違うけど) そしてAMDはSocketFで32個接続を行おうとしている これは小規模クラスから中規模クラスへとサーバー市場での幅を 広げようとしている事以外考えられない そこで必要となってくるのは少なくとも整数演算を高速化させる事ではなく 浮動小数点演算を高速化させる事である 整数演算を特化したとしても所詮は『限られた数値』であり それ以上(それ以下)の数値に関しては計算すらできない そして一般的なプログラムでは正確性を求めない限り 浮動小数点演算を使うのが当たり前である 従って浮動小数点処理装置を増やす事が全体性能の向上に繋がる 最近はWindowsもサーバー市場に足を踏み入れようとしている K8L(仮)&Windows・・・x86命令が何処まで食い込めるか?
| |
|
2月26日(日)02:58 | トラックバック(0) | コメント(0) | パソコン関連:AMD | 管理
|