L2レイテンシの増加 その2 |
|
| http://journal.mycom.co.jp/special/2003/opteron/images/f01.gif こっちの絵の方が分かりやすいかな?
既存のK8 L1にデータが無い ↓ L2へアクセス開始 ↓ L2 Tagの時にDRAMアクセス開始
65nmプロセス以降 L1にデータが無い ↓ L3にデータがあるかどうかの確認開始(無い場合は待機) ↓ L2へアクセス開始 ↓ L3からの返答(無い場合はそのまま) ↓ L2 Tagの時にL3にデータがある場合はL3へアクセス開始 L3が無いorL3にデータが無い場合はDRAMへアクセス開始
すなわちK8コアの基本設計を崩さず L3へのアクセスが追加された分のレイテンシを 出来るだけ削減した結果、L2の読み込みが遅くなる・・・と考える そうでなければ4コア&L3搭載時に約283平方mmになる K8LのL2を倍にするのは自殺行為であり L2とL3とのバランスを『色々組み合わせて行った結果』と 言っていたのに確実に矛盾する事をやろうとしている事になる
しかし後藤さんの過去の記事で「L3とメインメモリへ同時にアクセスする」と 書いてあったのでイマイチ腑に落ちない そこで考えたのがデータバス幅である K8の内部データバス幅は64bitであったが K8Lでは128bitに拡張されている しかし1次キャッシュ量に変更が無いため データがキャッシュに溜るよりも読み込まれる方が早く 空回りしているからじゃないかと思われる
| |
|
1月24日(水)03:50 | トラックバック(0) | コメント(0) | パソコン関連:AMD | 管理
|