下载首页 | 资讯中心 | 文章分类 | 最近更新 | 排 行 榜 | 国产软件 | 国外软件 | 绿色软件 | 汉化补丁 | |
文章搜索: 分类 关键字
您的位置:首页硬件资讯硬件评测 → 双核CPU内部传输秘密测试 AMD不敌英特尔
双核CPU内部传输秘密测试 AMD不敌英特尔
来源:太平洋电脑网 作者: 加入时间:2006-10-28 访问次数:5 [  ]

  进入2006年,双核处理器普及的趋势已是势不可挡,各项测试均表明了双核处理器在多线程运算中的巨大优势,但在之前似乎还没有谁测试过两颗核心间的数据交换速度。

  为了更好的了解这次测试,我们首先要了解一下双核处理器系统的数据交流方式。普通处理器在处理数据时均采用从内存读取数据,处理后再返回内存的路径,但对于双核处理器,这可能会产生一些矛盾,因为当一颗处理器对数据进行运算后,另一颗有马上读取的需求时,如果仍然通过系统总线交换数据,相比两颗核心直接交流,无疑增加了很大的延迟,极大影响处理数据的速度。

  两颗核心直接交流,这决定于多核心处理器的独立性问题,因为两核心都在同一块die面上,如果仅通过CPU缓存而不是系统北桥总线交换数据的话,速度将大大加快。之前的一些评论也会将双核CPU的缓存看作完整的一块缓存,具体结果怎样,让我们来看一下测试结果

  为了测试读取速度,我们为双核CPU准备了一个普通的数据块,进行双线程操作,每一条线程对应一颗逻辑CPU,其中一条线程对数据块进行两种操作:只读操作(数据块仅从内存传送至缓存),修改操作(数据块从内存传送至缓存后进行修改),接下来我们可以观察发生的情况,两种可能:

  1.最近的待数据储存在系统内存和第二颗逻辑处理器的缓存中

  2.最近的待处理数据仅储存于第二颗处理器的缓存中

  因此,我们把第一条线程从内存读取数据的逻辑处理器定义为CPU1,将第二条线程的处理器定义为CPU2。

  两条线程通过一条叫spin-wait的循环指令聚集起来,该指令可以保证数据传输中的最大速度并阻止其他线程的插入操作,测试中两条线程均允许在最高优先级上(THREAD_PRIORITY_REALTIME)。

  为了准确测试第二条线程读操作中的延迟,我们使用了一条连接指针链:

  // eax is the beginning of the data block

  xor ebx, ebx // ebx <=0

  xor edx,edx // edx <=0

  ………

  and edx, eax // synchronization

  mov eax, [eax+ebx]// a data read

  N*{and ebx, edx} // delay to use the read data

  and edx, eax // syncing the moment of use of the read data

  mov eax, [eax+ebx] // using the read data; the next data read

  N*{and ebx, edx}

  and edx, eax

  mov eax, [eax+ebx]

  ………

  程序中N为延迟指令数值,测试中使用的数据块大小从 8KB到4094MB,因此我们可以了解从适合L1缓存大小的数据块到远远超出L1容量的数据块在数据处理中的结果。

  测试对象:

  AMD Athlon 64 X2

  Two-Way AMD Opteron System

  Intel Pentium D

  Intel Pentium 4 (Prescott)

  Intel Core Duo (Yonah)

  Intel Conroe

AMD Athlon 64 X2

  首先测试的是AMD的Athlon 64 X2 4400+处理器,工作于2.2G,每核心独占1MB二级缓存,两颗物理核心通过系统请求界面(system request interface)相连,因此我们期待该处理器的逻辑核心间不需通过系统总线即可进行数据交流。

AMD Athlon 64 X2

Pic.1: AMD Athlon 64 X2. 顺序读取未修改数据

Pic.2: AMD Athlon 64 X2随即读取未修改数据

  两幅图表明决定平均读取延迟的是延迟链的长度,图1中可以看到顺序读取中数据块的大小几乎对最小延迟没有任何影响,并且比预期多了50各周期的时间。这表明数据块传输时总是需要经过系统内存,50个时钟周期也不能被看做内存延迟,这应该是由在数据请求和载入之间的预读取而引起的。

  图2的随机读取中现象更加有趣,最小延迟随着数据块的减小而缩短,尽管如此,随机读取中的80个周期延迟对于从缓存读取显然是太大了。

  此外,我们还可以注意到,随着延迟指令链的延长,实际延迟也呈阶梯状上升,每一级10个周期,与X2 4400+的倍频相同,这是巧合吗?后面我们可以看到答案。

上一页 [1] [2] [3] [4] [5] 下一页
评论人 评论内容摘要(共 0 条,查看完整内容) 得分 0 发表时间
 热点文章
·惊爆!《暗黑破坏神3》将对应全平台
·《荣誉勋章:太平洋之战》中文版上市
·MediaShow魅力四射快速制作音乐电子相册
·《花木兰》完美流程攻略
·轻松可爱 最新10大Q版网络游戏推荐
·2006年暑期新宣布免费网络游戏一览
·photoshop制作水晶球中的精灵
·NVIDIA发布Forceware 93.71 WHQL驱动
·经验分享 微软Word2007实用技巧两则
·国内新记录产生 1M super pi运算仅用9秒
 推荐文章
·微软高官爆料:欧盟对Vista哪些功能不安
·在Google Talk上与QQ、MSN好友聊天
·Word使用过程中的常见问题及其解决
·手把手教你内存终极变相“造假”大法
·NVIDIA联手海盗船 推出自动超频内存
·Windows Vista特殊功能介绍:语音识别
·公安机关检验软件样本 流氓软件制造者面临坐牢危..
·比英特尔UMPC还要小 移动PC新品推出
·性感暴力完美结合 御姐武戏X新画面
·盖茨访谈:我就是微软里的兼职员工
WinXP下载基地 版权所有 Copyright© 2006-2008 WWW.WinXpd.COM, All Rights Reserved. 页面维护: WinXP下载基地(WinXP基D)