Intel Conroe
本次测试的最后一颗处理器是将于下个月正式上市的Conroe,测试使用的为Conroe工程样板,工作于2.4G的频率,高达4MB的共享缓存。

Pic.24: Intel Conroe. 顺序读取载入另一核心未修改数据

Pic.25: Intel Conroe. 随机读取载入另一核心未修改数据

Pic.26: Intel Conroe. 顺序读取载入另一核心已修改数据

Pic.27: Intel Conroe. 随机读取载入另一核心已修改数据
从图中可以马上发现测试结果与Yonah很相似,但在延迟上还有些差异。 首先,未修改数据的读取延迟和L2缓存延迟吻合(图24、25)。很有趣的是,Conroe居然在随机读取和顺序读取中具有不同的延迟周期,顺序读取时延迟有12个时钟周期(图24),而随机读取时延迟增加到了14个时钟周期(图25),因此我们很难判断L2缓存的实际延迟。 接下来,在读取修改数据时 Conroe的表现和Yonah很相似,但延迟增加的幅度相对Yonah小了不少(图26、27)。
停止第一条线程的操作测试系统内存的读取速度。

Pic.28: Intel Conroe. 从系统内存顺序读取数据

Pic.29: Intel Conroe.从系统内存随机读取数据
可以看到Conroe在这种情况下工作效率相当高(图28、29),如此高速的内存传输解释了读取时的低延时现象。
因此,修改数据在Conroe平台上的传输速度远高于Yonah平台,但仍然需要经过系统内存。
结论
从测试中可以看到,使用独立缓存的双核处理器在两个逻辑核心交流上速度均比较慢,仅有Intel的Core Duo(Yonah)及Conroe采用了共享缓存并具有较快的核心间交流速度,但在数据被修改后速度也将减慢。当前对于双核处理器来说运行效率最高的方式是多线程在独立缓存上操作或对共享缓存上的未修改数据进行操作。由于操作系统在任务交换时会改变线程的分配方式,降低了缓存中的命中率,当前提高性能最现实的方法就是严格执行对各核心间的线程分配。
|