铁臂阿童木——Intel ATOM处理器剖析与研究 (3)

Sina WeiboBaiduLinkedInQQGoogle+RedditEvernote分享




二 十万马力——ATOM 处理器硬件系统浅析 (上)

  关于“阿童木”,Intel的官方网站提供了很多详细的资料。如果希望从硬件设计层面来彻底地深入了解一颗处理器,那么阅读其Datasheet应该是一个不错的途径。下面,我们就从ATOM Z5xx系列的Datasheet,试图剖析ATOM的硬件设计,分析一下“阿童木”强大的“十万马力”的源头。

  首先让我们看看Z5xx系列的硬件规格:

• New single-core processor for mobile devices offering enhanced performance

• On die, primary 32-kB instructions cache and 24-kB write-back data cache

• 100-MHz and 133-MHz Source-Synchronous front side bus (FSB)

•100 MHz: Intel Atom processor Z515, Z510, and Z500

•133 MHz: Intel Atom processor Z550, Z540, Z530, and Z520.

Supports Hyper-Threading Technology 2-threads

• On die 512-kB, 8-way L2 cache

• Support for IA 32-bit architecture

• Intel® Virtualization Technology (Intel® VT)

• Intel® Streaming SIMD Extensions 2 and 3 (Intel SSE2 and Intel SSE3) and

Supplemental Streaming SIMD Extensions 3 (SSSE3) support

• Supports new CMOS FSB signaling for reduced power

• Micro-FCBGA8 packaging technologies

• Thermal management support using TM1 and TM2

• On die Digital Thermal Sensor (DTS) for thermal management support using

Thermal Monitor (TM1 and TM2)

• FSB Lane Reversal for flexible routing

• Supports C0/C1(e)/C2(e)/C4(e) power states

• Intel Deep Power Down Technology (C6)

• L2 Dynamic Cache Sizing

• New Split-VTT support for lowest processor power state

• Advanced power management features including Enhanced Intel SpeedStep®

Technology

• Execute Disable Bit support for enhanced security

• Intel® Burst Performance Technology (Intel® BPT) (Intel Atom processor Z515 only)

  以上内容摘自《Intel® AtomTM Processor Z5xx∆ Series Datasheet》。

  其中,我们最关心的有以下内容:

  1FSB的频率为100/133Hz,系统主频在1.1G1.6G之间,约为FSB频率的1012倍,支持Hyper-Thread技术,一个core包含两个hardware threads

  2,集成了一个512K8L2 Cache

  3,支持一系列低功耗相关的功能,如DTSDeep Power Down Technology等;

  4ATOM沿用了传统的IA32 Architecture,也就是指令集上与传统的32x86兼容,并且支持SSE2/3以及SSSE3多媒体指令;

  我们可以看出,以上列出的几点,就是阿童木“十万马力”的力量之源。让我们在这里一一剖析属于硬件部分的前三条。第四条的内容,将在后续章节与大家探讨。  

  FSBFront Side Bus的缩写,即CPU的前端总线。为什么叫“前端总线”呢?原来,它是与“后端总线”(CPUCache之间的总线)相对的。前端总线连接着CPU和内存控制器。它由地址线A[31:0],数据线D[63:0],时钟信号BCLK[1:0](差分信号)以及各控制线等构成。  

FSB的带宽计算公式:Bandwidth = Freq * Bit-width * transfer-per-cycle

  其中,transfer-per-cycle由总线技术所决定。在Pentium/PII/PIII时代,FSB使用的是SDR传输,每个时钟周期传输一次。当时的FSB总线频率一般在66MHz133MHz之间,宽度为64bit,带宽大约在533MBps1066MBps的范围内。从Pentium 4开始,Intel推出了DDR总线,在每个时钟周期的上升沿和下降沿都能够传输数据。这样,在时钟周期不变的前提下,前端总线带宽倍增,达到了既提高传输速率,又不会由于时钟频率的提升,PCB的设计受信号完整性(signal integrity)太多限制。

  当x86处理器演进到双核/四核时代,FSB的技术又发生了一次革命,QDR(Quad Data Rate)技术的出现,又使得FSB的传输带宽倍增。所谓QDR就是一个时钟周期传输四次数据,分别在上升沿、上升沿与下降沿之间,下降沿以及下降沿与上升沿之间传输四次。用数学上的语言描述,就是在时钟周期的0˚, 90˚(½π)180˚(π)270˚(1½π)的相位处发起数据传输。这样就实现了在一个时钟周期内,发起四次传输。同DDR技术类似,由于FSBCLK信号频率不变,提高传输频率对信号完整性的影响不是非常大。由于使用了QDR技术,ATOMFSB能通过100/133MHz的时钟频率,实现3200MBps/4266MBps的传输速率。

  我们知道,IntelCPU在硬件设计上,与其它SoC处理器不同的一点,就是没有集成一些其他处理器内部经常集成的I/O外设,如内存控制器、PCI/PCI-E等局部总线控制器等,所有的内存操作、I/O操作全部需要经过FSB。对于I/O密集的应用,FSB就有可能成为瓶颈。这也是Intel处理器不适合用于高端通信系统数据平面的的主要原因之一。

(3个打分, 平均:5.00 / 5)

雁过留声

“铁臂阿童木——Intel ATOM处理器剖析与研究 (3)”有10个回复

  1. kevin 于 2010-01-08 12:23 下午

    这文章适合投电脑报。。。

  2. 理客 于 2010-01-08 1:16 下午

    对于不精通这个领域的菜鸟,像我,还需需要普及一点基础知识再介绍深入的内容更好理解一点

  3. cs 于 2010-01-08 4:08 下午

    atom就是穿马甲的p3,体系结构上没有多少研究价值。intel自己也不拿这个打广告

  4. 陈怀临 于 2010-01-08 5:27 下午

    微结构是。但在设计中对功耗等等还是比较有讲究的。。。。。。例如SI:-)

  5. 帅云霓 于 2010-01-08 7:17 下午

    我以为,tektalk是一个在小众圈子里面share knowledge的平台。读各位前辈的文章和评论,我学到了很多东西,对不明白的术语和背景知识,自己查资料也有很大的收获,只是overhead稍微大了一些。
    因而,我也尽量将文章写的浅显,尽量多介绍些有关的背景知识。其实,在这个过程中我也发现了很多原来自己也一知半解的地方,通过查资料完善了自己的知识。当然最感谢的是首席,给我布置作业督促我进步。
    其次感谢自己女朋友,只要我一说要做首席留的作业,她就自觉把拉我去逛商场/KTV/咖啡厅/吃好吃的等消耗时间的计划Cancel掉。
    再有还得感谢大家捧场……Blah blah。

  6. 陈怀临 于 2010-01-08 8:09 下午

    谢谢弟妹:-)。是的,我也是这样。在写一个文章的时候,经常要自己首先阅读很多东西。有时一句话有可能卡住N个星期。写CRS-1的时候,许多东西看不懂,不理解。只能不断琢磨,补充一些基础知识,把各种资料aggregate起来,才能有所发现。

    另外,读者的不断提醒,点拨也是自己能进步的重要原因之一。

  7. kkk 于 2010-01-08 9:45 下午

    DDR总线,在每个时钟周期的上升沿和下降沿都能够传输数据,这么说不精确吧,其实它是有两个互为反向的时钟,都是在上升沿

  8. 理客 于 2010-01-08 11:45 下午

    真羡慕,人的命咋就那么不同,我LP如果听说首席还想给我布置作业,不把我打死,连公司的作业,都得骂

  9. kevin 于 2010-01-09 5:39 上午

    FSB按照PC的理解应该是CPU到北桥的总线。。。
    QDR也算不上“革命”。只能算个改良技术的应用。如果QDR革命了,ODR就爆棚了。
    AMD的hypertransport和intel的quickpath更像“革命”一点,本身初衷就是替掉front side bus。设备对带宽要求越来越大,现在大家都不坐公交车了,都开始坐私家小车了,串行大行其道,大家都点对点了。以后PC机箱里,估计就是各个设备,挂在一个超大数据交换机下面。。。

    atom就是一个工艺改进的P3,除了功耗管理其他东西都跟7,8年前的东西及其类似。看看功耗管理能不能挖点啥出来吧

    intel毕竟是老大,现在有了nahelem+quickpath,lz文章最后一句话恐怕有些片面了。

  10. 老韩 于 2010-01-09 10:18 上午

    摘自Intel新闻稿:
    “2010年1月8日——英特尔公司今日宣布,英特尔将面向嵌入式市场为全新2010英特尔® 酷睿™ 处理器系列中的十款处理器和三款芯片组提供7年以上生命周期支持。全新2010英特尔酷睿处理器系列能够提供智能性能和高能效表现,是通信、数字标牌、零售、工业和医疗领域嵌入式应用开发者的理想选择;预计会有超过200种嵌入式应用将基于该系列处理器研发。”
    7年的生命周期支持,这个决定比推出任何处理器都更具轰动效应,对Intel和很多合作伙伴来说是双赢的举动。