澳门新萄京官方网站-www.8455.com-澳门新萄京赌场网址

Bulldzoer新品策略,这18条背下来没人敢和你忽悠

2019-07-21 作者:服务器运维   |   浏览(115)

AMD公司在最近召开的HotChips会展上终于透露了其新款分别面向服务器和移动市场的Bulldozer和Bobcat处理器产品的有关细节,这两种处理器产品是AMD推出Opteron处理器之后最重要的一次产品升级,而其中Bulldozer更堪称是自1999年推出K7处理器以来的最重要产品更新。

1955年,晶体管发明。随后在晶体管的使用,集成电路的商业化,让更多人知道了半导体,知道了毫不起眼的沙子会是未来信息产业发展的基石,造就了高科技产业云集的硅谷。20世纪60年代到70年代间,集成电路的发展走向了快车道。不过在这几十年的时间里,有太多的公司因为各种原因消失在历史的长河中。而留下来的企业中,有一家非常独特:它没有很高的市值、一路的竞争对手远比自己强大,却在能在这么强大的压力下坚持发展,最终不仅生存下来,而且在这几十年的时间里,还让那个强大的竞争对手感受过压力,创造了商业奇迹,而这家公司就是今天的主角——AMD。

澳门新萄京官方网站 1

  1.主频 

蓝色巨人IBM Power 8 芯片强势上市

导读沉寂了多年的AMD桌面发烧级处理器ZEN越来越明朗,凭借全新的架构和超线程技术,一举追平Intel当家旗舰,不过在非x86计算领域,蓝色巨人IBM新品同样不容小觑,最新发布的Power8芯片核心达到了12个,不过凭借SMT8超线程技术,单颗处理器即可实现多达96线程。

澳门新萄京官方网站 2

早在2012年IBM就曝光了最新的Power8芯片设计架构,不过产品直到近日才正式发布,规格方面Power8采用22nm SOI工艺制造,基于RISC架构,拥有12个核心,线程数达到了96个之多,单线程、多线程性能分别比8个核心的Power7i提升1.5倍、2倍。

澳门新萄京官方网站 3

架构方面,它采用了8分派、10发射、16流水线的设计,并增强了预取能力。缓存拥有一级数据64KB、一级指令32KB、二级4MB(每核心512KB)、三级96MB eDRAM(所有核心共享)、片外四级最大128MB eDRAM。双通道内存控制器,带宽最大230GB/s。

澳门新萄京官方网站 4

Power8整合了多种加速器,包括加密、内存扩展、事务性内存、VMM(虚拟机管理器)助手、数据转移和虚拟机移动性,总线方面则支持PCI-E 3.0、SMP互联CAPI(一致性加速处理器接口)。电源管理方面有片上功耗管理微控制器、每核心整合VRM、关键路径监视器等等,但是具体功耗没有披露。

澳门新萄京官方网站 5

IBM同时也发布了一系列基于Power8的服务器,其中顶级型号Power S822LC面向高性能计算,同时搭载NVIDIA最新帕斯卡架构的Tesla P100计算卡,也首次继承NVIDIA NVLink双向互连总线,号称数据率比x86系统快5倍。

美国能源部橡树岭国家实验室已经对该服务器进行了测试,将于2017年推出的全新超级计算机Summit也正是基于该平台。

原文来自:

本文地址:

Power 8 芯片强势上市 导读 沉寂了多年的AMD桌面发烧级处理器ZEN越来越明朗,凭借全新的架构和超线程技术,一举追平Intel当家旗...

AMD推土机、山猫新架构官方视频

在20世纪60年代末70年代初,“硅谷”还没有被命名为“硅谷”,电子计算机还是稀缺物,之后长达几十年的竞争对手Intel研发出了3101存储器芯片,随后推出了DRAM动态存储器,宣告王安发明的磁芯存储器成为历史。而Jerry Sanders拿着筹集到的50000美元与仙童半导体的老同事,在1969年5月1日,于加州森尼韦尔市,成立了Advanced Micro Device,也就是AMD(国内翻译为超微半导体),从此开启了一段值得铭记、堪称商业史传奇的发展历程。

1.主频

  主频也叫时钟频率,单位是MHz,用来表示CPU的运算速度。CPU的主频=外频×倍频系数。很多人认为主频就决定着CPU的运行速度,这不仅是个片面的,而且对于服务器来讲,这个认识也出现了偏差。至今,没有一条确定的公式能够实现主频和实际的运算速度两者之间的数值关系,即使是两大处理器厂家Intel和AMD,在这点上也存在着很大的争议,我们从Intel的产品的发展趋势,可以看出Intel很注重加强自身主频的发展。像其他的处理器厂家,有人曾经拿过一快1G的全美达来做比较,它的运行效率相当于2G的Intel处理器。    

以下,我们便为读者简要分析AMD在Bulldzoer中做出这些设计更新的主要背景。

澳门新萄京官方网站 6

主频也叫时钟频率,单位是MHz,用来表示CPU的运算速度。CPU的主频=外频×倍频系数。很多人认为主频就决定着CPU的运行速度,这不仅是个片面的,而且对于服务器来讲,这个认识也出现了偏差。至今,没有一条确定的公式能够实现主频和实际的运算速度两者之间的数值关系,即使是两大处理器厂家Intel和AMD,在这点上也存在着很大的争议,我们从Intel的产品的发展趋势,可以看出Intel很注重加强自身主频的发展。像其他的处理器厂家,有人曾经拿过一快1G的全美达来做比较,它的运行效率相当于2G的Intel处理器。

  所以,CPU的主频与CPU实际的运算能力是没有直接关系的,主频表示在CPU内数字脉冲信号震荡的速度。在Intel的处理器产品中,我们也可以看到这样的例子:1 GHz Itanium芯片能够表现得差不多跟2.66 GHz Xeon/Opteron一样快,或是1.5 GHz Itanium 2大约跟4 GHz Xeon/Opteron一样快。CPU的运算速度还要看CPU的流水线的各方面的性能指标。 
  当然,主频和实际的运算速度是有关的,只能说主频仅仅是CPU性能表现的一个方面,而不代表CPU的整体性能。    

 澳门新萄京官方网站 7

如果一家公司成立50年,从时间跨度上已经足够让众人称赞。而回顾AMD这50年的发展,他挑战的对手都非常强大,从二十世纪80年代开始,在CPU领域与Intel竞争,到2006年收购ATI后与NVIDIA竞争,都是一个十足的挑战者。同行的摩托罗拉、全美达等都在挑战“巨龙”Intel失败后,只有AMD依旧在这条路上前行,虽然目前AMD的300亿美元左右的市值相比Intel的2300多亿美元市值相差甚远,但AMD不仅生存了下来,而且近些年凭借着Ryzen处理器、GPU以及半定制业务,逐渐走出了低谷,发展也走向了正轨。

所以,CPU的主频与CPU实际的运算能力是没有直接关系的,主频表示在CPU内数字脉冲信号震荡的速度。在Intel的处理器产品中,我们也可以看到这样的例子:1 GHz Itanium芯片能够表现得差不多跟2.66 GHz Xeon/Opteron一样快,或是1.5 GHz Itanium 2大约跟4 GHz Xeon/Opteron一样快。CPU的运算速度还要看CPU的流水线的各方面的性能指标。

  2.外频 

AMD推出Bulldozer产品的主要目的和宣传重点,是在这款处理器在传统的多核心处理器和SMT同时多线程这两种技术之外,又开拓出了一条新的多线程处理器设计道路。在传统的多核心处理器设计又称CMP)中,每个处理器核心只能运行单个线程;而SMT则恰好相反,多个线程可以共享单个处理器核心的资源,并可以在单个处理器核心中被同时执行。

AMD在过去并非没有持续扩大的机会,如曾经的K8架构时代,Athlon速龙64处理器,后来的Athon 64 X2“真双核”都是AMD的辉煌时刻,但是随后Intel就拿出了Core 2 Duo后,AMD研发没有跟上竞争对手节奏,再次落入比拼性价比的地步。随后推土机架构虽然CMT多簇式多线程技术想法很美好,但是并没有让AMD再次步入几年前的辉煌。不过好在2017年发布的Ryzen处理器逐渐将AMD拉出低谷,不过不止除了处理器外,还有显卡这条产品线的AMD,彻底走出来还需要时间。

当然,主频和实际的运算速度是有关的,只能说主频仅仅是CPU性能表现的一个方面,而不代表CPU的整体性能。

  外频是CPU的基准频率,单位也是MHz。CPU的外频决定着整块主板的运行速度。说白了,在台式机中,我们所说的超频,都是超CPU的外频(当然一般情况下,CPU的倍频都是被锁住的)相信这点是很好理解的。但对于服务器CPU来讲,超频是绝对不允许的。前面说到CPU决定着主板的运行速度,两者是同步运行的,如果把服务器CPU超频了,改变了外频,会产生异步运行,(台式机很多主板都支持异步运行)这样会造成整个服务器系统的不稳定。    

而Bulldozer则定位在CMP和SMT两种技术之间,在Bulldozer中,两个线程可以共享一个处理器核心的前端功能单元,但是整数执行资源部分则为线程独享式设计。

现在就来回顾一下AMD这50年的发展历程,看看这个从筹集到50000美元发展到现今市值300亿美元左右的公司经历了什么。

2.外频

  目前的绝大部分电脑系统中外频也是内存与主板之间的同步运行的速度,在这种方式下,可以理解为CPU的外频直接与内存相连通,实现两者间的同步运行状态。外频与前端总线(FSB)频率很容易被混为一谈,下面的前端总线介绍我们谈谈两者的区别。    

在进一步探察Bulldozer内部架构之前,我们必须要看清楚的是,尽管AMD方面想极力撇清自己的产品与SMT的相似之处,并将他们的方案自称为“第三种多线程处理器设计”,但是Bulldozer其实质其实是以SMT为基础的一种改良设计。

1.离开仙童到草创AMD(1969年-1976年)

外频是CPU的基准频率,单位也是MHz。CPU的外频决定着整块主板的运行速度。说白了,在台式机中,我们所说的超频,都是超CPU的外频(当然一般情况下,CPU的倍频都是被锁住的)相信这点是很好理解的。但对于服务器CPU来讲,超频是绝对不允许的。前面说到CPU决定着主板的运行速度,两者是同步运行的,如果把服务器CPU超频了,改变了外频,会产生异步运行,(台式机很多主板都支持异步运行)这样会造成整个服务器系统的不稳定。

  3.前端总线(FSB)频率 

...

讲AMD的创立还是得将时间向前拨。在1947年,威廉·肖克利及约翰·巴丁、沃尔特·布莱顿发明了晶体管。之后威廉·肖克利就致力于推动晶体管商业化,在1955年离开贝尔实验室创办了肖克利半导体实验室。虽然因为他的名声及能力吸引了一批才华出众的科学家,不过科研能力强不代表管理能力强,由于其怪异的管理能力和行为,导致了8名出色的科学家离职,而肖克利也将他们成为“八叛逆”(Traitorous eight)。随后这八人拿到了来自仙童摄影器材公司的投资,成立了仙童半导体公司。因为这些出色的科学家、工程师,让仙童半导体的发展非常迅速,也由此吸引了更多的人才加盟。

目前的绝大部分电脑系统中外频也是内存与主板之间的同步运行的速度,在这种方式下,可以理解为CPU的外频直接与内存相连通,实现两者间的同步运行状态。外频与前端总线频率很容易被混为一谈,下面的前端总线介绍我们谈谈两者的区别。

  前端总线(FSB)频率(即总线频率)是直接影响CPU与内存直接数据交换速度。有一条公式可以计算,即数据带宽=(总线频率×数据带宽)/8,数据传输最大带宽取决于所有同时传输的数据的宽度和传输频率。比方,现在的支持64位的至强Nocona,前端总线是800MHz,按照公式,它的数据传输最大带宽是6.4GB/秒。    

前情提要到这里快要结束了,因为此时一位名为杰里·桑德斯的年轻人加入仙童半导体。在上世纪60年代后期,但是由于仙童半导体公司问题,人才逐渐离开,包括曾经创立它的“八叛逆”。最为人熟知的就是罗伯特·诺伊斯、戈登·摩尔拉上安迪·格鲁夫创立Intel。不过离开的不只是这些人,时任仙童半导体人销售部主任的杰里·桑德斯也在1968年离开了。

3.前端总线频率

  外频与前端总线(FSB)频率的区别:前端总线的速度指的是数据传输的速度,外频是CPU与主板之间同步运行的速度。也就是说,100MHz外频特指数字脉冲信号在每秒钟震荡一千万次;而100MHz前端总线指的是每秒钟CPU可接受的数据传输量是100MHz×64bit÷8Byte/bit=800MB/s。    

澳门新萄京官方网站 8

前端总线频率是直接影响CPU与内存直接数据交换速度。有一条公式可以计算,即数据带宽=(总线频率×数据带宽)/8,数据传输最大带宽取决于所有同时传输的数据的宽度和传输频率。比方,现在的支持64位的至强Nocona,前端总线是800MHz,按照公式,它的数据传输最大带宽是6.4GB/秒。

  其实现在“HyperTransport”构架的出现,让这种实际意义上的前端总线(FSB)频率发生了变化。之前我们知道IA-32架构必须有三大重要的构件:内存控制器Hub (MCH) ,I/O控制器Hub和PCI Hub,像Intel很典型的芯片组 Intel 7501、Intel7505芯片组,为双至强处理器量身定做的,它们所包含的MCH为CPU提供了频率为533MHz的前端总线,配合DDR内存,前端总线带宽可达到4.3GB/秒。但随着处理器性能不断提高同时给系统架构带来了很多问题。而“HyperTransport”构架不但解决了问题,而且更有效地提高了总线带宽,比方AMD Opteron处理器,灵活的HyperTransport I/O总线体系结构让它整合了内存控制器,使处理器不通过系统总线传给芯片组而直接和内存交换数据。这样的话,前端总线(FSB)频率在AMD Opteron处理器就不知道从何谈起了。    

仙童半导体后来也是命途多舛,不过它也为行业的发展贡献了太多的人才。

外频与前端总线频率的区别:前端总线的速度指的是数据传输的速度,外频是CPU与主板之间同步运行的速度。也就是说,100MHz外频特指数字脉冲信号在每秒钟震荡一千万次;而100MHz前端总线指的是每秒钟CPU可接受的数据传输量是100MHz×64bit÷8Byte/bit=800MB/s。

  4、CPU的位和字长 

随后杰里·桑德斯与几位仙童半导体的员工,共同筹集了50000美元,在仙童半导体的所在地——桑尼韦尔,创建了Advanced Micro Device。

其实现在“HyperTransport”构架的出现,让这种实际意义上的前端总线频率发生了变化。之前我们知道IA-32架构必须有三大重要的构件:内存控制器Hub ,I/O控制器Hub和PCI Hub,像Intel很典型的芯片组 Intel 7501、Intel7505芯片组,为双至强处理器量身定做的,它们所包含的MCH为CPU提供了频率为533MHz的前端总线,配合DDR内存,前端总线带宽可达到4.3GB/秒。但随着处理器性能不断提高同时给系统架构带来了很多问题。而“HyperTransport”构架不但解决了问题,而且更有效地提高了总线带宽,比方AMD Opteron处理器,灵活的HyperTransport I/O总线体系结构让它整合了内存控制器,使处理器不通过系统总线传给芯片组而直接和内存交换数据。这样的话,前端总线频率在AMD Opteron处理器就不知道从何谈起了。

  位:在数字电路和电脑技术中采用二进制,代码只有“0”和“1”,其中无论是 “0”或是“1”在CPU中都是 一“位”。 

离开仙童半导体的员工,很多还是在半导体、集成电路领域,杰里·桑德斯也不例外。初期AMD主要生产逻辑芯片,同年AMD就生产了旗下第一款产品——Am9300 4位移位寄存器,与1970年开始销售。而没过多久,AMD就完成了首款拥有自主知识产权的产品的Am2501逻辑计数器,并且取得了成功。

4、CPU的位和字长

  字长:电脑技术中对CPU在单位时间内(同一时间)能一次处理的二进制数的位数叫字长。所以能处理字长为8位数据的CPU通常就叫8位的CPU。同理32位的CPU就能在单位时间内处理字长为32位的二进制数据。字节和字长的区别:由于常用的英文字符用8位二进制就可以表示,所以通常就将8位称为一个字节。字长的长度是不固定的,对于不同的CPU、字长的长度也不一样。8位的CPU一次只能处理一个字节,而32位的CPU一次就能处理4个字节,同理字长为64位的CPU一次可以处理8个字节。     

Am2501逻辑计数器

位:在数字电路和电脑技术中采用二进制,代码只有“0”和“1”,其中无论是 “0”或是“1”在CPU中都是 一“位”。

  5.倍频系数 

在前几年AMD推出过内存条,不过那个是贴牌的。实际在历史上AMD真的推出过内存。在1971年AMD进入RAM市场,推出了64位双极性RAM Am3101。而这一年对AMD来说也是丰收年,在当年年底,AMD的销售额达到了460万美元。

字长:电脑技术中对CPU在单位时间内能一次处理的二进制数的位数叫字长。所以能处理字长为8位数据的CPU通常就叫8位的CPU。同理32位的CPU就能在单位时间内处理字长为32位的二进制数据。字节和字长的区别:由于常用的英文字符用8位二进制就可以表示,所以通常就将8位称为一个字节。字长的长度是不固定的,对于不同的CPU、字长的长度也不一样。8位的CPU一次只能处理一个字节,而32位的CPU一次就能处理4个字节,同理字长为64位的CPU一次可以处理8个字节。

  倍频系数是指CPU主频与外频之间的相对比例关系。在相同的外频下,倍频越高CPU的频率也越高。但实际上,在相同外频的前提下,高倍频的CPU本身意义并不大。这是因为CPU与系统之间数据传输速度是有限的,一味追求高倍频而得到高主频的CPU就会出现明显的“瓶颈”效应—CPU从系统中得到数据的极限速度不能够满足CPU运算的速度。一般除了工程样版的Intel的CPU都是锁了倍频的,而AMD之前都没有锁。    

创立3年多后,AMD就上市了。在此后,AMD就迎来了与Intel的第一次合作,作为Intel的大规模集成电路的第二来源,提供双100位动态移位寄存器。而AMD的产品线也快速扩展,到1975年,AMD已经有212种产品,其中有49种都是AMD专有的产品。那时的产品多数是为电信、银行、航天乃至军方提供的,所以对这些集成电路而言,稳定性是十分重要的。在1976年6月,AMD的产品凭借着过硬的质量及稳定性,成为当时十年内创立的同时获得军事及航天认证的集成电路公司。

5.倍频系数

  6.缓存 

在成立不到10年里,AMD就取得了这样的成绩,相对于“含着金钥匙”出生的Intel,也堪称优秀了。虽然此时AMD只有不到四分之一的产品是专有产品,而且有的产品是作为其他厂商的第二来源,但是在接下来的微处理器时代,虽然初期还是为其他厂商生产产品,但是AMD也逐渐开始寻找自己独特的产品路线。

倍频系数是指CPU主频与外频之间的相对比例关系。在相同的外频下,倍频越高CPU的频率也越高。但实际上,在相同外频的前提下,高倍频的CPU本身意义并不大。这是因为CPU与系统之间数据传输速度是有限的,一味追求高倍频而得到高主频的CPU就会出现明显的“瓶颈”效应—CPU从系统中得到数据的极限速度不能够满足CPU运算的速度。一般除了工程样版的Intel的CPU都是锁了倍频的,而AMD之前都没有锁。

  缓存大小也是CPU的重要指标之一,而且缓存的结构和大小对CPU速度的影响非常大,CPU内缓存的运行频率极高,一般是和处理器同频运作,工作效率远远大于系统内存和硬盘。实际工作时,CPU往往需要重复读取同样的数据块,而缓存容量的增大,可以大幅度提升CPU内部读取数据的命中率,而不用再到内存或者硬盘上寻找,以此提高系统性能。但是由于CPU芯片面积和成本的因素来考虑,缓存都很小。    

2.微处理器的自主研发及“第二来源”(1975年-1985年)

6.缓存

  L1 Cache(一级缓存)是CPU第一层高速缓存,分为数据缓存和指令缓存。内置的L1高速缓存的容量和结构对CPU的性能影响较大,不过高速缓冲存储器均由静态RAM组成,结构较复杂,在CPU管芯面积不能太大的情况下,L1级高速缓存的容量不可能做得太大。一般服务器CPU的L1缓存的容量通常在32—256KB。
澳门新萄京官方网站,  L2 Cache(二级缓存)是CPU的第二层高速缓存,分内部和外部两种芯片。内部的芯片二级缓存运行速度与主频相同,而外部的二级缓存则只有主频的一半。L2高速缓存容量也会影响CPU的性能,原则是越大越好,现在家庭用CPU容量最大的是512KB,而服务器和工作站上用CPU的L2高速缓存更高达256-1MB,有的高达2MB或者3MB。 
  L3 Cache(三级缓存),分为两种,早期的是外置,现在的都是内置的。而它的实际作用即是,L3缓存的应用可以进一步降低内存延迟,同时提升大数据量计算时处理器的性能。降低内存延迟和提升大数据量计算能力对游戏都很有帮助。而在服务器领域增加L3缓存在性能方面仍然有显著的提升。比方具有较大L3缓存的配置利用物理内存会更有效,故它比较慢的磁盘I/O子系统可以处理更多的数据请求。具有较大L3缓存的处理器提供更有效的文件系统缓存行为及较短消息和处理器队列长度。    

Intel在1971年推出了4004处理器。4年之后的1975年,AMD进入微处理器市场,推出了Am2900系列处理器。这一系列处理器也得到了广泛的应用。它采用模块化设计,这样需要更多的集成电路来实现单个处理器集成电路的工作。Am2901是一个4位ALU,也是整个模块化系统的核心。这个系列的处理器也有很多知名的厂商使用,如曾经着名的DEC、Xerox,雅达利甚至曾用这款处理器制造过街机。

缓存大小也是CPU的重要指标之一,而且缓存的结构和大小对CPU速度的影响非常大,CPU内缓存的运行频率极高,一般是和处理器同频运作,工作效率远远大于系统内存和硬盘。实际工作时,CPU往往需要重复读取同样的数据块,而缓存容量的增大,可以大幅度提升CPU内部读取数据的命中率,而不用再到内存或者硬盘上寻找,以此提高系统性能。但是由于CPU芯片面积和成本的因素来考虑,缓存都很小。

  其实最早的L3缓存被应用在AMD发布的K6-III处理器上,当时的L3缓存受限于制造工艺,并没有被集成进芯片内部,而是集成在主板上。在只能够和系统总线频率同步的L3缓存同主内存其实差不了多少。后来使用L3缓存的是英特尔为服务器市场所推出的Itanium处理器。接着就是P4EE和至强MP。Intel还打算推出一款9MB L3缓存的Itanium2处理器,和以后24MB L3缓存的双核心Itanium2处理器。   

不过对于此后对于AMD影响最大的还是在1975年成功逆向工程了Intel 8080处理器。在之后的1976年,Intel开始在其CPU内使用微码。不过在当年AMD与Intel签署了交叉授权协议,所以自1976年10月后,AMD可以在自家微处理器上使和外围设备上使用Intel的微代码。

L1 Cache是CPU第一层高速缓存,分为数据缓存和指令缓存。内置的L1高速缓存的容量和结构对CPU的性能影响较大,不过高速缓冲存储器均由静态RAM组成,结构较复杂,在CPU管芯面积不能太大的情况下,L1级高速缓存的容量不可能做得太大。一般服务器CPU的L1缓存的容量通常在32—256KB。

  但基本上L3缓存对处理器的性能提高显得不是很重要,比方配备1MB L3缓存的Xeon MP处理器却仍然不是Opteron的对手,由此可见前端总线的增加,要比缓存增加带来更有效的性能提升。    

之后AMD也算是过得比较顺利,在1977年,与德国西门子成立合资公司,不过好景不长,在1979年双方出现分歧,AMD收购了合资公司的剩余股份。随后专注于作为“第二来源”生产Intel的x86处理器。

L2 Cache是CPU的第二层高速缓存,分内部和外部两种芯片。内部的芯片二级缓存运行速度与主频相同,而外部的二级缓存则只有主频的一半。L2高速缓存容量也会影响CPU的性能,原则是越大越好,现在家庭用CPU容量最大的是512KB,而服务器和工作站上用CPU的L2高速缓存更高达256-1MB,有的高达2MB或者3MB。

  7.CPU扩展指令集 

不过也是从这时候,AMD与Intel两家纷纷扰扰的专利交叉协议纠纷就开始了。

L3 Cache,分为两种,早期的是外置,现在的都是内置的。而它的实际作用即是,L3缓存的应用可以进一步降低内存延迟,同时提升大数据量计算时处理器的性能。降低内存延迟和提升大数据量计算能力对游戏都很有帮助。而在服务器领域增加L3缓存在性能方面仍然有显著的提升。比方具有较大L3缓存的配置利用物理内存会更有效,故它比较慢的磁盘I/O子系统可以处理更多的数据请求。具有较大L3缓存的处理器提供更有效的文件系统缓存行为及较短消息和处理器队列长度。

  CPU依靠指令来计算和控制系统,每款CPU在设计时就规定了一系列与其硬件电路相配合的指令系统。指令的强弱也是CPU的重要指标,指令集是提高微处理器效率的最有效工具之一。从现阶段的主流体系结构讲,指令集可分为复杂指令集和精简指令集两部分,而从具体运用看,如Intel的MMX(Multi Media Extended)、SSE、 SSE2(Streaming-Single instruction multiple data-Extensions 2)、SEE3和AMD的3DNow!等都是CPU的扩展指令集,分别增强了CPU的多媒体、图形图象和Internet等的处理能力。我们通常会把CPU的扩展指令集称为"CPU的指令集"。SSE3指令集也是目前规模最小的指令集,此前MMX包含有57条命令,SSE包含有50条命令,SSE2包含有144条命令,SSE3包含有13条命令。目前SSE3也是最先进的指令集,英特尔Prescott处理器已经支持SSE3指令集,AMD会在未来双核心处理器当中加入对SSE3指令集的支持,全美达的处理器也将支持这一指令集。    

AMD与Intel首次签订交叉协议是1976年,从那时开始,AMD可以“名正言顺”地使用Intel当时处理器的微码了。不过那时与西门子的合作,为AMD注入了大量资金,所以在那时AMD也有自主研发的微处理器,不过之后两家的分道扬镳,AMD在1981年彻底关闭了其高级微电脑子公司。

其实最早的L3缓存被应用在AMD发布的K6-III处理器上,当时的L3缓存受限于制造工艺,并没有被集成进芯片内部,而是集成在主板上。在只能够和系统总线频率同步的L3缓存同主内存其实差不了多少。后来使用L3缓存的是英特尔为服务器市场所推出的Itanium处理器。接着就是P4EE和至强MP。Intel还打算推出一款9MB L3缓存的Itanium2处理器,和以后24MB L3缓存的双核心Itanium2处理器。

  8.CPU内核和I/O工作电压 

1978年Intel推出了首款16bit微处理器8086。1981年,蓝色巨人IBM开始制造自己的PC,希望使用x86处理器,但要求x86处理器的提供拥有“第二来源”,所以在1982年2月,Intel与AMD正式签署协议,此后每家公司都有权成为另一家公司开发半导体产品的第二来源供应商。

但基本上L3缓存对处理器的性能提高显得不是很重要,比方配备1MB L3缓存的Xeon MP处理器却仍然不是Opteron的对手,由此可见前端总线的增加,要比缓存增加带来更有效的性能提升。

  从586CPU开始,CPU的工作电压分为内核电压和I/O电压两种,通常CPU的核心电压小于等于I/O电压。其中内核电压的大小是根据CPU的生产工艺而定,一般制作工艺越小,内核工作电压越低;I/O电压一般都在1.6~5V。低电压能解决耗电过大和发热过高的问题。     

澳门新萄京官方网站 9

7.CPU扩展指令集

  9.制造工艺 

Intel的8086处理器

CPU依靠指令来计算和控制系统,每款CPU在设计时就规定了一系列与其硬件电路相配合的指令系统。指令的强弱也是CPU的重要指标,指令集是提高微处理器效率的最有效工具之一。从现阶段的主流体系结构讲,指令集可分为复杂指令集和精简指令集两部分,而从具体运用看,如Intel的MMX(Multi Media Extended)、SSE、 SSE2(Streaming-Single instruction multiple data-Extensions 2)、SEE3和AMD的3DNow!等都是CPU的扩展指令集,分别增强了CPU的多媒体、图形图象和Internet等的处理能力。我们通常会把CPU的扩展指令集称为"CPU的指令集"。SSE3指令集也是目前规模最小的指令集,此前MMX包含有57条命令,SSE包含有50条命令,SSE2包含有144条命令,SSE3包含有13条命令。目前SSE3也是最先进的指令集,英特尔Prescott处理器已经支持SSE3指令集,AMD会在未来双核心处理器当中加入对SSE3指令集的支持,全美达的处理器也将支持这一指令集。

  制造工艺的微米是指IC内电路与电路之间的距离。制造工艺的趋势是向密集度愈高的方向发展。密度愈高的IC电路设计,意味着在同样大小面积的IC中,可以拥有密度更高、功能更复杂的电路设计。现在主要的180nm、130nm、90nm。最近官方已经表示有65nm的制造工艺了。

同时,Intel与AMD也延长了在1976年的交叉许可协议。至此,AMD已经与Intel签署了两个协议,都是技术相关,在为Intel生产微处理器的同时,AMD也积攒了大量的制造经验。

8.CPU内核和I/O工作电压

10.指令集    

澳门新萄京官方网站 10

从586CPU开始,CPU的工作电压分为内核电压和I/O电压两种,通常CPU的核心电压小于等于I/O电压。其中内核电压的大小是根据CPU的生产工艺而定,一般制作工艺越小,内核工作电压越低;I/O电压一般都在1.6~5V。低电压能解决耗电过大和发热过高的问题。

  (1)CISC指令集 

AMD生产的8086处理器

9.制造工艺

  CISC指令集,也称为复杂指令集,英文名是CISC,(Complex Instruction Set Computer的缩写)。在CISC微处理器中,程序的各条指令是按顺序串行执行的,每条指令中的各个操作也是按顺序串行执行的。顺序执行的优点是控制简单,但计算机各部分的利用率不高,执行速度慢。其实它是英特尔生产的x86系列(也就是IA-32架构)CPU及其兼容CPU,如AMD、VIA的。即使是现在新起的X86-64(也被成AMD64)都是属于CISC的范畴。  

1982年,AMD开始生产8086、80186等产品。到了1984年,面对当时迅速增长的IBM PC及兼容机市场,再次逆向“克隆”出了80286芯片,并命名为Am286。虽然作为“第二来源”,但是AMD没有放弃研发,1984年还生产出了世界上第一个512K的EPROM(可擦除可编程只读存储器)和业内首款单芯片猝发错误处理器,推动了小型磁盘驱动器的进步和PC市场的发展。在1985年还被评为了“财富500强”企业。

制造工艺的微米是指IC内电路与电路之间的距离。制造工艺的趋势是向密集度愈高的方向发展。密度愈高的IC电路设计,意味着在同样大小面积的IC中,可以拥有密度更高、功能更复杂的电路设计。现在主要的180nm、130nm、90nm。最近官方已经表示有65nm的制造工艺了。

  要知道什么是指令集还要从当今的X86架构的CPU说起。X86指令集是Intel为其第一块16位CPU(i8086)专门开发的,IBM1981年推出的世界第一台PC机中的CPU—i8088(i8086简化版)使用的也是X86指令,同时电脑中为提高浮点数据处理能力而增加了X87芯片,以后就将X86指令集和X87指令集统称为X86指令集。 

不过1985年,半导体界发生了很大的变化,日本通过倾销本国公司生产的DRAM,迅速占领市场,这对于拥有DRAM生产线的AMD及Intel来说,都有很大的打击,所以在此之后AMD及Intel都退出了DRAM市场。20世纪80年代PC的发展,除了继续生产x86处理器外,AMD还自研处理器及CMOS工艺,1986年推出了首款单芯片压缩/扩展处理器,推进了办公自动化,之后100万位EPROM。1987年推出了业内首款与当时各种电脑显示器显卡接口以及软件全兼容的显卡。而1986年生产的Am29000是AMD研发能力的体现。Am29000处理器是一款32位处理器,采用了RISC架构,而这款处理器也影响了之后AMD处理器的设计。

10.指令集

  虽然随着CPU技术的不断发展,Intel陆续研制出更新型的i80386、i80486直到过去的PII至强、PIII至强、Pentium 3,最后到今天的Pentium 4系列、至强(不包括至强Nocona),但为了保证电脑能继续运行以往开发的各类应用程序以保护和继承丰富的软件资源,所以Intel公司所生产的所有CPU仍然继续使用X86指令集,所以它的CPU仍属于X86系列。由于Intel X86系列及其兼容CPU(如AMD Athlon MP、)都使用X86指令集,所以就形成了今天庞大的X86系列及兼容CPU阵容。x86CPU目前主要有intel的服务器CPU和AMD的服务器CPU两类。 

3.自研x86处理器,竞争展开(1984年-1996年)

CISC指令集

   

在20世纪80年代后期,虽然AMD因为各种原因加强自主研发,不过在x86处理器市场上还是主要作为“第二来源”。当跨入90年代后,AMD改变颇大。在1991年3月25日,AMD首次展示Am386处理器,加入32位80386兼容CPU市场。自此AMD不再作为“第二来源”,AMD开始与Intel展开x86处理器竞争。

CISC指令集,也称为复杂指令集,英文名是CISC,(Complex Instruction Set Computer的缩写)。在CISC微处理器中,程序的各条指令是按顺序串行执行的,每条指令中的各个操作也是按顺序串行执行的。顺序执行的优点是控制简单,但计算机各部分的利用率不高,执行速度慢。其实它是英特尔生产的x86系列(也就是IA-32架构)CPU及其兼容CPU,如AMD、VIA的。即使是现在新起的X86-64都是属于CISC的范畴。

  (2)RISC指令集 

在1984年,Intel为了巩固市场优势,内部决定不再与AMD提供产品信息,并最终拒绝向AMD提供80386处理器的技术细节。所以在1987年,AMD向法院提出仲裁,但此时Intel取消了1982年延长的技术交换协议。而这场纠纷前前后后闹了多年,最终在1994年完结,AMD获得支持。

要知道什么是指令集还要从当今的X86架构的CPU说起。X86指令集是Intel为其第一块16位CPU专门开发的,IBM1981年推出的世界第一台PC机中的CPU—i8088使用的也是X86指令,同时电脑中为提高浮点数据处理能力而增加了X87芯片,以后就将X86指令集和X87指令集统称为X86指令集。

  RISC是英文“Reduced Instruction Set Computing ” 的缩写,中文意思是“精简指令集”。它是在CISC指令系统基础上发展起来的,有人对CISC机进行测试表明,各种指令的使用频度相当悬殊,最常使用的是一些比较简单的指令,它们仅占指令总数的20%,但在程序中出现的频度却占80%。复杂的指令系统必然增加微处理器的复杂性,使处理器的研制时间长,成本高。并且复杂指令需要复杂的操作,必然会降低计算机的速度。基于上述原因,20世纪80年代RISC型CPU诞生了,相对于CISC型CPU ,RISC型CPU不仅精简了指令系统,还采用了一种叫做“超标量和超流水线结构”,大大增加了并行处理能力。RISC指令集是高性能CPU的发展方向。它与传统的CISC(复杂指令集)相对。相比而言,RISC的指令格式统一,种类比较少,寻址方式也比复杂指令集少。当然处理速度就提高很多了。目前在中高档服务器中普遍采用这一指令系统的CPU,特别是高档服务器全都采用RISC指令系统的CPU。RISC指令系统更加适合高档服务器的操作系统UNIX,现在Linux也属于类似UNIX的操作系统。RISC型CPU与Intel和AMD的CPU在软件和硬件上都不兼容。 www.jz5u.com

而这场纠纷中,Intel还对AMD予以还击。1990年,Intel与AMD进行谈判有关AMD使用Intel处理器的权利。所以在不确定知识产权的情况下,AMD重新开发了Intel已发布的x386及x486处理器。这也就是前面提到的Am386处理器。在1993年,AMD紧接着发布了Am486处理器,在相同的价格情况下提供了更高的性能,而且受到了如当时Compaq(康柏,TIm Cook曾经任职过的公司)等公司的青睐。

虽然随着CPU技术的不断发展,Intel陆续研制出更新型的i80386、i80486直到过去的PII至强、PIII至强、Pentium 3,最后到今天的Pentium 4系列、至强(不包括至强Nocona),但为了保证电脑能继续运行以往开发的各类应用程序以保护和继承丰富的软件资源,所以Intel公司所生产的所有CPU仍然继续使用X86指令集,所以它的CPU仍属于X86系列。由于Intel X86系列及其兼容CPU(如AMD Athlon MP、)都使用X86指令集,所以就形成了今天庞大的X86系列及兼容CPU阵容。x86CPU目前主要有intel的服务器CPU和AMD的服务器CPU两类。

   

澳门新萄京官方网站 11

RISC指令集

  目前,在中高档服务器中采用RISC指令的CPU主要有以下几类:PowerPC处理器、SPARC处理器、PA-RISC处理器、MIPS处理器、Alpha处理器。 

AMD Am386

RISC是英文“Reduced Instruction Set Computing ” 的缩写,中文意思是“精简指令集”。它是在CISC指令系统基础上发展起来的,有人对CISC机进行测试表明,各种指令的使用频度相当悬殊,最常使用的是一些比较简单的指令,它们仅占指令总数的20%,但在程序中出现的频度却占80%。复杂的指令系统必然增加微处理器的复杂性,使处理器的研制时间长,成本高。并且复杂指令需要复杂的操作,必然会降低计算机的速度。基于上述原因,20世纪80年代RISC型CPU诞生了,相对于CISC型CPU ,RISC型CPU不仅精简了指令系统,还采用了一种叫做“超标量和超流水线结构”,大大增加了并行处理能力。RISC指令集是高性能CPU的发展方向。它与传统的CISC相对。相比而言,RISC的指令格式统一,种类比较少,寻址方式也比复杂指令集少。当然处理速度就提高很多了。目前在中高档服务器中普遍采用这一指令系统的CPU,特别是高档服务器全都采用RISC指令系统的CPU。RISC指令系统更加适合高档服务器的操作系统UNIX,现在Linux也属于类似UNIX的操作系统。RISC型CPU与Intel和AMD的CPU在软件和硬件上都不兼容。

   

AMD Am486

目前,在中高档服务器中采用RISC指令的CPU主要有以下几类:PowerPC处理器、SPARC处理器、PA-RISC处理器、MIPS处理器、Alpha处理器。

  (3)IA-64    

最终双方相互诉讼持续了很多年,到1996年算是完结。在协议中AMD获得了多年前的英特尔x386及x486微码的使用权,但是没有获得下一代处理器微码的使用权。至此双方有关微码知识产权交换的诉讼也完结了。不过到此互为对手的AMD及Intel也走上了自主研发微架构的道路。

IA-64

  EPIC(Explicitly Parallel Instruction Computers,精确并行指令计算机)是否是RISC和CISC体系的继承者的争论已经有很多,单以EPIC体系来说,它更像Intel的处理器迈向RISC体系的重要步骤。从理论上说,EPIC体系设计的CPU,在相同的主机配置下,处理Windows的应用软件比基于Unix下的应用软件要好得多。    

4.自主研发之路上的竞争(1996年-2003年)

EPIC(Explicitly Parallel Instruction Computers,精确并行指令计算机)是否是RISC和CISC体系的继承者的争论已经有很多,单以EPIC体系来说,它更像Intel的处理器迈向RISC体系的重要步骤。从理论上说,EPIC体系设计的CPU,在相同的主机配置下,处理Windows的应用软件比基于Unix下的应用软件要好得多。

  Intel采用EPIC技术的服务器CPU是安腾Itanium(开发代号即Merced)。它是64位处理器,也是IA-64系列中的第一款。微软也已开发了代号为Win64的操作系统,在软件上加以支持。在Intel采用了X86指令集之后,它又转而寻求更先进的64-bit微处理器,Intel这样做的原因是,它们想摆脱容量巨大的x86架构,从而引入精力充沛而又功能强大的指令集,于是采用EPIC指令集的IA-64架构便诞生了。IA-64 在很多方面来说,都比x86有了长足的进步。突破了传统IA32架构的许多限制,在数据的处理能力,系统的稳定性、安全性、可用性、可观理性等方面获得了突破性的提高。    

Intel在1993年退出了首款奔腾处理器,作为486处理器的继任,奔腾采用了全新的P5微架构,也是第一代超标量IA-32为体系结构。虽然此时AMD生产的Am386及后续Am486处理器也受到广泛的欢迎,但是性能上还是落后不少。

Intel采用EPIC技术的服务器CPU是安腾Itanium(开发代号即Merced)。它是64位处理器,也是IA-64系列中的第一款。微软也已开发了代号为Win64的操作系统,在软件上加以支持。在Intel采用了X86指令集之后,它又转而寻求更先进的64-bit微处理器,Intel这样做的原因是,窍氚谕讶萘烤薮蟮膞86架构,从而引入精力充沛而又功能强大的指令集,于是采用EPIC指令集的IA-64架构便诞生了。IA-64 在很多方面来说,都比x86有了长足的进步。突破了传统IA32架构的许多限制,在数据的处理能力,系统的稳定性、安全性、可用性、可观理性等方面获得了突破性的提高。

  IA-64微处理器最大的缺陷是它们缺乏与x86的兼容,而Intel为了IA-64处理器能够更好地运行两个朝代的软件,它在IA-64处理器上(Itanium、Itanium2 ……)引入了x86-to-IA-64的解码器,这样就能够把x86指令翻译为IA-64指令。这个解码器并不是最有效率的解码器,也不是运行x86代码的最好途径(最好的途径是直接在x86处理器上运行x86代码),因此Itanium 和Itanium2在运行x86应用程序时候的性能非常糟糕。这也成为X86-64产生的根本原因。    

三年之后的1996年,AMD推出了K5处理器。虽然因为研发困难导致延期不少,但是这款处理器还是带来了很多创新。

IA-64微处理器最大的缺陷是它们缺乏与x86的兼容,而Intel为了IA-64处理器能够更好地运行两个朝代的软件,它在IA-64处理器上(Itanium、Itanium2 ……)引入了x86-to-IA-64的解码器,这样就能够把x86指令翻译为IA-64指令。这个解码器并不是最有效率的解码器,也不是运行x86代码的最好途径(最好的途径是直接在x86处理器上运行x86代码),因此Itanium 和Itanium2在运行x86应用程序时候的性能非常糟糕。这也成为X86-64产生的根本原因。

  (4)X86-64 (AMD64 / EM64T) 

AMD K5处理器Die照片

X86-64 (AMD64 / EM64T)

  AMD公司设计,可以在同一时间内处理64位的整数运算,并兼容于X86-32架构。其中支持64位逻辑定址,同时提供转换为32位定址选项;但数据操作指令默认为32位和8位,提供转换成64位和16位的选项;支持常规用途寄存器,如果是32位运算操作,就要将结果扩展成完整的64位。这样,指令中有“直接执行”和“转换执行”的区别,其指令字段是8位或32位,可以避免字段过长。    

之前提到过AMD在1986年推出了Am29000处理器,使用了RISC架构。而此次K5处理器是采用高度并行的Am29000处理器的RISC架构,并且拥有x86解码前端。所以K5处理器也提供了良好的x86兼容性。所有型号的处理器都有430万个晶体管,5个可以乱序执行(Out of order)的整数运算单元及1个浮点运算单元。分支目标缓存比Intel的奔腾处理器大4倍。在缓存方面,它有一个16KB的四路组相连指令缓存及8KB的数据缓存。同时浮点除法及平方根经过机械验证,运算结果忠于真实数学结果。这些指标相比Intel的奔腾处理器更加先进、运算更加精确,但是由于时钟频率低,所以在实际性能上要低于Intel奔腾处理器,这也导致了K5处理器并没有如前作Am486处理器一样广受好评。

AMD公司设计,可以在同一时间内处理64位的整数运算,并兼容于X86-32架构。其中支持64位逻辑定址,同时提供转换为32位定址选项;但数据操作指令默认为32位和8位,提供转换成64位和16位的选项;支持常规用途寄存器,如果是32位运算操作,就要将结果扩展成完整的64位。这样,指令中有“直接执行”和“转换执行”的区别,其指令字段是8位或32位,可以避免字段过长。

  x86-64(也叫AMD64)的产生也并非空穴来风,x86处理器的32bit寻址空间限制在4GB内存,而IA-64的处理器又不能兼容x86。AMD充分考虑顾客的需求,加强x86指令集的功能,使这套指令集可同时支持64位的运算模式,因此AMD把它们的结构称之为x86-64。在技术上AMD在x86-64架构中为了进行64位运算,AMD为其引入了新增了R8-R15通用寄存器作为原有X86处理器寄存器的扩充,但在而在32位环境下并不完全使用到这些寄存器。原来的寄存器诸如EAX、EBX也由32位扩张至64位。在SSE单元中新加入了8个新寄存器以提供对SSE2的支持。寄存器数量的增加将带来性能的提升。与此同时,为了同时支持32和64位代码及寄存器,x86-64架构允许处理器工作在以下两种模式:Long Mode(长模式)和Legacy Mode(遗传模式),Long模式又分为两种子模式(64bit模式和Compatibility mode兼容模式)。该标准已经被引进在AMD服务器处理器中的Opteron处理器。    

虽然AMD在后期通过提升频率来提高K5处理器性能,但随后AMD在1997年2月就推出了K6处理器。相比K5处理器,AMD的K6处理器做出了更大的更新。通常处理器设计会远早于发布时间,1996年AMD收购了当时另一家x86处理器生产商NextGen,NextGen的研发团队也就加入了K6处理器的研发团队。所以虽然新处理器命名为K6,但是产品与前代K5非常不同。AMD吸收了NextGen的技术,在K6系列处理器中包括了反馈动态指令重排序极致、MMX指令集以及一个浮点运算单元。在引脚方面,K6处理器与Intel的奔腾处理器相同,可以用在采用Socket 7插槽的主板上。

x86-64的产生也并非空穴来风,x86处理器的32bit寻址空间限制在4GB内存,而IA-64的处理器又不能兼容x86。AMD充分考虑顾客的需求,加强x86指令集的功能,使这套指令集可同时支持64位的运算模式,因此AMD把它们的结构称之为x86-64。在技术上AMD在x86-64架构中为了进行64位运算,AMD为其引入了新增了R8-R15通用寄存器作为原有X86处理器寄存器的扩充,但在而在32位环境下并不完全使用到这些寄存器。原来的寄存器诸如EAX、EBX也由32位扩张至64位。在SSE单元中新加入了8个新寄存器以提供对SSE2的支持。寄存器数量的增加将带来性能的提升。与此同时,为了同时支持32和64位代码及寄存器,x86-64架构允许处理器工作在以下两种模式:Long Mode和Legacy Mode,Long模式又分为两种子模式(64bit模式和Compatibility mode兼容模式)。该标准已经被引进在AMD服务器处理器中的Opteron处理器。

  而今年也推出了支持64位的EM64T技术,再还没被正式命为EM64T之前是IA32E,这是英特尔64位扩展技术的名字,用来区别X86指令集。Intel的EM64T支持64位sub-mode,和AMD的X86-64技术类似,采用64位的线性平面寻址,加入8个新的通用寄存器(GPRs),还增加8个寄存器支持SSE指令。与AMD相类似,Intel的64位技术将兼容IA32和IA32E,只有在运行64位操作系统下的时候,才将会采用IA32E。IA32E将由2个sub-mode组成:64位sub-mode和32位sub-mode,同AMD64一样是向下兼容的。Intel的EM64T将完全兼容AMD的X86-64技术。现在Nocona处理器已经加入了一些64位技术,Intel的Pentium 4E处理器也支持64位技术。    

澳门新萄京官方网站 12

而今年也推出了支持64位的EM64T技术,再还没被正式命为EM64T之前是IA32E,这是英特尔64位扩展技术的名字,用来区别X86指令集。Intel的EM64T支持64位sub-mode,和AMD的X86-64技术类似,采用64位的线性平面寻址,加入8个新的通用寄存器,还增加8个寄存器支持SSE指令。与AMD相类似,Intel的64位技术将兼容IA32和IA32E,只有在运行64位操作系统下的时候,才将会采用IA32E。IA32E将由2个sub-mode组成:64位sub-mode和32位sub-mode,同AMD64一样是向下兼容的。Intel的EM64T将完全兼容AMD的X86-64技术。现在Nocona处理器已经加入了一些64位技术,Intel的Pentium 4E处理器也支持64位技术。

  应该说,这两者都是兼容x86指令集的64位微处理器架构,但EM64T与AMD64还是有一些不一样的地方,AMD64处理器中的NX位在Intel的处理器中将没有提供。     

Bulldzoer新品策略,这18条背下来没人敢和你忽悠CPU。AMD K6处理器

应该说,这两者都是兼容x86指令集的64位微处理器架构,但EM64T与AMD64还是有一些不一样的地方,AMD64处理器中的NX位在Intel的处理器中将没有提供。

  11.超流水线与超标量 

K6处理器初期频率为166MHz和200MHz,不过后期有推出了233MHz甚至是300MHz频率的版本,300MHz频率的版本于1998年中发布,此后AMD就推出了更新版的K6-2处理器。

11.超流水线与超标量

  在解释超流水线与超标量前,先了解流水线(pipeline)。流水线是Intel首次在486芯片中开始使用的。流水线的工作方式就象工业生产上的装配流水线。在CPU中由5—6个不同功能的电路单元组成一条指令处理流水线,然后将一条X86指令分成5—6步后再由这些电路单元分别执行,这样就能实现在一个CPU时钟周期完成一条指令,因此提高CPU的运算速度。经典奔腾每条整数流水线都分为四级流水,即指令预取、译码、执行、写回结果,浮点流水又分为八级流水。 

K6-2处理器是基于K6处理器的改进版,频率更高,采用了0.25微米的工艺,将接口升级为Super Scoket 7,不过与之前的Socket 7兼容。K6-2处理器还拥有更大的32KB指令及32KB数据共64KB的一级缓存。不过最大的改进就是增加了3DNow! SIMD指令集,显着提升了性能。所以导致K6-2处理器的晶体管数量大幅增加到了930万。

在解释超流水线与超标量前,先了解流水线。流水线是Intel首次在486芯片中开始使用的。流水线的工作方式就象工业生产上的装配流水线。在CPU中由5—6个不同功能的电路单元组成一条指令处理流水线,然后将一条X86指令分成5—6步后再由这些电路单元分别执行,这样就能实现在一个CPU时钟周期完成一条指令,因此提高CPU的运算速度。经典奔腾每条整数流水线都分为四级流水,即指令预取、译码、执行、写回结果,浮点流水又分为八级流水。

  超标量是通过内置多条流水线来同时执行多个处理器,其实质是以空间换取时间。而超流水线是通过细化流水、提高主频,使得在一个机器周期内完成一个甚至多个操作,其实质是以时间换取空间。例如Pentium 4的流水线就长达20级。将流水线设计的步(级)越长,其完成一条指令的速度越快,因此才能适应工作主频更高的CPU。但是流水线过长也带来了一定副作用,很可能会出现主频较高的CPU实际运算速度较低的现象,Intel的奔腾4就出现了这种情况,虽然它的主频可以高达1.4G以上,但其运算性能却远远比不上AMD 1.2G的速龙甚至奔腾III。    

那个时候处理器设计相对于现在没那么复杂,所以处理器更新是很快的,在1999年8月,AMD就拿出了K7处理器,而且这次为K7处理器推出了一个品牌,就是到现在还在使用的Athlon。K7架构设计团队由后来成为AMD CEO的Dirk Mayer领导。那时候AMD虽然与Intel在处理器市场直接竞争,不过AMD还是使用与Intel相同的处理器插座。不过这次AMD在处理器插座上出现了授权问题,所以AMD这次不能再使用Intel奔腾Pro、奔腾III处理器使用的SLOT-1插槽,最终使用了一个名为SLOT A的插槽。这个插槽基于EV6总线,是当初DEC为Alpha处理器开发的,速度相比此前K5、K6时代的Scoket 7插座带宽更高。

超标量是通过内置多条流水线来同时执行多个处理器,其实质是以空间换取时间。而超流水线是通过细化流水、提高主频,使得在一个机器周期内完成一个甚至多个操作,其实质是以时间换取空间。例如Pentium 4的流水线就长达20级。将流水线设计的步越长,其完成一条指令的速度越快,因此才能适应工作主频更高的CPU。但是流水线过长也带来了一定副作用,很可能会出现主频较高的CPU实际运算速度较低的现象,Intel的奔腾4就出现了这种情况,虽然它的主频可以高达1.4G以上,但其运算性能却远远比不上AMD 1.2G的速龙甚至奔腾III。

Bulldzoer新品策略,这18条背下来没人敢和你忽悠CPU。  12.封装形式 

与K7处理器相伴的还有一个计算机界大事件,就是突破GHz。通过与摩托罗拉的合作,AMD提前一年搞定铜互连工艺,进行改进后可以使用180nm工艺进行制造。根据摩尔定律,芯片的线宽的越小,功耗会减少,这样就让处理器有能力冲击更高的频率。所以在2000年3月,AMD宣布推出频率为1GHz的Athlon 1000处理器,相比与竞争对手Intel要更早一些,赢得了GHz之争。

12.封装形式

  CPU封装是采用特定的材料将CPU芯片或CPU模块固化在其中以防损坏的保护措施,一般必须在封装后CPU才能交付用户使用。CPU的封装方式取决于CPU安装形式和器件集成设计,从大的分类来看通常采用Socket插座进行安装的CPU使用PGA(栅格阵列)方式封装,而采用Slot x槽安装的CPU则全部采用SEC(单边接插盒)的形式封装。现在还有PLGA(Plastic Land Grid Array)、OLGA(Organic Land Grid Array)等封装技术。由于市场竞争日益激烈,目前CPU封装技术的发展方向以节约成本为主。   

紧接着在2000年6月,AMD就发布了第二代“雷鸟”Athlon处理器,不同于初代采用SLOT A插槽的形式,这一代Athlon处理器也首次采用了PGA插槽形式,而这种形式的CPU插槽也成为了AMD一直延续至今插槽形式,不过AMD依旧提供了SLOT A插槽形式的CPU。相对与第一代Athlon Classic架构,”雷鸟“架构新设计了缓存架构,这样进一步提升了处理器性能。而“雷鸟”Athlon也成为那时AMD最成功的产品。

CPU封装是采用特定的材料将CPU芯片或CPU模块固化在其中以防损坏的保护措施,一般必须在封装后CPU才能交付用户使用。CPU的封装方式取决于CPU安装形式和器件集成设计,从大的分类来看通常采用Socket插座进行安装的CPU使用PGA方式封装,而采用Slot x槽安装的CPU则全部采用SEC的形式封装。现在还有PLGA(Plastic Land Grid Array)、OLGA(Organic Land Grid Array)等封装技术。由于市场竞争日益激烈,目前CPU封装技术的发展方向以节约成本为主。

  13、多线程    

随后AMD也坚持每年一次更新的节奏,在2001年推出了代号为“Palomino”的第三代Athlon处理器,这一代处理器AMD也将其命名为了“Athlon XP”,而同年,微软发布了可以说是最经典的桌面操作系统Windows XP。这一代处理器AMD也做出了很多更新。首先是第一次在自家处理器中继承了Intel奔腾III完整的SSE指令集,而这个指令集正是Intel为了应对AMD此前早于其推出的3DNow!指令集。更厉害的是,AMD还推出了那时候的“桌面级双路”技术,而支持“双处理器”的Athlon被称为Athlon MP。不过这时第三代“Palomino”Athlon处理器还是180nm工艺制造,所以更高的频率导致这款处理器温度更高。

13、多线程

  同时多线程Simultaneous multithreading,简称SMT。SMT可通过复制处理器上的结构状态,让同一个处理器上的多个线程同步执行并共享处理器的执行资源,可最大限度地实现宽发射、乱序的超标量处理,提高处理器运算部件的利用率,缓和由于数据相关或Cache未命中带来的访问内存延时。当没有多个线程可用时,SMT处理器几乎和传统的宽发射超标量处理器一样。SMT最具吸引力的是只需小规模改变处理器核心的设计,几乎不用增加额外的成本就可以显著地提升效能。多线程技术则可以为高速的运算核心准备更多的待处理数据,减少运算核心的闲置时间。这对于桌面低端系统来说无疑十分具有吸引力。Intel从3.06GHz Pentium 4开始,所有处理器都将支持SMT技术。    

刚进入新千年,笔记本电脑市场也因技术水平等因素逐渐进入大家的视野中,所以AMD在2001年也推出了Palomino核心的针对移动平台的处理器Mobile Athlon 4。

同时多线程Simultaneous multithreading,简称SMT。SMT可通过复制处理器上的结构状态,让同一个处理器上的多个线程同步执行并共享处理器的执行资源,可最大限度地实现宽发射、乱序的超标量处理,提高处理器运算部件的利用率,缓和由于数据相关或Cache未命中带来的访问内存延时。当没有多个线程可用时,SMT处理器几乎和传统的宽发射超标量处理器一样。SMT最具吸引力的是只需小规模改变处理器核心的设计,几乎不用增加额外的成本就可以显著地提升效能。多线程技术则可以为高速的运算核心准备更多的待处理数据,减少运算核心的闲置时间。这对于桌面低端系统来说无疑十分具有吸引力。Intel从3.06GHz Pentium 4开始,所有处理器都将支持SMT技术。

  14、多核心    

之后的2002年AMD有推出了第四代Thoroughbred核心的Athlon处理器,此时AMD也首次使用了130nm工艺制程,相比于之前180nm工艺的处理器,核心面积明显减小。此时更好的制程工艺也让此时的Athlon处理器拥有了更高的频率,同时也拥有了更好的超频性能。

14、多核心

  多核心,也指单芯片多处理器(Chip multiprocessors,简称CMP)。CMP是由美国斯坦福大学提出的,其思想是将大规模并行处理器中的SMP(对称多处理器)集成到同一芯片内,各个处理器并行执行不同的进程。与CMP比较, SMT处理器结构的灵活性比较突出。但是,当半导体工艺进入0.18微米以后,线延时已经超过了门延迟,要求微处理器的设计通过划分许多规模更小、局部性更好的基本单元结构来进行。相比之下,由于CMP结构已经被划分成多个处理器核来设计,每个核都比较简单,有利于优化设计,因此更有发展前途。目前,IBM 的Power 4芯片和Sun的 MAJC5200芯片都采用了CMP结构。多核处理器可以在处理器内部共享缓存,提高缓存利用率,同时简化多处理器系统设计的复杂度。 

而随后第五代也是最后一代Athlon处理器在2003年面世了。AMD继续通过增加L2缓存及提升前端总线速率提升处理器性能,不过此时AMD面临的不再是“Coppermine”的奔腾III或是“Willamette”的奔腾4,而是更新的“Northwood”奔腾4处理器,虽然“巴顿”Athlon凭借着超强的超频性能在DIY圈备受赞誉,但是架构上的劣势也让AMD准备新处理器应对这样的状况。

多核心,也指单芯片多处理器(Chip multiprocessors,简称CMP)。CMP是由美国斯坦福大学提出的,其思想是将大规模并行处理器中的SMP集成到同一芯片内,各个处理器并行执行不同的进程。与CMP比较, SMT处理器结构的灵活性比较突出。但是,当半导体工艺进入0.18微米以后,线延时已经超过了门延迟,要求微处理器的设计通过划分许多规模更小、局部性更好的基本单元结构来进行。相比之下,由于CMP结构已经被划分成多个处理器核来设计,每个核都比较简单,有利于优化设计,因此更有发展前途。目前,IBM 的Power 4芯片和Sun的 MAJC5200芯片都采用了CMP结构。多核处理器可以在处理器内部共享缓存,提高缓存利用率,同时简化多处理器系统设计的复杂度。

  2005年下半年,Intel和AMD的新型处理器也将融入CMP结构。新安腾处理器开发代码为Montecito,采用双核心设计,拥有最少18MB片内缓存,采取90nm工艺制造,它的设计绝对称得上是对当今芯片业的挑战。它的每个单独的核心都拥有独立的L1,L2和L3 cache,包含大约10亿支晶体管。 

早期电脑还是很贵的东西,而AMD也通过削减核心缓存等方法,推出了价格更低的处理器。所以在AMD在K7 Althon处理器推出后,还推出了一个定位低一些的品牌,称为Duron,这个系列的处理器。Duron处理器的核心来源于Althon处理器的“Thunderbird”雷鸟核心,与“雷鸟”核心最大的区别就是二级缓存的减少,从Althon的256K减少到64KB,而这个也使得Duron的L2缓存大小还不如与之竞争的Intel赛扬处理器的L2缓存大小。不过由于Duron处理器核心还是继承了Althon“雷鸟”核心的优秀缓存设计,所以实际上Duron处理器运行速度上并没有慢多少。此后Duron处理器随着Athlon也推出了三代,直至2003年。在2001年时也针对笔记本市场推出了Mobile Duron处理器。而Duron处理器为人所津津乐道的也是其超强的超频性能,当时“毒龙铅笔法”破解倍频成为很多DIY爱好者的谈资。

2005年下半年,Intel和AMD的新型处理器也将融入CMP结构。新安腾处理器开发代码为Montecito,采用双核心设计,拥有最少18MB片内缓存,采取90nm工艺制造,它的设计绝对称得上是对当今芯片业的挑战。它的每个单独的核心都拥有独立的L1,L2和L3 cache,包含大约10亿支晶体管。

   15、SMP   

不过此后Duron系列就被另一个系列取代了,就是Semporn。

15、SMP

  SMP(Symmetric Multi-Processing),对称多处理结构的简称,是指在一个计算机上汇集了一组处理器(多CPU),各CPU之间共享内存子系统以及总线结构。在这种技术的支持下,一个服务器系统可以同时运行多个处理器,并共享内存和其他的主机资源。像双至强,也就是我们所说的二路,这是在对称处理器系统中最常见的一种(至强MP可以支持到四路,AMD Opteron可以支持1-8路)。也有少数是16路的。但是一般来讲,SMP结构的机器可扩展性较差,很难做到100个以上多处理器,常规的一般是8个到16个,不过这对于多数的用户来说已经够用了。在高性能服务器和工作站级主板架构中最为常见,像UNIX服务器可支持最多256个CPU的系统。 

在这完全自研处理器的时间里,AMD与Intel多次过招,互有胜负,从这也能看出AMD确实实力不俗。不过在2002年到2003年,AMD发生了几件事,其中一件就是当时的Athlon处理器性能开始落后于Intel;还有一件是与IBM合作研发SOI技术;而最后一件就是AMD创始人杰里·桑德斯宣布不再担任自己亲手创办公司的CEO。

SMP(Symmetric Multi-Processing),对称多处理结构的简称,是指在一个计算机上汇集了一组处理器,各CPU之间共享内存子系统以及总线结构。在这种技术的支持下,一个服务器系统可以同时运行多个处理器,并共享内存和其他的主机资源。像双至强,也就是我们所说的二路,这是在对称处理器系统中最常见的一种(至强MP可以支持到四路,AMD Opteron可以支持1-8路)。也有少数是16路的。但是一般来讲,SMP结构的机器可扩展性较差,很难做到100个以上多处理器,常规的一般是8个到16个,不过这对于多数的用户来说已经够用了。在高性能服务器和工作站级主板架构中最为常见,像UNIX服务器可支持最多256个CPU的系统。

  构建一套SMP系统的必要条件是:支持SMP的硬件包括主板和CPU;支持SMP的系统平台,再就是支持SMP的应用软件。 

5.创始人离开,64位及“真假双核”(2002年-2006年)

构建一套SMP系统的必要条件是:支持SMP的硬件包括主板和CPU;支持SMP的系统平台,再就是支持SMP的应用软件。

  为了能够使得SMP系统发挥高效的性能,操作系统必须支持SMP系统,如WINNT、LINUX、以及UNIX等等32位操作系统。即能够进行多任务和多线程处理。多任务是指操作系统能够在同一时间让不同的CPU完成不同的任务;多线程是指操作系统能够使得不同的CPU并行的完成同一个任务。 

进入新千年后,AMD与Intel的竞争越来越激烈。不过正当此时,AMD创始人,杰里·桑德斯在2002年宣布不再担任CEO一职,交由Hector Ruiz,而更被人所熟知的名字是鲁智毅。

为了能够使得SMP系统发挥高效的性能,操作系统必须支持SMP系统,如WINNT、LINUX、以及UNIX等等32位操作系统。即能够进行多任务和多线程处理。多任务是指操作系统能够在同一时间让不同的CPU完成不同的任务;多线程是指操作系统能够使得不同的CPU并行的完成同一个任务。

   

在2003年,换帅一年后的AMD,继续着自己的创新之路,推出了首个基于x86架构的64位处理器——Opteron。作为全新的处理器,Opteron处理采用了新设计的K8架构,不过Opteron处理器是面向服务器市场的。而在同年9月23日,AMD正式将64位计算带入PC领域,推出了Athlon 64 FX处理器,主要与之后的几代奔腾4处理器竞争。虽然是64位处理器,但是它也兼容32位应用。同时K8架构也经历的很多年的发展,从130nm到65nm制程工艺,从但核心到双核心,同时CPU插座也有很多种,是AMD产品中的“老将”了。

要组建SMP系统,对所选的CPU有很高的要求,首先、CPU内部必须内置APIC(Advanced Programmable Interrupt Controllers)单元。Intel 多处理规范的核心就是高级可编程中断控制器(Advanced Programmable Interrupt Controllers--APICs)的使用;再次,相同的产品型号,同样类型的CPU核心,完全相同的运行频率;最后,尽可能保持相同的产品序列编号,因为两个生产批次的CPU作为双处理器运行的时候,有可能会发生一颗CPU负担过高,而另一颗负担很少的情况,无法发挥最大性能,更糟糕的是可能导致死机。

  要组建SMP系统,对所选的CPU有很高的要求,首先、CPU内部必须内置APIC(Advanced Programmable Interrupt Controllers)单元。Intel 多处理规范的核心就是高级可编程中断控制器(Advanced Programmable Interrupt Controllers--APICs)的使用;再次,相同的产品型号,同样类型的CPU核心,完全相同的运行频率;最后,尽可能保持相同的产品序列编号,因为两个生产批次的CPU作为双处理器运行的时候,有可能会发生一颗CPU负担过高,而另一颗负担很少的情况,无法发挥最大性能,更糟糕的是可能导致死机。 

AMD Opteron皓龙处理器

16、NUMA技术

   

AMD Athlon FX处理器

NUMA即非一致访问分布共享存储技术,它是由若干通过高速专用网络连接起来的独立节点构成的系统,各个节点可以是单个的CPU或是SMP系统。在NUMA中,Cache 的一致性有多种解决方案,需要操作系统和特殊软件的支持。图2中是Sequent公司NUMA系统的例子。这里有3个SMP模块用高速专用网络联起来,组成一个节点,每个节点可以有12个CPU。像Sequent的系统最多可以达到64个CPU甚至256个CPU。显然,这是在SMP的基础上,再用NUMA的技术加以扩展,是这两种技术的结合。

  16、NUMA技术   

在2003年,大家还在为冲击更高频率时,AMD首先走出了一条不一样的路,将已经使用多年的32位处理器更新,首次在PC领域提供64位计算。

17、乱序执行技术

  NUMA即非一致访问分布共享存储技术,它是由若干通过高速专用网络连接起来的独立节点构成的系统,各个节点可以是单个的CPU或是SMP系统。在NUMA中,Cache 的一致性有多种解决方案,需要操作系统和特殊软件的支持。图2中是Sequent公司NUMA系统的例子。这里有3个SMP模块用高速专用网络联起来,组成一个节点,每个节点可以有12个CPU。像Sequent的系统最多可以达到64个CPU甚至256个CPU。显然,这是在SMP的基础上,再用NUMA的技术加以扩展,是这两种技术的结合。    

不过虽然初期的Athlon 64处理器无论是面对前作还是对手,都非常有竞争力,不过AMD迅速在2004年中还是发布了修订版的处理器,而这些处理器都是采用130nm的SOI工艺,同时将CPU插座换成了Scoket 939。相较于未修订版的Athlon 64处理器,新版的处理器在内存控制器和前端总线进行了更新。内存控制器采用双通道设计,而HT(HyperTransport)总线频率从800MHz提升到了1000MHz,而于此同时,在“摩尔定律”的推动下,AMD处理器也跨过了100nm大关,开始采用90nm工艺制造CPU,推出了“Winchester”核心。此后在2005年推出了“Venice”和“San Diego”核心则继承前作,对缓存等方面进行了改进,如添加了在Intel奔腾4“Prescott”核心中新增的SSE3指令集,大幅修改了内存控制器。

乱序执行(out-of-orderexecution),是指CPU允许将多条指令不按程序规定的顺序分开发送给各相应电路单元处理的技术。这样将根据个电路单元的状态和各指令能否提前执行的具体情况分析后,将能提前执行的指令立即发送给相应电路单元执行,在这期间不按规定顺序执行指令,然后由重新排列单元将各执行单元结果按指令顺序重新排列。采用乱序执行技术的目的是为了使CPU内部电路满负荷运转并相应提高了CPU的运行程序的速度。分枝技术:指令进行运算时需要等待结果,一般无条件分枝只需要按指令顺序执行,而条件分枝必须根据处理后的结果,再决定是否按原先顺序进行。

  17、乱序执行技术    

显然AMD能这么快的发布处理器,说明了AMD准备确实很充分,而且在更新的这么多代处理器中,AMD还能在处理器设计上进行创新,也是让人感到惊叹。现在的CPU中都是内置内存控制器,而那个时代,AMD就已经在CPU中内置内存控制器了。那时由于处理器性能逐步增强,对散热也有了更高的要求,而AMD也开发出了Cool'n'Quiet功能,在负载很小时,降低CPU的运行始终以及电压,降低功耗和温度。

18、CPU内部的内存控制器

  乱序执行(out-of-orderexecution),是指CPU允许将多条指令不按程序规定的顺序分开发送给各相应电路单元处理的技术。这样将根据个电路单元的状态和各指令能否提前执行的具体情况分析后,将能提前执行的指令立即发送给相应电路单元执行,在这期间不按规定顺序执行指令,然后由重新排列单元将各执行单元结果按指令顺序重新排列。采用乱序执行技术的目的是为了使CPU内部电路满负荷运转并相应提高了CPU的运行程序的速度。分枝技术:(branch)指令进行运算时需要等待结果,一般无条件分枝只需要按指令顺序执行,而条件分枝必须根据处理后的结果,再决定是否按原先顺序进行。    

不过在AMD高歌猛进之时,对手Intel那边却出现了问题。2004年,Intel的奔腾4处理器通过超长的流水线设计达到了更高的频率,但是在性能上并没有取得领先。而此时因为制造工艺等原因,奔腾4处理器的4GHz并没有如期而至,所以时任Intel CEO的贝瑞特在一次产业会议上下跪,为Intel新一代奔腾4处理器取消上市而道歉。这件事也算是指出了未来CPU的发展方向,即多核心。

许多应用程序拥有更为复杂的读取模式(几乎是随机地,特别是当cache hit不可预测的时候),并且没有有效地利用带宽。典型的这类应用程序就是业务处理软件,即使拥有如乱序执行(out of order execution)这样的CPU特性,也会受内存延迟的限制。这样CPU必须得等到运算所需数据被除数装载完成才能执行指令(无论这些数据来自CPU cache还是主内存系统)。当前低段系统的内存延迟大约是120-150ns,而CPU速度则达到了3GHz以上,一次单独的内存请求可能会浪费200-300次CPU循环。即使在缓存命中率(cache hit rate)达到99%的情况下,CPU也可能会花50%的时间来等待内存请求的结束- 比如因为内存延迟的缘故。

  18、CPU内部的内存控制器    

而在2005年,AMD就宣布了新一代的Athlon 64处理器——Athlon 64 X2。而这个型号的处理器也是第一个“原生双核”处理器。不过在不久之前,Intel就已经宣布了双核心的奔腾D处理器,采用与末代奔腾4相同的插座LGA 775,使用两个奔腾4“Prescott”核心,这也引发了之后的一个巨大争议,就是“真假双核”。

你可以看到Opteron整合的内存控制器,它的延迟,与芯片组支持双通道DDR内存控制器的延迟相比来说,是要低很多的。英特尔也按照计划的那样在处理器内部整合内存控制器,这样导致北桥芯片将变得不那么重要。但改变了处理器访问主存的方式,有助于提高带宽、降低内存延时和提升处理器性能

  许多应用程序拥有更为复杂的读取模式(几乎是随机地,特别是当cache hit不可预测的时候),并且没有有效地利用带宽。典型的这类应用程序就是业务处理软件,即使拥有如乱序执行(out of order execution)这样的CPU特性,也会受内存延迟的限制。这样CPU必须得等到运算所需数据被除数装载完成才能执行指令(无论这些数据来自CPU cache还是主内存系统)。当前低段系统的内存延迟大约是120-150ns,而CPU速度则达到了3GHz以上,一次单独的内存请求可能会浪费200-300次CPU循环。即使在缓存命中率(cache hit rate)达到99%的情况下,CPU也可能会花50%的时间来等待内存请求的结束- 比如因为内存延迟的缘故。    

澳门新萄京官方网站 13

  你可以看到Opteron整合的内存控制器,它的延迟,与芯片组支持双通道DDR内存控制器的延迟相比来说,是要低很多的。英特尔也按照计划的那样在处理器内部整合内存控制器,这样导致北桥芯片将变得不那么重要。但改变了处理器访问主存的方式,有助于提高带宽、降低内存延时和提升处理器性能。

AMD推出Athlon 64 X2双核处理器

在2005年AMD推出Athlon 64 X2处理器后,称其下双核处理器是“真双核”,AMD的双核在架构上更具优势,而之后又在宣传中称“一个芯片上的两个核心是真正的双核,而Intel的是一个处理器上的两个芯片,是假双核”,随后AMD与Intel之间有针对制造以及软件运行的进行了多番唇枪舌战。不过之后的结论大家也知道了,后来Intel在2006年推出的Core 2 Duo处理器也转向了一个芯片两个核心的设计。

而此时AMD的风头无两,正直最巅峰的时候,对手在2006年推出了全新的处理器架构,一扫之前颓势;而此时的AMD,也正酝酿着一次对以后影响颇深的收购

6.对手反击步步紧逼,收购ATI,却从辉煌逐渐跌落(2006年-2009年)

“真假双核”之争让AMD的名气越来越高,而且实际上那段时间里,AMD在性能上确实更加占优;而此时AMD却酝酿着一个收购计划,就是收购世界两大GPU公司之一的ATI。2006年7月,AMD宣布以56亿美元收购ATI,而AMD在此时也成为了第一家同时拥有高性能CPU和GPU的厂商。不过这个收购决定,也让AMD在接下来的一段时间内的财务出现了一些问题。虽然鲁智毅当时并没有被董事会辞退,不过随后的财务状况最终让他在2008年7月选择了辞职。这次交易对于AMD与ATI来说都造成了一定影响。自收购后,ATI在GPU领域的份额就开始下降,而AMD这边也不好过。

AMD收购ATI

2006年,Intel推出了Core 2系列处理器,其全新设计的内核架构让它无需更高的频率就能实现更强大的性能。一下子就追平了Athlon处理器对奔腾4系列处理器的优势。而在2006年底,Intel就推出了四核心处理器,这也让AMD再次处于劣势。不过好在AMD反映依旧迅速,在2007年9月推出了首款原生4核的第三代Opteron处理器,紧接着在11月就推出了全新系列Phenom处理器以应对挑战。不过不知是因为什么原因,在Phenom处理器中发现了TLB错误,而AMD随后修补了错误,推出了新步进的处理器解决了这个问题。

AMD推出Opteron 64原生四核心处理器

第一代Phenom处理器采用了65nm工艺,CPU插座为AM2 ,支持DDR2内存,拥有四核、双核以及非常独特的三核版本。

随后AMD在2008年底推出了升级版的Phenom II处理器,工艺升级到了45nm SOI,并且支持了DDR3内存。在新一代的Phenom II处理器也有四核、双核和三核心版本,而后期也推出了6核心版。

不过这一代Phenom处理器的性能相比于竞争对手还是要弱一些,不过第二代Phenom处理器却又有如当年“毒龙”以及“巴顿”那样,为玩家带来了很多乐趣,那就是“开核心”。在第二代Phemon处理器中,如三核心实际是由4核心处理器屏蔽而来的,而玩家可以通过一些手段开放被屏蔽的核心,从而达到提升性能的目的。而这个也让很多玩家去挑选能开核的处理器。虽然开核可能会导致运行不稳定的情况,但是玩家们依旧乐此不疲。

而K10核心并没有只用在Phenom处理器上,AMD也推出了采用K10的Athlon以及Sempron处理器,而这些处理器中后期也有如Athlon II X4 640T这种能满足玩家折腾之心的开核神器。

收购之后的ATI,也算是艰难的度过了阵痛期,在2008年推出了Radeon HD 4000系列显卡,而其中HD 4850成为首个浮点性能超过1TFLOPS的显卡,而HD4890则是首个核心频率超过1GHz的显卡。

虽然玩家们玩儿的开心,但是AMD在这时却过的并不好。在鲁智毅离开后,曾经领导开发过K7架构的Dirk Meyer在2008年接任了AMD CEO一职。2009年,AMD也剥离的芯片生产工厂的业务,变成了一家无厂半导体公司。

澳门新萄京官方网站 14

在2009年,AMD正式剥离了旗下的芯片制造部门,成立了GlobalFoundries。AMD历经40年,成为了一家Fabless公司,而曾说过“Real men have Fabs”的杰里·桑德斯,怎么也不会想到AMD会做出这样的决定。不过此后通过一系列收购GlobalFoundries成为了业内一家不错的芯片代工厂,而且与AMD继续保持合作。

7.重整旗鼓但收效甚微,APU失意PC市场却花开别处(2008年-2013年)

在2008年鲁智毅退出后,Dirk Meyer接任了AMD CEO一职,但是由于错误估计市场,押宝PC市场,最终在2011年被取消担任CEO。随后Rory Read接替了他。

澳门新萄京官方网站 15

接替鲁智毅的Dirk Mayer

Intel推出Core 2后,在2008年底推出了Intel Core处理器,而Intel全新的“Nehalem”架构再次提升了处理器的效能,AMD也只能通过性价比来吸引消费者购买产品、更多的核心数来吸引消费者。

不过AMD并没有坐以待毙,Dirk Meyer将公司专注于PC及数据中心市场,发展笔记本平台,但是他在其后的策略也导致了AMD丧失了随后崛起的智能手机等市场,他称移动及消费电子市场不会对目前的PC市场造成冲击,导致PC市场份额削减,不过随后市场证明他是错的,而他也于2011年1月被AMD董事会取消担任CEO一职,随后Rory Read加盟AMD,担任CEO。其任职期间,通过重组公司债务,引入新合作等措施,让AMD重回正轨,收入情况更加健康。

澳门新萄京官方网站 16

Dirk Mayer的继任者Rory Meyer

而Dirk Meyer在任期间,由于Intel Core 2处理器的冲击,导致AMD不得不开始研发新一代的处理器,在2011年10月,AMD推出了重整旗鼓之后的作品,采用“Bulldozer”架构的AMD FX处理器。而AMD也在此次的“Bulldozer”核心中使用了大量新技术,堪称AMD K8之后最大的革新,他改变多了传统的CPU设计思路,将CPU模块化,而每个模块有课细分为两个为内核,这两个微内核既相互独立有高度共享浮点单元、L2缓存等单元。

首先回到2007年,当时AMD再次抢先发布了SSE5指令集,不过此次对手Intel没有再被动跟随,而是推出了AVX指令集,而且由于Intel的强势,软件开发者都转向了Intel,最后AMD看到大势已去,不得已在2009年转向了AVX指令集,这也导致了“Bulldozer”未出世就遭遇险境,而之后AMD对于这个架构的革新创新才刚刚展开。

AMD在“Bulldozer”核心中采用了模块化设计,而每个模块又分为两个微内核,这样就导致了一个功能单元不再是传统的整数 浮点设计,每个模块中有两个整数单元,以及“一个”共享的浮点单元,而模块中的整数单元各自配备了一个调度器,这样可以执行两路线程,AMD将这种多线程技术成为“CMT”(Cluster Multithreading)。

澳门新萄京官方网站 17

“Bulldozer”架构的CMT超线程方案

这个是AMD新一代处理器最大的特点,而这个特点也造成了很多问题。如在后来实际应用中,AMD的处理器性能并没有如宣传的那样出色,甚至因为这个事情惹上了集体诉讼,称AMD虚假宣传多核心处理器,到了2019年,这个案件依旧没有结果。

不过虽然模块化设计的思想在实际应用中的表现没那么令人满意,但是反映了AMD接下来的产品思路,就是通过如显卡去提升处理器的浮点运算性能。这就是AMD的APU产品线。

AMD在处理器中添加显卡部分其实早就有传言,不过真正的产品到了2011年才正式推出。不过初代产品还是使用的K10架构CPU内核,但还是给人一定的惊喜。而真正的APU是代号为“Trinity”的第二代APU,因为这一代,才真正展现了AMD的想法,就是通过显卡去提升处理器的浮点运算能力。

在现代计算机系统中,除了硬件外,还需要有软件方面的大力支持,所以为了实现这种“异构计算”的目标,AMD支持了如OpenCL C 等技术,这样可以方便的为CPU何GPU进行编程,使他们更好的协同工作,处理并发负载。

而之后2013年推出的代号为“Kaveri”的APU,则更进一步,实现了GPU直接使用CPU的虚拟定址访问系统内存,并允许CPU和GPU之间“pointer-is-a-pointer”,这样的统一定制空间让编写异构运算代码难度大大减少,而这也就是AMD的目标,让CPU和GPU真正的各司其职。

此后的APU更新更多是小修小补了。

能实现这样的能力,与AMD另一条产品线有关系,就是GPU。在2011年底,AMD正式发布了全新的GCN架构GPU,而目前GCN架构依旧是目前AMD显卡的基础,可以说是最长寿GPU架构了。这个架构在图形和计算性能方面都非常出众,所以作为DX11时代(后期其实支持DX12,不过是DX12 Feature 11_1)的显卡,在通用计算能力上非常出众,一扫曾经VLIE4和VLIW5架构计算性能低下的情况。而这也让从第三代开始的APU得以实现HSA异构计算的想法。不过遗憾的是,虽然AMD的想法非常好,而且在近几年AI大潮下,异构计算也是大势所趋,不过2013年那时,AMD早已没有2005年前后那么辉煌了,号召力远不如从前,所以此时软件开发者没有对APU提供更多的支持,所以大家对他的印象仅停留在将CPU与GPU融合上了,对于大多数PC消费者来说,“融核”仅仅存在于宣传语中。

澳门新萄京官方网站 18

不过总有“柳暗花明又一村”,PC领域的失势不代表在其他领域也遭遇困难,AMD又开发出了“新技能”——半定制芯片,而这就是家用游戏机市场。在2013年左右,索尼的Playstation 3和微软的Xbox 360已经推出多年,此时正是要推出新一代游戏机的时候了,而双方的目光都从Power架构转向了x86架构,此时AMD已推出了“Bulldozer”架构,而且APU产品也已推出,价格也比较便宜。而PS3及Xbox360初始价格都超过了399美元,所有对于家用游戏机这样非常需要控制成本的设备来说,APU是一个很好的选择。

索尼方面找到了AMD合作开发半定制处理器,处理器方面采用了AMD的“Jaguar”低功耗核心,CPU部分采用双模块共8个核心。而GPU方面也是由AMD开发,CPU和GPU共享8GB GDDR5内存。而微软方面,Xbox One游戏机在CPU部分与索尼PS4相同,但是频率稍低,而GPU部分也是由AMD定制,CPU GPU共享8GB DDR3内存,不过Xbox One还有32MB的高速ESRAM。

Playstation 4

新版Xbox One,其内部还是AMD半定制的芯片

在PC领域虽然AMD努力推广HSA异构计算,但是收效甚微。但是异构计算思想却在家用游戏机领域成功实现。最近又快到了新一代家用游戏机的推出时间了,而又有传言称索尼及微软还将继续采用AMD定制的处理器。

由于PS4及Xbox One的销量斐然,也让AMD挣了不少钱,有资金去开发下一代处理器。而此时,AMD再次换帅。2014年10月,苏姿丰博士担任AMD第四任CEO。

8.设计大神回归重整旗鼓,多年后再次获得竞争机会

熟悉这个行业都知道,一款新架构的研发需要多年的时间,而“Bulldozer”架构已经历多年的时间了,AMD也需要一款新的处理器架构挽救颓势。在2012年芯片设计大神Jim Keller回归AMD后不久,就开始着手研发Zen微架构,但此时距“Bulldozer”架构发布实际没过多久。

在2012年到2015年初,AMD都在默默研发这个全新的架构。而此时AMD靠着“非PC”领域市场,逐渐缓解PC领域产品力缺失带来的问题。在2014年,为AMD选择方向,让AMD重回正轨的Rory Read离开AMD,随后苏姿丰博士担任AMD总裁并兼任了其第四任CEO。到2015年初,Zen架构实际开发也有3年左右了,所以在2015年初公司公布财报时,AMD透露其产品路线图,传闻已久的Zen架构也浮出水面。

苏姿丰博士担任AMD公司总裁兼任CEO

不过这时Zen微架构依旧在研发之中,而AMD的CPU产品线上还是由老产品在支撑。随着有关Zen微架构的爆料在那期间也越来越多,好的、不好的传闻也甚嚣尘上,虽然在那时AMD的股价已经开始逐渐上涨,但是人们对于其产品的实力依旧存疑。

不过此时在显卡方面AMD并没有落下。2016年,AMD推出了Radeon R9 Fury系列显卡,首次使用了HBM,让AMD Radreon显卡性能有了很大的提升。不过在GPU领域,虽然GCN是一个非常优秀的架构,但是相对在GPU领域的竞争对手NVDIA,Radeon显卡的性能虽然不差,但是也逐渐开始落后。

澳门新萄京官方网站 19

对于AMD来讲,处理器显然更加重要。在2015年,有关Zen微架构处理器的传言不断,在2015年年底,有消息称,Zen微架构处理器已经通过测试。这也让人们的期待更加强烈。

在2016年6月,AMD CEO苏姿丰博士正式展示了Zen微架构处理器,采用8核心16线程,IPC相比前代提升40%。不过“好东西”还需要等待,在2017年3月,AMD正式发布采用Zen微架构的Ryzen处理器。

澳门新萄京官方网站 20

AMD Zen处理器实物曝光

全新的处理依旧采用模块化设计,不过更加主流,最小的CPU Complex模块内有四个x86核心,每个核心都有独立的L1和L2缓存,单个模块共享8MB L3缓存,核心一改前代的CMT多线程技术,采用了更加主流的SMT多线程。而第一代Ryzen处理器采用了双CCX模块设计,每个CCX模块通过AMD全新设计的Infinity Fabric总结/接口连接,单个处理器就由8核心了。

澳门新萄京官方网站 21

Ryzen处理器Die

澳门新萄京官方网站 22

Ryzen处理器改用SMT超线程技术

除此之外AMD还为Ryzen处理器加入了SenseMI技术。利用Infinity Fabric总线,AMD Ryzen处理器内部和主板上有100个传感器,可以实时监控系统运行状态。Precision Boost可以精准控制频率。AMD也采用了Nueural Net Prediction神经网络预测和Smart Prefetch智能数据预读功能,选择择最佳处理路径,降低运算延迟。

澳门新萄京官方网站 23

更加精确地控制电压

澳门新萄京官方网站 24

神经网络预测

澳门新萄京官方网站 25

智能数据预读取

这些亮点让AMD重新回到与Intel同一起跑线的位置。目前Ryzen处理器已经发布了两代,第二代在第一代的基础上也有一定的性能提升,采用12nm工艺。

而让更让人惊喜的是,AMD在之后也进入了HEDT市场。推出了ThreadRipper处理器,将核心数目提升到了16个。到了去年推出的第二代,甚至最大核心数到了32核。这也让消费者看到了Zen微架构和Infinity Fabric的巨大潜力。

外面那圈橙色的塑料壳可不是用来保护CPU的,这是CPU安装滑轨,没了这东西CPU可固定不了

而在GPU那边,AMD也没有落下。在2016年推出了代号为“Polaris”的Radeon 400系列GPU,不过AMD在这次的GPU更新中更加注重效能,每瓦性能是前代的2.8倍。但值得注意的是,AMD并没有将Polaris定位于旗舰级,而只是一款中端显卡。在核心改进方面,AMD也改进了几何单元,提升了渲染器效率、色彩算法等,相比R9 290X显卡,其CU计算单元性能提升了15%。而之后AMD又推出了更新工艺版的Radeon RX500系列显卡。不过更大的更新是采用GCN 5.0架构的Radeon RX Vega显卡。除了常规的图形性能提升外,还有支持紧缩的半精度计算。同时为了弥补HBM2显存的带宽问题,AMD还开发了HBCC高带宽缓存控制器。

AMD RTG部门的最新一作是Radeon VII,虽然已然采用的是Vega核心,不过制程工艺升级到了7nm。

澳门新萄京官方网站 26

不过不太好的消息是,现在AMD RTG部门主管Raja Koduri等人已离开AMD,虽然AMD已经规划了后面几代的产品,希望此后AMD GPU的发展不会受到影响。

总结:

在这50年中,AMD为消费者留下了很多出色的产品,从80x86时代,到K7、K8,以及今天的Ryzen,都在市场上有十足的竞争力。而首先推出x86-64架构、APU异构计算,也让众人看到了AMD的高瞻远瞩。虽有失误,但最终还是坚持作出改变,完善产品。

而纵观AMD这50年的发展,没有华丽的出身,从几十名员工开始,通过努力奋斗,一直活跃在半导体、芯片设计行业中。这个行业不乏天才,但很多却已陨落。留下来的,必然是精英中的精英。AMD也通过这50年的积累及创新不停发展,逐渐提升竞争力,虽然身边的对手越来越少,但AMD不但在残酷的竞争中坚持下来了, 而且在强大的对手面前,AMD也没有退缩,而是不断挑战,展现出了强大的竞争力。

今年是AMD成立的50周年,一家公司能走过50年的发展,足以说明这家公司的底蕴。希望未来AMD能继续做好自己,为消费者带来更佳优秀的产品。

本文由澳门新萄京官方网站发布于服务器运维,转载请注明出处:Bulldzoer新品策略,这18条背下来没人敢和你忽悠

关键词: