45IT.COM- 电脑学习从此开始!
DIY硬件教程攒机经验装机配置
设计Photoshop网页设计特效
系统注册表DOS系统命令其它
存储主板显卡外设键鼠内存
维修显卡CPU内存打印机
WinXPVistaWin7unix/linux
CPU光驱电源/散热显示器其它
修技主板硬盘键鼠显示器光驱
办公ExcelWordPowerPointWPS
编程数据库CSS脚本PHP
网络局域网QQ服务器
软件网络系统图像安全
页面导航: 首页 > DIY硬件 > 硬件教程 > CPU >

英特尔新一代显卡架构Larrabee解析(2)

电脑软硬件应用网 45IT.COM 时间:2008-08-30 11:37 作者:佚名

  独特的显存架构

  在显存控制器方面, AMD和NVIDIA的GPU使用的是64bit的显存控制器,并且在芯片内只有一组控制器。鉴于INTEL的Larrabee采用多核心设计,内部需要更多的显存带宽, Larrabee将采用1024-bit双向环形总线,单向传输位宽为512-bit。在加上GDDR5显存的助力,Larrabee将会有不错的性能表现。目前的GDDR5显存颗粒还十分昂贵,不过相信到了2010年的时候,会迅速普及,价格自然也会降低到一个比较合理的价位。

  英特尔新一代显卡架构Larrabee解析(3)
嵌入式存储架构

  值得一提的是,AMD公司已经在它的GPU中放弃了他们的环形显存控制器架构,转而采用更先进的片上嵌入式存储,因为他们的GPU需要更加强大的存储带宽。AMD认为环形的总线会将数据直接排挤送出,这种线路设计会相对简单许多,它可以大幅减少芯片的复杂程度,不过他的缺点也比较明显,它需要一根很长的电线贯穿整个芯片。并且无论接收方是否需要,都为所有的接收端提供了较高的数据带宽。因此如果内存接收方需要更高的内存,或者需要提高系统总线的带宽的话,提供一条双向的带宽就可以轻松解决。INTEL可能有比AMD更高明的环形总线方案。因为Larrabee支持超高速相关性缓存,并且可以跨越核心通信。L2高速缓存可以被分割为2个部分,同时可以用环形总线保持他们数据的一致性。这样可以促进信息更好的被传递,也让繁重的数据处理变得更加轻松。如果Larrabee所有的处理核心都通过一个双向的环形总线连接,每个方向提供512bit的位宽。这条总线的工作频率,可能与Larrabee的主频相同。我们假设一下Larrabee的运行频率为2GHz以上,那么这条总线将会提供非常高的带宽吞吐量,而且它的工作频率要远远高于AMD的GPU。

  SLI、交火不算什么,Larrabee的多内核设计!

  目前的GPU全是采用单核芯片设计,图形显示系统要想达到更高的性能只能采用双GPU设计或双卡、四卡并联运行方案。这在成本上往往是用户所不能接受的。而在Larrabee上,INTEL采用多核心设计,这也将是首款采用多核设计的GPU。根据INTEL初步的计算,最初Larrabee的核心数量将会是16个核心,今后按照翻倍的步进也许会升级到32个核心。这是因为要应付目前主流的3D图形的运算,起步至少要16个核心才可以从容应对,但是24个核心的产品也是有可能的,毕竟以目前的生产工艺来看做到这一点完全是没有问题的。

  英特尔新一代显卡架构Larrabee解析(4)
半导体芯片核心

  目前我们的半导体芯片核心面积可以做到286平方毫米,NVIDIA的GT200和AMD的RV770就处在这个层次上。因此在Larrabee集成更多的处理核心应该并非难事。假设INTEL要想集成40个处理核心,那么至少需要572平方毫米的芯片。事实上NVIDIA的GT200使用的是65nm制造工艺技术,如果INTEL用最为先进的32nm制造工艺技术,那么芯片的尺寸还会大幅缩小。就目前的INTEL 45nm制造工艺来说,芯片的核心面积可以减小至少50%,但是根据INTEL的说法,只要转产到45nm,甚至可以减小到60~70%的样子。届时Larrabee将能集成更多的处理核心。INTEL推测,40个核心45nm版本的Larrabee其核心面积约为370平方毫米。像NVIDIA的产品线一样,INTEL也会将芯片根据核心数量分成不同的档次,面向不同人群推出。  

  英特尔新一代显卡架构Larrabee解析(4)
游戏性能与核心数量的增长趋势

  根据INTEL的说法,这种特性在《战争机器》、《F.E.A.R.》、《半条命2:第二章》等游戏中表现最明显,实际性能基本随着核心数量呈线性增长趋势。如果8核心的性能算作1,那么16核心就约等于2、24核心约等于3、32核心约等于4。如果一直这样增长下去,那Larrabee的实力将是恐怖的。不过INTEL也承认,随着核心数量的继续增多,这种线性关系会逐渐减弱,到了40核心只有3.8-3.9,48核心就仅仅4.4-4.6了,64核心甚至可能都不到7。因此如果解决多核心中复杂的数据共享问题及功耗问题,这都是INTEL需要面对的。

  除此之外,Larrabee还同时能够支持4路硬件线程。而Larrabee也能够在CPU内核心进行4组套转换。INTEL CPU比如Nehalem都支持2-way多线程,Larrabee则为4-way multi-threadCPU。而GPU产品中支持多线程的则很少。GPU产品通常配备有数十以上的线程硬件转换功能。比如GeForce GTX 200(GT200)在32寄存器/线程时转换为16warp(NVIDIA用语)。根据Larrabee的资料,硬件多线程设计是为了在进行编译的时候减少二级缓存的等待时间为目的。这与GPU的硬件多threading不同。 另外 Larrabee的硬件多线程比GPU少的原因是架构上的不同。值得注意的是,INTEL指出Larrabee“全面支持IEEE标准单、双精度浮点运算”,但没有透露具体指标。AMD和NVIDIA显卡在单精度方面表现都很出色,RV770系列已经轻松超过1TFlops,不过双精度性能还相差甚远,比如Tesla的单精度性能可达900-1000GFlops,双精度就只有100GFlops左右。如果出Larrabee全双精度浮点运算的话,那么它的通用运算能力要远远强于当前的GPU。

  尽管INTEL进军独立显卡市场的野心已然明确,但据消息来源表示,目前很多细节还处于混沌状态。INTEL将会在今年第四季度公开发布详细完整的独立显卡产品线roadmap。到那个时候,Larrabee显卡才会变得更加清晰。相较于GPGPU来说,它最大的优势就在于采用了大家熟悉的x86架构。目前多数的软件工程师仍不熟悉如何将GPU应用在多任务处理及平行运算上,这点就占了不少优势。如果顺利的话,INTEL将肯定在2008年展示Larrabee系列独立显卡。根据比较可靠的消息来看,Larrabee项目其实是隶属于Tera-Scale计划(“万亿级别计算研究项目”。这个计划的重要工作内容,就是分析未来10年内人们对电脑及服务器的应用需求。这一计划涉及的研究领域非常广泛,共有超过 400 间大学、美国国防部高等研究计划局 (DARPA) ,以及像是微软与惠普等相关公司,共同为 Larrabee 应用进行研究。

顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
无法在这个位置找到: baidushare.htm
发表评论
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
评价:
表情:
验证码:点击我更换图片
推荐知识