MCPLive > 杂志文章 > 托起SuperPhone Tegra 2超级芯片全解析

托起SuperPhone Tegra 2超级芯片全解析

2011-06-10王翔 余寒《微型计算机》2011年5月下

时下大家谈论得多的智能手机和平板有哪些?LG Optimus 2X、摩托罗拉XOOM和Atrix 4G、宏碁ICONIA TAB A500、华硕EeePad Transformer TF101……这些热门产品之所以备受关注,是因为它们可以完成普通PC或者笔记本电脑在互联网上绝大多数应用,如Flash高清视频浏览、3D游戏、网页游戏、1080p播放等。无独有偶,这些产品的动力源泉都是英伟达(NVIDIA)的第二代图睿(Tegra)芯片。下面,我们就来一起了解这颗芯片的神奇之处。

Super Phone之性能大起底

上期本刊《Super Phone时代来临?》一文中提出了一个观点,即由英伟达Tegra 2处理器引发的多核心处理器让“Super Phone”这一梦想成为现实。何为“Super Phone”?在我们眼中,它不仅能提供长续航能力、桌面电脑般的高速上网体验、绝佳的多媒体和商务表现,还拥有媲美主机的游戏效果。这在以往的智能手机上连想都不敢想,但对于Tegra 2来说并非难事。那么,Tegra 2的性能到底有多强呢?让我们从英伟达新的技术文档来寻找答案吧:在性能相同的情况下,Tegra 2双核运行的电压更低,功耗比单核芯片降低40%;多任务处理速度提升一倍;Web浏览速度提升一倍;目前在手机处理器中,Tegra 2运行游戏、处理Flash以及HTML 5的速度是快的。

这份技术文档中提供了一些测试数据加以佐证。比如在分辨率为800×480、Android 2.2系统的手机上,一边播放Pandora流式音乐以及传输数据,一边运行《Dungeon Defender》游戏并记下帧率,以考察多任务运行能力。结果采用Tegra 2处理器的手机达到了25fps以上,而采用其他芯片的手机均未超过20fps。通过浏览器测试工具SunSpider以及BrowserMark的检测,Tegra 2打开Web页面的速度比高通Snapdragon MSM8255快50%以上。在GLBench 2.0 Egypt游戏测试中,Tegra 2的得分是高通Snapdragon MSM8255的150%, 更是TIOMAP3640的200%。除了官方技术文档之外,我们节选了LG Optimus 2X的部分测试数据与大家分享。首先是测试手机打开网页的速度,我们特意和苹果iPhone 4、HTC Desire HD进行了比较,Optimus 2X结果大获全胜(见表1)。其次,用Optimus 2X播放1080p高清视频(H.264编码,平均码流为10Mb/s),画面十分流畅。此外,Quadrant Advanced Edition测试结果显示,Optimus 2X的综合成绩超过了2500分,而被大家奉为“Android机皇”的Nexus One只有1300多分(基于Android 2.2系统)。

表1 三款热门智能手机的网页打开速度一览

手机型号 处理器 浏览器 新浪网  优酷网
LG Optimus 2X 英伟达Tegra 2 Webkit 17s 15s
苹果iPhone 4 苹果A4 Safari 29s 31s
HTC Desire HD 高通Snapdragon MSM8255 Webkit 38s 35s

值得一提的是,Tegra2的性能提升并非建立在高功耗的基础之上, 相反地, 它对功耗的控制同样大幅领先竞争对手。以5英寸平板(电池容量为2000mAh,显示屏功耗为400mW)的音乐回放时间为例,Tegra 2芯片可以连续播放140小时,高通Snapdragon处理器能够坚持20小时,而英特尔Atom处理器只能撑几小时。

从图片解读Tegra 2的奥秘

表2 英伟达Tegra 2的主要规格

CPU 双Cortex-A9,频率高达1GHz
图形 8核超低功耗英伟达精视(GeForce)
视频 1080p,H.264
内存 LPDDR2 600,DDR2 667
成像 超高性能图像处理器
音频 硬件音频
存储介质 eMMC,NAND,USB

上一代Tegra采用的是65nm制程工艺,由台积电负责生产。而Tegra 2采用的是台积电40nm制程工艺。新的制造技术使得芯片的体积得以进一步收缩,同样尺寸的芯片可以填充2倍多的晶体管数量。Tegra 2是一个非常复杂的芯片,共包含2.6亿个晶体管,核心尺寸约为49平方毫米,8.8mm的BGA封装。在英伟达一张关于Tegra 2架构的图片中不难发现,它共有8颗逻辑处理芯片,而上一代Tegra处理器的核心数量为7个。不过这8个处理芯片并非我们在英特尔或AMD的CPU中看到的那些传统意义上的处理器核心,而是各有各的用途。

Tegra 2的主要结构

从单ARM11到双Cortex-A9——核心部分

不同于第一代Tegra集成7颗逻辑处理芯片,Tegra 2将其数目上升至8颗。令人兴奋的是,Tegra 2内建了两颗ARM Cortex-A9芯片。如如果你同时使用过iPhone 3G和iPhone 3GS,体验过两者在速度方面的差别就能感受到Cortex-A8性能的强悍之处。不过,我们要告诉你的是,Cortex-A9比Cortex-A8更快。不仅如此,Cortex-A9拥有很好的向下兼容性,之前针对ARM11设计开发的程序代码都能被无缝兼容,这也意味着上一代Tegra的应用软件都可以快速移植到采用Tegra 2的设备中。而ARM 11核心虽然也是基于ARM MPCore架构,但是在上一代Tegra芯片中只有一颗ARM11。上市已超过5年的ARM 11显然已经难以应付时下主流应用的性能需求。

此外,由于Cortex-A9微架构具有两种模式:可扩展式Cor tex-A9 MPCore多核处理器和传统的Cortex-A9单核处理器。从以往的成功经验来看,依靠双内核式处理器设计不但能够有效提升产品性能,而且还能较好地控制功耗。因此,英伟达设计人员选择了在Tegra 2的内部集成两颗独立的Cor tex-A9芯片。如此一来,Tegra 2便有了更强的机动性:针对于性能较高的应用场合,提高Cor tex-A9芯片工作频率;针对于性能较低的应用场合,降低Cortex-A9芯片工作频率。不仅如此,Tegra 2内建两颗Cortex-A9能够改善当前手持移动设备无法支持后台任务多线程的弊端。同桌面处理器类似,Tegra 2内建的2颗Cortex-A9处理器各自具备独有的指令缓存(32KB)和数据缓存(32KB),但二级缓存则采用了共享方式。为了保证Cortex-A9 MPCore处理器与系统互连之间的数据交互性能,支持单条和双路64bit AMBA 3 AXI接口配置能够按处理器的工作频率进行全负荷工作。根据ARM官方数据来看,数据交互通道的高速度可达12GB/s。

Cortex-A8的处理器流水线级数为13级,Cortex-A9则保留了双执行管线设计,也可以乱序执行指令,但级数回落到8级。众所周知,处理器流水线级数的增加给产品工作频率的提升提供了充足空间。不过,带来的问题也是相当明显——处理器一旦发生分支预测失败或者缓存不能命中的话, 那么所带来的迟延也是致命的。流水线的缩短对于Cortex-A9来说优势之一在于单一时钟周期内处理的数据量更多。Tegra 2内部运行的Cortex-A9运行在1GHz的频率上,可提供2500 DMIPS的性能,相比之下,主频为1GHz的Cortex-A8只能提供2000 DMIPS的处理能力。而短流水线对Cortex-A9来说优势之二则更为重要,8级流水线设计有着较13级流水线更为出色的功耗表现,而且一旦出现分支预测失败情况,所带来的性能下降幅度和功耗损失都不如13级流水线显著。需要说明的是,以上仅仅是单颗Cortex-A9核心的性能增幅。英伟达采用40nm制程工艺之后,一颗SoC芯片多出来的晶体管空间足够放下2个Cortex-A9核心,我们也就不难理解为何Tegra 2的性能如此强劲了。

手机也能玩《虚幻3》—图形处理部分

手机应用的不断升级使其对性能的要求越来越高,如何在性能和功耗上取得完美的平衡呢?正如前文讲的那样,多核心是个不错的选择,将多颗独立的处理器整合到芯片中,处理任务时只启用必须的几个处理器,例如播放高清视频时就启用高清解码处理器、浏览图片是就启用图形处理器,而其他处理器则以极低的功耗待机。同时,复杂的网页和越来越华丽的3D游戏向手机提出了更高的要求,偷菜、牧场已经让手机倍感吃力,而《Dungeon Defender》、《Modern Combat 2》、《N.O.V.A》对硬件性能要求很高,Flash加速、动态光影、多边形生成……这些任务都不是仅靠CPU就可以完成的,所以给手机配备第二颗心脏—GPU显得越来越重要。

Tegra 2的GPU与上一代Tegra的GPU架构相似,都支持OpenGL ES 2.0技术,但性能是上一代的2至3倍,且拥有更高的内存带宽和更高的时钟频率。Tegra 2拥有每秒7100万三角形的生成能力。这是怎样的一个水平呢?举例来说,苹果A4处理器使用的是显示核心为Power VR SGX 535,这颗芯片的三角形生成能力仅为2800万。Tegra 2的峰值填充率与Z缓冲过滤可以达到1200万像素/秒。同时,它还具备高级可编程的像素着色引擎。Tegra 2还采用了可编程的顶点和光照引擎,支持CSAA覆盖采样抗锯齿能力。GPU的纹理分辨率支持4K×4K和2K×2K像素。具备高级2D和矢量引擎。高可以实现1680×1050分辨率的输出,具备24bit真彩色。此外,它也支持并行TTL显示器和大120MHz像素时钟智能显示。它支持HDMI 1.3规范,支持1080p输出,支持数字音频支持VGA或者LVDS,以及各种包括1080p在内的高清格式。

Tegra 2的游戏表现到底如何?英伟达技术人员在Tegra 2技术说明会上进行了演示,用一台基于Tegra 2芯片的平板运行《虚幻3》,在1024×600的分辨率下实现了每秒40帧以上,画面切换十分流畅。不仅如此,Tegra 2对于游戏画质的提升比游戏速度的改善更令人兴奋。在英伟达的官方技术文档中,提供了三组Tegra 2与iPad的游戏画质对比数据。在《Fruit Ninja THD》游戏中,iPad的水果图案边缘有明显锯齿,且表面几乎没有任何纹理和光影效果。得益于多达8倍的几何图形数量,Tegra 2的图案边缘十分光滑,你还能看到逼真的着色与光影效果。再来看看《Backbreaker HD》,Tegra 2的游戏画面中渲染的内容更多,镜头光晕更具动感,且球场的纹理更清晰,动态光影效果非常逼真。

《Fruit Ninja THD》游戏画质对比(左为iPad,右为Tegra 2)

轻松搞定1080p——视频编/解码部分

视频编/ 解码方面始终是英伟达产品的强项之一。Tegra 2内部对于高清视频信号分别交由两个部分处理,一个负责高清视频编码,另一个负责高清视频解码。在上一代Tegra中,为手机设计的APX 2500/2600并没有包含高清视频编码部分,只有在高端的CSX650才有,但仅能实现720p H.264规格的视频编码。与之相对比的是,Tegra 2能够完成1080p H.264格式的视频编码工作。这意味着在采用Tegra 2芯片的智能手机和平板上,用户能够以720p或1080p规格进行高清摄像,甚至随时随地进行高清视频通话或视频会议。

高清视频解码部分在所有Tegra型号中都有,只不过能力不一。比如APX 2500/2600、CSX 600高支持720p H.264解码,Tegra 2则可以实现高达每秒10帧的1080P H.264加速能力。值得一提的是,英伟达结合了部分硬件线路设计,而不是像高通那样采用DSP来解码。相比之下,前者不仅效率高、占用芯片面积小,而且更为省电。事实上,Tegra 2在解码1080p高清视频时功耗仅为100mW,其它同类产品由于主芯片也参与了部分解码工作,所以整体功耗飙升至1000mW左右。

从Optimus 2X以及Atrix 4G的测试不难得知,Tegra 2的视频解码流畅播放,而iPhone 4所采用的苹果A4仅支持720p H.264解码。尽管三星声称他们提供的Cortex-A8芯片可以支持1080p分辨率。但事实上iPhone 3GS,其解码芯片只能提供480P分辨率的H.264解码。正因为如此,采用Tegra 2芯片的5英寸平板可以连续播放接近12小时的1080p高清视频,而采用Snapdragon或Atom芯片的同类产品播放1080p高清视频均宣告失败。

向数码相机看齐——影像处理部分

Tegra 2的影像处理芯片和传统意义上的GPU不是一回事,大家可千万别误会。这块芯片是负责处理平板或智能手机的静态、动态拍照功能。它支持高达1200万像素的图像传感器,支持自动白平衡、自动对焦和一般视频处理等数码相机常用功能。无论是静态图像还是动态图像,Tegra 2的影像处理芯片都支持,并且可以将这些信息输出到下一个重要的处理单元——Tegra 2的2D/3D图形处理芯片。

一副媲美iPod的好嗓音——音频部分

这里不得不提到一家专门为音频播放器提供SoC的公司——PortalPlayer,主要负责半导体设计与固件开发。其中,PortalPlayer 5002音频芯片被用于第1代、第2代以及第3代iPod,PortalPlayer 5020音频芯片则用于第4代iPod、第1代iPod mini以及艾利和H10系列等产品。英伟达于2007年收购了PortalPlayer公司,后者为前者贡献了许多良策,使之可以更好的构建SoC芯片,并提供更优秀的音频解码器。比如说,Tegra 2中所集成的音频芯片正是出自PortalPlayer之手。英伟达官方宣称,这款音频解码芯片在解码MP3格式音频的时候功耗不超过10mW。之前采用第一代Tegra的微软Zune HD播放器可以实现33小时的MP3播放,而采用Tegra 2芯片的5英寸平板可以连续播放MP3达140小时。

为Tegra 2量身打造App

英伟达于今年3月宣布Tegra Zone App在Android Market上线,为“Super Phone”用户提供了一个“一站式基地”。Tegra Zone App为免费应用程序,是由英伟达与多个游戏开发业者与发行商合作的平台,提供一系列针对Tegra处理器进行了专门优化的精选游戏,同时也提供专业的游戏评论、高分辨率画面截图、高画质预告片、游戏影片与制作幕后花絮。打个比方,Tegra Zone如同候机大厅的VIP休息室,凡是Tegra 2的用户都将在这里享受到顶级的服务,获得画面华丽的3D游戏。目前Tegra Zone可供下载的游戏有:首款通过Unreal Engine 3引擎开发的Android游戏《Dungeon Defenders: First Wave Deluxe HD》、《Backbreaker THD》、《Fruit Ninja THD》、《SamuraiⅡ: Vengeance》及《Galaxy on Fire 2 THD》等。需要说明的是,名称中注明“THD”的游戏为专门针对搭载Tegra 2的平板开发的。凭借NVIDIA与众多游戏开发公司的紧密合作关系,Tegra Zone今后将会提供越来越多的热门3D游戏。

Tegra的未来如果说Tegra 2出现之前的“Super Phone”仅仅是一个可望而不可及的梦想,那么现在这个梦想已经成真,而且你我触手可及。当然,英伟达方面并未停下Tegra处理器的发展脚步,随着时间的推移,下一代Tegra的轮廓已变得逐渐清晰起来。

在今年年底,英伟达有可能推出代号为“Project Kal-El”的第三代Tegra(俗称Tegra 3),这将是世界上第一款移动四核心处理器。根据英伟达公布的Coremark 1.0测试数据,Tegra 2可以得到5840分,Core 2 Duo T7200达到了10136分,而Tegra 3的成绩为11354分,几乎是Tegra 2的两倍。Tegra 3的处理器架构仍然基于ARM Cortex-A9,只是核心数量由2个增加至4个,并提升了频率(具体不详),但共享的二级缓存容量还是1MB。值得一提的是,Tegr a 3的每个核心都将增加支持ARM MPE媒体处理引擎和NEON媒体与信号处理技术。图形核心部分,Tegra 3将使用更大、更快的ULP GeForce GPU,着色器数量从8个增加到12个。Tegra 2采用了4个顶点着色器和4个像素着色器,不知道Tegra 3会不会使用6+6的组合。在同等负载下Tegra 3的功耗将不会超过Tegra 2,当然如果开动四个核心,电池续航时间必然会受到一些影响。Tegra 3将弥补这一缺憾,可以支持平均码流40Mb/s、峰值码流60Mb/s、分辨率2560×1440的H.264视频解码。此外,Tegra 3还支持3D视频播放。

再往后, 2012年是第四代Tegra(代号为“Wayne”),性能十倍于Tegra 2。2013年和2014年分别是第五代Tegra( 代号为“Logan”)和第六代Tegra(代号为“Stark”),其中后者的性能可达Tegra 2的八九十倍。若照此发展下去,未来Tegra的表现无疑值得我们期待。

分享到:

用户评论

共有评论(2)

  • 2011.08.02 00:48
    2楼

    我草·········K-Touch 天语 W700 云智能手机竟然用的就是Tegra 2

    (0) (0) 回复
  • 2011.06.12 15:12
    1楼

    何时才能看到真实的产品呢?

    (0) (0) 回复

用户名:

密码: