该故障主要由于上游厂商的设计缺陷而产生,以笔者自己的笔记本电脑为例,其采用的代号为17FF的X1600独立显卡芯片(ATI称显卡芯片为VPU,为了更通俗,这里也称ATI的显卡芯片为GPU)和配套的散热模块接触面之间会存在0.8mm左右的缝隙,为了解决这个问题,大多数厂商就在这0.8mm的缝隙里填充了一片固态散热硅脂,可以暂时保证GPU的热量顺利地传导到散热片上。但是固态硅脂的热传导率仅为0.4~0.9W/mK,比起顶级的液态散热硅脂4~7W/mK差很多,比起紫铜386.4W/mK (也就是散热底座的材料)更要差得远。更严重的是此固态硅脂片在长期使用后,会干枯裂开,严重影响导热性能。实际上除了ATI Mobility Radeon 1600系列显卡,NVIDIA的部分独立显卡型号也存在相似问题(例如NVIDIA GeForce 8400系列),笔者拆过几台散热不佳的独立显卡机型,都发现此固态硅脂片已经老化干裂。很明显,固态散热硅脂方案显然只能一时缓解GPU的散热,不能满足笔记本电脑的长期使用要求。
笔者的解决方法是,在清理风扇灰尘,给风扇加润滑油后,再把合适大小和厚度的紫铜片加在裸露的GPU芯片上,取代原来固态硅脂的位置,并在紫铜片两面都涂上散热硅脂(笔记本电脑的
CPU和GPU往往是同一个散热模块提供散热,因此CPU上也要重新涂散热硅脂)。这里需要注意的是,紫铜片必须接近绝对平整,而且厚薄适度。在装好紫铜片后,固定GPU散热模块上对应的两颗小螺丝时要格外小心,以免压碎脆弱的GPU芯片,可以一边拧一边用平口螺丝刀试探铜片是否可以移动,如果刚好不能移动,就停止拧螺丝。
内部散热构造,采用双热管设计,分别为CPU和GPU散热,其中短热管下方就是GPU
一般来说,这样解决后基本可以解决GPU温度过高的问题,但是部分朋友的机器还是会出现故障。这是由于之前有故障征兆时没有引起重视,而主板高温断电保护机制的温度阀值高于GPU的设计工作温度,让GPU在过高温度下继续勉强工作,时间长了就会导致GPU受到不可逆转的伤害。
GPU的内部构造决定了长期处于高温烘烤下的GPU芯片,可能会有晶体管会“过劳损”,俗称芯片“受伤”。具体的表现为:
GPU在低温下运行3D游戏,显卡驱动也会崩溃,驱动崩溃几次之后,就无法恢复了;或者游戏帧数明显过低,没有发挥出显卡应有的性能。
取下散热模块之后可以看到GPU(左上方)和CPU,重新安装散热模块时要记得抹上散热硅脂
切割铜片时要注意保持大小适中,好能对表面进行打磨以保证光滑度
如果显卡真的“受伤”了,那这台笔记本电脑是不是没救了呢?答案并非如此。其实受伤后的GPU,只要没完全损坏,就有继续利用的价值。以笔者这台笔记本电脑为例,运行《魔兽世界》、《魔兽争霸》之类要求不太高的游戏,X1600只需要一半的性能就完全可以应付。笔者尝试着对“受伤”后的GPU进行降频使用(BIOS不支持显卡频率调节,可以使用一般的超频软件进行降频),GPU核心频率降到原来的三分之二,上台服玩《魔兽世界: 巫妖王之怒》,游戏帧数由原来降频之前的10~20帧提高到40~60帧,并且再没出现过黑屏、驱动崩溃、电脑自动断电等症状。
用Overclocking软件对显示核心进行降频操作,从而保证稳定运行
从降频之后的表现来看,GPU中某“受伤”的晶体管或者管线其实并没有完全损坏,只是不能高负荷运行,只要降低工作负荷,就可以继续使用。笔者做过实验,在GPU“受伤”的笔记本电脑上,对CPU、内存、显存进行单独的降频都无法解决驱动崩溃的问题,就算勉强可玩的3D游戏,帧数也低的不正常,而单独对GPU进行降频,可以解决此类问题。
厂商处理此类问题解决方法一般是换主板,而且过保修期后需要付费(报价可能在1000~2000元甚至更高)。但是此故障的根源是此系列笔记本电脑本身的设计缺陷,并且极其容易在过保修期之后再出问题,让过保后的用户付出很大的金钱代价。不得不说个人认为这种官方保修条款存在一些不合理的地方。笔者总结出的这套针对独立显卡机型的典型故障解决方案具备一定的通用性,希望对广大有动手能力的DIYer有所帮助,也希望有越来越多的朋友将自己动手解决问题的方案共享出来,让大家在笔记本电脑上也能体验到无穷的DIY乐趣。