GPU计算爆发 谁还记得游戏显卡鼻祖GeForce 256?

站长云网 2024-10-13 站长云网

GPU计算驱动AI。2024年8月,国产游戏《黑神话:悟空》正式开售。作为近期热度最高的国产游戏,《黑神话》凭借出色的剧情发展、场景设计和配乐成功“出圈”,不仅游戏爱好者们“人手一份”,不少已经“戒游戏”的老玩家也选择趁机升级电脑,换张新显卡好好享受游戏。

尽管这种为了游戏而换显卡的行为看起来有“冲动消费”的意思,但回顾近几年的游戏史,我们不难发现,每次现象级游戏走火,同时也有大量玩家为此升级显卡。比如用丰富游戏性推动GTX1060显卡的《PUBG》和《守望先锋》,用出色营销和画质推动RTX时代的《赛博朋克2077》,成为RTX4060“带货王”的《Apex》。可以说每一款成功游戏的背后,都有一张“现象级N卡”。


图片来源:英伟达

那么问题也随之而来——英伟达第一张游戏显卡面世时,游戏行业是怎样的呢?

1999年,英伟达发布了其第一张游戏显卡——GeForce256。但在GeForce256发布之前,市场上已经存在多个显卡(GPU)品牌,如3dfx的Voodoo(巫毒)系列、Matrox(迈创)、S3Graphics、ATI的Rage系列。

和现代的GPU一样,这些GPU同样基于3D加速技术,但可惜的是,这些GPU产品缺乏统一的3D加速制式。这意味着游戏开发者必须针对不同显卡优化游戏,显著增加了开发成本和难度。此外受产品性能的限制,这些GPU也无法支撑复杂的3D游戏。

与此同时,《古墓丽影》、《雷神之锤2》、《星际争霸》等游戏的流行也推动了玩家对3D游戏的期望。也就在这时,英伟达GeForce256出现了。

GPU计算爆发,都有哪些先行者?

GeForce256是全球首款被称为GPU的产品,源于其首次将图形处理的多个功能集成于单一芯片,这一行为定义了GPU这一概念,同时也将复杂的3D渲染任务从CPU中解放出来,赋予GPU专门的计算职责。从GPU的历史进程来看,这也为后来GPU的广泛应用奠定了基础。


图片来源:英伟达

此外,GeForce256也将T&L(Transform&Lighting、变换与光照)硬件加速集成到GPU中,使3D场景的变换和光照计算由GPU专门负责。这是图形处理史上的重大突破,以前这类计算任务通常由CPU执行,不仅效率低下,而且限制了游戏画面的表现力。借助GeForce256,游戏画面的复杂性和细节大幅提升,推动了3D游戏时代的到来。

而且GeForce256出色的性能也将GPU这一概念带到游戏行业之外。别着急,此时的英伟达还没拿出CUDA这种改变GPU行业生态的大杀器。但GeForce256出色的性能,确实为GPU在科学计算、金融分析等领域的应用奠定了基础。

如果说GeForce256开启了GPU图形运算的时代,那英伟达在2008年发布的GeForce8800GTX,则真正解放了GPU的性能。很显然这张显卡的性能放在现在早已不值一提,但这张显卡上,英伟达提出了CUDA(统一计算架构)这一概念。

CUDA的出现让GPU不仅可以用来处理图形运算,还可以用来执行、加速基于CUDA的通用计算,让电脑成为真正的通用工具。


图片来源:英伟达

而在提出了CUDA后,英伟达也在2018年进一步对GPU的算力进行细化,引入了RTCore、TensorCore的概念,让光线追踪和专门的ML计算成为可能——TensorCore通过高效执行大规模矩阵运算,显著加快了AI模型的训练和执行速度。

根据英伟达的介绍,现阶段RTXAI已经对10种不同的AI场景实现覆盖,包括游戏、影视、自动驾驶和科学计算等领域。深受英伟达用户喜爱、可以显著提高游戏FPS的DLSS,就基于TensorCore来实现,可以说是广大游戏玩家最早接触到的真AI用例了。


图片来源:英伟达

在影视制作领域,RTXAI加速渲染速度,使复杂的光线和反射效果在短时间内完成,从而缩短了制作周期。在自动驾驶方面,RTXGPU处理大量图像和传感器数据,支持实时决策,提高车辆的安全性与精准性。此外,AI还用于医疗影像处理、金融预测和科学模拟,加速数据分析和预测模型的训练。

不夸张的说,RTXAI的出现不仅推动了高端视觉效果和AI计算的融合,还降低了企业使用AI的门槛。它正逐渐成为各行业提升效率、创新业务的关键引擎,引领未来技术的发展潮流。

GPU计算驱动AI,但AI计算不全靠GPU

但话说回来,尽管GPU的算力提升让AI能以惊人的速度普及,现阶段英伟达确实是AI算力的代名词,以及个人AI计算机的唯一选择。但这是否意味着美欧强劲GPU的设备,就无缘AI时代呢?

答案是否定的。

在2024云栖大会上,阿里集团CEO、阿里智能云董事长兼CEO吴泳铭表示:

生成式AI改变计算架构,从CPU主导的计算体系到GPU主导的AI计算迁移。AI时代将是“GPU算力为主,CPU算力为辅”的计算模式。2024年市场新增算力,超过50%的需求AI驱动产生,这一趋势将持续扩大。

不可否认,即使是阿里云提供的AI云算力,背后也主要由GPU驱动。但从另一个方面想,将GPU算力集中在云端,配合设备本地的CPU、NPU进行混合AI运算,其实也不失为一个好主意。

首先,这可以缓解算力瓶颈,提升计算灵活性。GPU在AI计算中的核心地位毋庸置疑,但个人开发者和消费者通常难以承受购买和维护大量GPU的成本。将GPU算力集中在云端,允许用户按需租用云GPU资源,可以避免一次性高额投入。这种模式也提供了极大的弹性,可根据任务需要随时扩展或缩减算力。

其次,许多终端设备受限于尺寸和功耗,无法配备高性能GPU。通过在云端完成复杂的AI运算,并将结果传输至本地设备执行简单任务,设备可以保持轻量化且功耗低。这种混合计算模式,特别适合边缘设备和移动终端。


图片来源:英伟达

而且在本地CPU和NPU的配合下,云GPU的计算能力可以得到最大化利用:设备本地的NPU可以快速处理延迟敏感的任务,如语音识别和实时图像分析;而复杂的模型训练和推理则交由云端GPU完成。这种模式有效缩短了计算响应时间,提升了用户体验。

短时间来看,英伟达在AI算力市场的优势仍然巨大,但是长远来看,群狼环伺之下的AI市场,英伟达双拳难敌四手。诸如移动PC、智能终端等英伟达的弱势市场,很快就会被其他厂商瓜分干净,而关键的服务器市场也并非高枕无忧,AMD的MI300系列AI显卡份额增长迅速,已经足够引起英伟达的警觉。

不过,竞争所带来的创新与发展,才是科技进步的关键,随着AI领域的竞争加剧,实际上也在推动AI成本的下降,让AI技术得到更快、更广泛的应用。就像吴泳铭说的那样:

AI驱动的数字世界连接着具备AI能力的物理世界,将会大幅提升整个世界的生产力,对物理世界的运行效率产生革命性的影响。

一个围绕AI而生的新生态,此时此刻就在我们面前。

相关文章:

今天是全球首款GPU:NVIDIAGeForce256诞生25周年纪念日

NVIDIAGeForce256问世25周年纳斯达克大屏送祝福

责任编辑:站长云网