亚马逊正部署10万颗二代自研芯片 挑战英伟达的行业垄断

站长云网 2024-11-25 华尔街见闻 站长云网

目前,亚马逊的Trainium2芯片已开始在数据中心部署,预计很快将在包括俄亥俄州在内的多个核心数据中心全面推广。相比上一代产品,其性能提高了四倍,内存容量增加了三倍,且在能效和成本上具备显著优势。


科技巨头的AI角力正如火如荼地进行。据彭博社报道,亚马逊正在悄然推进一项极具雄心的计划,意在挑战目前英伟达在AI芯片领域的垄断地位。

报道称,亚马逊目前正在其位于德克萨斯州奥斯汀的工程实验室加紧研发一款新的AI芯片:Trainium2。相比上一代产品,其性能提高了四倍,内存容量增加了三倍,且在能效和成本上具备显著优势。

亚马逊希望通过这些优化,降低AI芯片的采购成本,并提升在数据处理方面的整体效率。

然而,要想真正挑战英伟达在AI硬件市场的领导地位,亚马逊面临的挑战依然巨大。

Trainium2性能大幅提升,计划今年年底之前完成测试和交付

目前,亚马逊的核心芯片设计工程师RamiSinno正在带领团队加速研发第二代自研AI芯片——Trainium2。

Sinno在接受彭博社采访时表示,他们的目标是尽快在数据中心中部署这些芯片,计划在今年年底之前完成测试和交付。

这款芯片是亚马逊在AI硬件领域的第三代产品,旨在为机器学习模型训练提供更高效、更具成本竞争力的解决方案。

亚马逊的芯片业务由JamesHamilton领导,他曾是云计算领域的开创者之一。

Hamilton的团队早在2013年便提出了自主研发芯片的构想。亚马逊的第一个AI芯片Inferentia于2019年面世,专注于推理任务,而Trainium系列则主要面向训练机器学习模型的需求。

目前,亚马逊的Trainium2芯片已开始在数据中心部署,预计很快将在包括俄亥俄州在内的多个核心数据中心全面推广,亚马逊的目标是将Trainium2串成多达100000个芯片的集群。

亚马逊表示,Trainium2相比上一代产品,性能提高了四倍,内存容量增加了三倍,且在能效和成本上具备显著优势。

亚马逊希望通过这些优化,降低AI芯片的采购成本,并提升在数据处理方面的整体效率。分析认为,如果亚马逊的Trainium2能够承担更多公司内部的AI工作,以及偶尔来自AWS大客户的项目,那么它很可能会被视为成功。

亚马逊AI硬件之路道阻且长

分析认为,要想真正挑战英伟达在AI硬件市场的领导地位,亚马逊面临的挑战依然巨大。

首先,设计可靠的AI芯片是一项极为复杂的任务,尤其是需要兼顾性能、能效和成本。

其次,软件工具的支持同样至关重要。尽管亚马逊的Trainium系列芯片在硬件层面取得了一定进展,但其相较于英伟达的成熟软件工具(如CUDA等)仍显不足。分析认为目前,亚马逊提供的NeuralSDK软件工具尚处于初期阶段,无法与英伟达的解决方案相匹敌。

为了克服这一技术鸿沟,亚马逊正积极与大型客户和合作伙伴合作,推动其AI芯片的应用落地。知名企业如数据分析公司Databricks和AI初创公司Anthropic,已经开始试用亚马逊的Trainium芯片,并在一些项目中取得了初步成果。

Anthropic的首席计算官TomBrown表示:“亚马逊Trainium芯片的性价比给我们留下了深刻印象。我们一直在稳步扩大其在越来越广泛的工作负载中的应用。”

责任编辑:站长云网