Meta新一代AI大模型Llama 4发布在即 此前两度延期
据Meta内部测试显示Llama4在数学推理(GSM8K基准)和代码生成(HumanEval)准确率较Llama3提升37%。
这款大语言模型多次延期的主因是多模态训练数据清洗遇阻,特别是视频-文本对齐质量未达预期。该模型需协调16000块H100GPU集群,能源消耗较Llama3训练增加2.3倍。
行业观察人士指出,若再度延期,Meta将错过6月开发者大会的关键展示窗口。而竞争对手Anthropic的Claude4和谷歌Gemini2.0已分别计划在Q3发布重大更新。
责任编辑:站长云网
踩一下[0]
顶一下[0]