Google发布改进型Gemini 1.5 系列AI模型 并将API价格降低50%

站长云网 2024-09-25 5iter.com 站长云网

Google今天发布了两款可投入生产环境的更新版Gemini1.5型号:Gemini-1.5-Pro-002和Gemini-1.5-Flash-002。与五月份发布的原版Gemini1.5型号相比,这两款新产品略有改进。

更新后的Gemini1.5系列模型在MMLU-Pro基准成绩提高了约7%,在MATH和HiddenMath基准中提高了约20%,在视觉和代码用例中提高了约2-7%。此外,Google还改进了模型响应的整体可用性。现在,两个模型的响应风格都更加简洁。据Google称,更新后模型的默认输出长度比以前的模型缩短了约5-20%。

除了模型的改进,Google还将做出重大改变:他们正在降低Gemini1.5系列模型API的价格:输入词元降价64%,产出词元降价52%。

自2024年10月1日起,对Gemini1.5Pro的增量缓存词元降价64%,提示词元少于128K枚。

Google正在提高速率限制,允许开发人员构建复杂的人工智能应用。1.5Flash的付费级速率限制从原来的1000RPM提高到2000RPM,1.5Pro从原来的360RPM提高到1000RPM,。Google还降低了新机型的延迟,开发人员可以期待输出速度提高2倍,延迟降低3倍。

在更新后的Gemini1.5(-002型号)中,Google改进了该模型遵循用户指令的能力,同时兼顾了安全性。此外,默认情况下,Google不会对这些新模型应用人工智能内容安全过滤器。相反,开发人员可以根据自己的需求使用过滤器。

最后,Google发布了名为"Gemini-1.5-Flash-8B-Exp-0924"的改进版Gemini1.5模型。这个改进的实验版本在文本和多模态用例方面都有显著的性能提升。开发人员现在可以通过GoogleAIStudio和GeminiAPI使用所有这些更新的Gemini1.5模型。对于大型企业和Google云客户,这些新更新的Gemini1.5模型可在VertexAI上使用。

了解更多:

https://developers.googleblog.com/en/updated-production-ready-gemini-models-reduced-15-pro-pricing-increased-rate-limits-and-more/

责任编辑:站长云网