Google推出迄今为止最便宜的AI模型 Gemini 1.5 Flash-8B

站长云网 2024-10-04 5iter.com 站长云网

自发布以来，Gemini1.5Flash模型凭借其速度和成本效益迅速受到开发人员的青睐。今年8月，Google发布了Gemini1.5Flash8B，这是一个新的实验性人工智能模型，只使用80亿个参数，进一步降低了成本。

在过去几周与开发人员进行测试后，Google今天宣布发布可投入生产的Gemini1.5Flash8B，它可用于大容量多模态用例、长语境摘要任务等。与原来的1.5Flash相比，新的1.5Flash8B型号成本降低了50%，速率限制提高了2倍，小提示的延迟更低。

在性能方面，1.5Flash8B的性能几乎与5月份推出的1.5Flash型号相当。它尤其适用于聊天、转录和长文本语言翻译等任务。新机型的基准比较如下。

这款全新8B机型的最大亮点在于其成本。双子座1.5Flash8B是Google迄今为止最便宜的人工智能机型。完整定价如下：

每100万个词元0.0375美元的提示价格

提示符每100万个词元0.15美元

缓存提示每100万个词元0.01美元

为了支持大容量人工智能应用，Google还提高了这一新型号的速率限制。Gemini1.5Flash8B现在支持每分钟4000次请求（RPM），是之前限制的两倍。

感兴趣的开发者现在可以通过GoogleAIStudio和GeminiAPI免费试用新的gemini-1.5-flash-8b模型。对于付费级别的开发者，这种新模式的计费将从10月14日（星期一）开始。

Google新推出的Gemini1.5Flash8B模型集性能、经济性和可访问性于一身，令人印象深刻，有望成为各领域开发人员的热门AI模型选择。

责任编辑：站长云网

顶一下[0]

踩一下[0]