Google推出迄今为止最便宜的AI模型 Gemini 1.5 Flash-8B

站长云网 2024-10-04 5iter.com 站长云网

自发布以来,Gemini1.5Flash模型凭借其速度和成本效益迅速受到开发人员的青睐。今年8月,Google发布了Gemini1.5Flash8B,这是一个新的实验性人工智能模型,只使用80亿个参数,进一步降低了成本。

在过去几周与开发人员进行测试后,Google今天宣布发布可投入生产的Gemini1.5Flash8B,它可用于大容量多模态用例、长语境摘要任务等。与原来的1.5Flash相比,新的1.5Flash8B型号成本降低了50%,速率限制提高了2倍,小提示的延迟更低。

在性能方面,1.5Flash8B的性能几乎与5月份推出的1.5Flash型号相当。它尤其适用于聊天、转录和长文本语言翻译等任务。新机型的基准比较如下。

这款全新8B机型的最大亮点在于其成本。双子座1.5Flash8B是Google迄今为止最便宜的人工智能机型。完整定价如下:

  • 每100万个词元0.0375美元的提示价格

  • 提示符每100万个词元0.15美元

  • 缓存提示每100万个词元0.01美元

  • 为了支持大容量人工智能应用,Google还提高了这一新型号的速率限制。Gemini1.5Flash8B现在支持每分钟4000次请求(RPM),是之前限制的两倍。

    感兴趣的开发者现在可以通过GoogleAIStudio和GeminiAPI免费试用新的gemini-1.5-flash-8b模型。对于付费级别的开发者,这种新模式的计费将从10月14日(星期一)开始。

    Google新推出的Gemini1.5Flash8B模型集性能、经济性和可访问性于一身,令人印象深刻,有望成为各领域开发人员的热门AI模型选择。

    责任编辑:站长云网