Google推出迄今为止最便宜的AI模型 Gemini 1.5 Flash-8B
自发布以来,Gemini1.5Flash模型凭借其速度和成本效益迅速受到开发人员的青睐。今年8月,Google发布了Gemini1.5Flash8B,这是一个新的实验性人工智能模型,只使用80亿个参数,进一步降低了成本。
在过去几周与开发人员进行测试后,Google今天宣布发布可投入生产的Gemini1.5Flash8B,它可用于大容量多模态用例、长语境摘要任务等。与原来的1.5Flash相比,新的1.5Flash8B型号成本降低了50%,速率限制提高了2倍,小提示的延迟更低。
在性能方面,1.5Flash8B的性能几乎与5月份推出的1.5Flash型号相当。它尤其适用于聊天、转录和长文本语言翻译等任务。新机型的基准比较如下。
这款全新8B机型的最大亮点在于其成本。双子座1.5Flash8B是Google迄今为止最便宜的人工智能机型。完整定价如下:
每100万个词元0.0375美元的提示价格
提示符每100万个词元0.15美元
缓存提示每100万个词元0.01美元
为了支持大容量人工智能应用,Google还提高了这一新型号的速率限制。Gemini1.5Flash8B现在支持每分钟4000次请求(RPM),是之前限制的两倍。
感兴趣的开发者现在可以通过GoogleAIStudio和GeminiAPI免费试用新的gemini-1.5-flash-8b模型。对于付费级别的开发者,这种新模式的计费将从10月14日(星期一)开始。
Google新推出的Gemini1.5Flash8B模型集性能、经济性和可访问性于一身,令人印象深刻,有望成为各领域开发人员的热门AI模型选择。
责任编辑:站长云网
踩一下[0]
顶一下[0]