微软入股、数值碾压Meta AI新贵Mistral发布旗舰大模型
北京时间周一深夜,创业未满一年已成欧洲人工智能龙头的MistralAI连发数条消息——
MistralAI正式成立于2023年5月。在去年这个时候,创办这家公司的三个法国年轻人还分别在谷歌DeepMind、Facebook上班。
到去年12月,随着英伟达、赛富时以及一众华尔街资本挥舞支票,赶忙参与公司价值超4.5亿欧元(接近4.9亿美元)的融资,MistralAI的
(MistralAI的三位创始人GuillaumeLample,ArthurMensch,TimothéeLacroix都只有30多岁)
MistralAI周一宣布,正式推出最新旗舰模型MistralLarge。公司声称该模型具有“顶级的推理能力”,能用于处理复杂的多语言推理任务,包括文本理解、转换和代码生成。
在AI理解能力测试基准MMLU的对比中,
(来源:MistralAI)
据悉,这个模型拥有3.2万tokens的上下文窗口。按照一个token约等于0.75个英文单词的惯用算法,MistralLarge能够一次性从接近2.4万个英文单词的文档中精确提取信息。
公司介绍称,该模型对
当然,最重要的是MistralAI的开源属性——
(来源:公司官网)
公司也在周一发布首个聊天机器人LECHAT,可以选用刚刚发布的Large模型,以及对延迟、成本进行优化的MistralSmall,还有一个名为Next的下一代原型模型。总而言之,提供了一个试用的窗口。
从短暂的上手实测来看,这个模型哪怕使用中文,回答简单的推理题完全没有问题。
(来源:LECHAT)
对于美国历史和法国历史,这个模型也能答得上来。
不过在追加测试中,这个模型对中国文化历史的了解可以说是....惨不忍睹,不过Mistral本身也没说这个模型懂中国历史。这也是国外开源AI模型存在的通病。
(来源:LECHAT、文心一言)
同样在周一,MistralAI与微软宣布达成了一项新的合作伙伴关系。从公告上来看,双方的合作主要包含三个方面:1、微软向MistralAI提供开发和运营模型所需的算力;2、MistralAI的大模型上架微软云服务,供全球用户部署;3、双方将探索合作,为特定客户制作特定模型。
除了提供算力和云服务客户外,
值得一提的是,Mistral这个法文单词的原意指的是“法国吹来的强风”,
Mensch透露,周一发布的Large模型,
对于微软而言,不管是代表封闭生态的OpenAI,还是开源社区的Mistral或Meta跑赢,公司都将是AI赛道的大赢家。这三家的AI模型都已经上架Azure的云服务,现在美股“股王”还持有前两家公司的股权。
踩一下[0]
顶一下[0]