微软:Phi-2模型性能优于竞争对手 可在设备上运行

站长云网 2023-12-13 站长云网

微软周二表示,其人工智能模型Phi-2的性能好于Meta(MTEA.US)等其他公司的竞争产品,并且能够在设备上运行。微软在一篇博客中表示:“Phi-2模型仅有27亿个参数,但在各种综合基准测试中,它的表现超过了欧洲AI初创公司Mistral旗下拥有70亿个参数的大语言模型(LLM)Mistral7B、以及Meta发布的参数达130亿个的AI模型Llama2。”

“值得注意的是,Phi-2模型在多步推理任务(即编码和数学)上的表现优于参数达700亿的Llama2(Llama2模型系列包含70亿、130亿和700亿三种参数变体)。”

微软补充称:“此外,Phi-2模型的性能与最近发布的谷歌GeminiNano2相当、甚至更好,尽管模型规模较小。”微软表示,Phi-2模型将在AzureStudio中推出。

据悉,微软于今年6月发布只有13亿参数的Phi-1模型,适用于QA问答、聊天格式和代码等等场景。该模型完全基于高质量数据进行训练,在基准测试中的表现比同类模型高出10倍。

微软今年9月更新发布了Phi-1.5版本,同样为13亿参数,可以写诗、写电子邮件和故事,以及总结文本。在常识、语言理解和推理的基准测试中,该模型在某些领域能够跟上多达100亿个参数的模型。

微软在11月更新发布的Phi-2规模虽然比此前版本翻番,但相比较其它主流语言模型依然小很多。微软表示,Phi-2在逻辑推理和安全性方面显示出显著的改进,通过正确的微调和定制,小型语言模型是云和边缘应用程序的强大工具。

责任编辑:站长云网