阿里云开源通义千问14B模型,部分指标甚至接近Llama2-70B
阿里云近日宣布,开源了通义千问140亿参数模型Qwen-14B及其对话模型Qwen-14B-Chat,这些模型是免费且可商用的。
据了解,Qwen-14B在多个权威评测中表现超越了同等规模的模型,部分指标甚至接近Llama2-70B。阿里云此前已经开源了70亿参数模型Qwen-7B等模型,这些模型受到了开源社区的热烈欢迎,一个多月的时间内下载量就突破了100万。
Qwen-14B是一款支持多种语言的高性能开源模型。与同类模型相比,它使用了更多的高质量数据,整体训练数据超过3万亿Token,这使得模型具备了更强大的推理、认知、规划和记忆能力。另外,Qwen-14B的最大支持上下文窗口长度为8k。
Qwen-14B-Chat是在基座模型上经过精细的对话模型训练得到的。借助于基座模型的强大性能,Qwen-14B-Chat在生成内容方面的准确度得到了大幅提升,也更加符合人类的偏好。此外,在内容创作方面的想象力和丰富度也有显著扩展。
Qwen拥有出色的工具调用能力,这使得开发者可以更快地构建基于Qwen的Agent(智能体)。开发者可以用简单的指令教会Qwen使用复杂的工具,例如使用CodeInterpreter工具执行Python代码以进行复杂的数学计算、数据分析、图表绘制等。此外,Qwen还能开发出具有多文档问答、长文写作等能力的“高级数字助理”。
目前,用户可以直接从魔搭社区下载这些模型,也可以通过阿里云灵积平台访问和调用Qwen-14B和Qwen-14B-Chat。阿里云为用户提供包括模型训练、推理、部署、精调等在内的全方位服务。
此次开源将会显著降低中小企业开发细分领域行业模型的门槛,这也标志着阿里云大模型开源生态的初具雏形。



-
微博认证登录
-
QQ账号登录
-
微信账号登录

企业俱乐部
Copyright (C) 1997-2020 Chinabyte.com, All Rights Reserved