新华社研究院发布国产大模型报告,讯飞星火、文心一言位居前二

新华社研究院中国企业发展研究中心昨日发布了《人工智能大模型体验报告 2.0》(下称《报告》)。《报告》指出,当前国产大模型产品已具有显著进步,但与接受过高等教育的人类相比,在智商、情商等方面仍存在一定程度差距。

新华社研究院中国企业发展研究中心昨日发布了《人工智能大模型体验报告 2.0》(下称《报告》)。

《报告》指出,当前国产大模型产品已具有显著进步,但与接受过高等教育的人类相比,在智商、情商等方面仍存在一定程度差距

《报告》选取 360 智脑、百度文心一言、澜舟 Mchat、商汤商量、讯飞星火、阿里通义千问、昆仑天工、智谱 ChatGLM 共 8 种大模型产品进行评测,根据基础能力、智商能力、情商能力、工具提取四个维度计算总分。IT之家附总分排名如下:

讯飞星火:1013 分

百度文心一言:1010 分

商汤商量:983 分

智谱 ChatGLM:983 分

360 智脑:951 分

昆仑万维天工:943 分

阿里通义千问:935 分

澜舟 Mchat:932 分

图片 1 图片 1© 由 IT之家 提供   图片 2 图片 2© 由 IT之家 提供   图片 3 图片 3© 由 IT之家 提供   图片 4 图片 4© 由 IT之家 提供   图片 5图片 5© 由 IT之家 提供

据介绍,讯飞星火“在工作提效方面优势明显”,百度文心一言“地基深厚、基础能力仍处领军水准”,商汤商量则“在情商方面表现优秀”,智谱 AI 的 ChatGLM 整体表现优秀。

同时,AI 技术发展的重点已经从大模型的盲目追求转向了实用性和可持续性的发展,AI 大规模落地需要更多时间来验证。

THE END
免责声明:本站所使用的字体和图片文字等素材部分来源于互联网共享平台。如使用任何字体和图片文字有冒犯其版权所有方的,皆为无意。如您是字体厂商、图片文字厂商等版权方,且不允许本站使用您的字体和图片文字等素材,请联系我们,本站核实后将立即删除!任何版权方从未通知联系本站管理者停止使用,并索要赔偿或上诉法院的,均视为新型网络碰瓷及敲诈勒索,将不予任何的法律和经济赔偿!敬请谅解!
Baidu
map