加入收藏 | 设为首页 | 会员中心 | 我要投稿 | RSS
首页 > 商业

智源评测:大模型打擂台,多模态图文理解腾讯混元国内领先

2025-01-03 10:12:04  来源:中国日报网

  2024 年以来,大模型测评领域也有新变化,为了避免“刷榜”,大模型测评机构推出“角斗场”(Arena)模式,采用随机选择模型“打擂台”的形式,面向用户开放,通过直接的提问命令和打分累计进行排名,以衡量模型能力,有效反应模型在真实应用场景中的表现。JVE

JVE

  图:智源FlagEval大模型角斗场多模态模型测评界面JVE

  在最新公布的FlagEval大模型角斗场榜单上,腾讯混元多模态图文理解大模型凭借出色的表现,位列国内大模型榜首,并且在两个榜单上均与GPT4o 以及 claude 等模型同列第一梯队。JVE

  FlagEval大模型角斗场由北京智源研究院推出,接入了全球主流的大模型,并对这些模型进行长期的观察和测评。JVE

  腾讯混元是国内首个基于MoE架构的多模态大模型。在架构、训练方法和数据处理方面进行了创新和深度优化,支持任意长宽比及最高 7K 分辨率图片的理解。与大部分多模态模型主要在开源基准测试中进行调优不同,腾讯混元多模态模型更加注重模型的通用性、实用性和可靠性,具备丰富的多模态场景理解能力。JVE

  应用方面,腾讯混元多模态理解模型面向通用场景和海量应用进行了优化,积累了数千万相关问答语料,涵盖图片基础理解、内容创作、推理分析、知识问答、OCR 文档解析、学科答题等众多场景,可以完成描述图片内容、将图片转换成文本表格、解释一段代码、分析账单、做数学题等任务。这些能力已经在腾讯元宝APP 上线,并可以通过腾讯云的API调用,除了这次纳入评测的Hunyuan-vision模型,还包括上个月新发布的旗舰多模态理解模型Hunyuan-turbo-vision,具有更强大的能力。JVE

  作为实用级大模型,腾讯混元多模态理解模型目前已经在腾讯的业务场景中取得广泛应用,其中包括QQ、QQ浏览器、腾讯文档、腾讯游戏、腾讯广告、微信读书、微信小程序等。例如,在QQ说说里,可以实现自动为照片配文,在QQ浏览器里,可以通过输入照片,让AI自动识别图片并答题,在小程序教育平台中,可以通过根据图片自动写程序,提升开发效率。JVE

  此外,在腾讯广告场景中,腾讯混元大模型强大的内容理解能力,为广告个性化推荐、广告定位及效果预测提供了有力的支持,提升广告精准度和用户浏览体验。JVE

JVE

  QQ说说AI配文JVE

JVE

  QQ浏览器AI解题答疑JVE

  小程序教育平台-看图写小程序JVE

  多模态理解模型能够同时处理和理解多种模态信息,实现更全面、更深入的语义理解,它通过整合不同模态的信息,提高了AI在复杂任务中的表现,也为人工智能领域带来了新的机遇。未来,随着模型能力的不断升级,腾讯混元多模态理解模型也将推出更多大模型图片搜索、图片审核以及视频理解等多个领域的深度应用。JVE

智源评测:大模型打擂台,多模态图文理解腾讯混元国内领先
发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表
推荐资讯
打造驷马桥街道“有益思”志愿服务品牌:树蓓街社区在行动
打造驷马桥街道“有益
世界显示产业创新发展大会创新成果正式发布
世界显示产业创新发展
最后更新
热门点击
  1. 成毅多面演绎六福珠宝Hexicon型格风暴熠熠
  2. 茶王“无敌之巔”:一泡6300元,窥见中国品牌攀
  3. 陕西陕煤澄合矿山救护大队:“瞄实战、砺精兵
  4. 庆开元养生茶深耕不辍,以革新工艺筑就至臻品
  5. 上海四大乐园之首·INS新乐园 以沉浸式体验
  6. “星火·链网”超级节点(济南)成功上线山东移
  7. 长塘镇:党建引领“听诉路” 纾困解难暖民心
  8. 《红楼梦》研究的惊天发现:作者曹雪芹故里
  9. 7月17日,“安逸生活·宜居西昌” 2025年西昌
  10. 中建方程践行央企责任 服务葛沽新型城镇化