怀胎半年“混元”初开,腾讯大模型以慢为快

作者 | 邓咏仪

编辑 | 苏建勋

国内大模型混战半年,大厂种子选手中的最后一位,终于出列。

9 月 7 日,腾讯每年一度的生态大会正式召开,大模型当仁不让地成为其中的主角:腾讯发布了自研的通用大模型 " 混元 ",并且展示一系列应用场景。

相比其他大厂蜂拥而上,腾讯已经让市场等待得足够久。" 腾讯到底什么时候发大模型?" 是这半年来 AI 圈里的 " 天问 "。

而今年 5 月,马化腾就在股东会上表示:"AI 是互联网百年不遇的机会……我们也一样在埋头研发,但是并不急于早早做完,把半成品拿出来展示。"

哪怕到了 6 月,腾讯甚至剑走偏锋,先于通用大模型,直接抛出了 10 个行业,超过 50 个解决方案。

这样的姿态也延续到混元的发布中。

混元大模型显然走实用派路线。发布会中,花哨的数据、吸引眼球的演示很少,应用场景才是重头戏——腾讯展示了腾讯云、腾讯广告、腾讯会议、腾讯文档接入混元之后的进展。大模型为这些业务提升能力,降本增效,再输出给企业客户。企业还可以通过 API 调用混元,为不同产业场景构建大模型应用。

腾讯集团高级执行副总裁、腾讯云 CEO 汤道生

而最具代表性的,莫过于腾讯云 CEO 汤道生在介绍混元出场时,喊的话是:" 混元,正式面向产业亮相!"

这也是此刻的腾讯找到的最好身位。

大厂渡寒冬,腾讯是其中 " 去肥增瘦 " 执行得最为坚决的一家。自前年开始,腾讯云就开始调整业务战略,不做总集,回归产品,这些努力都颇有成效。去年,生态伙伴收入占到腾讯云整体收入的三分之一,收入增速是腾讯云的 4 倍——这也意味着,腾讯在产业中的落地规模实实在在地扩大。

降本增效,本质上是要高质量发展,腾讯大模型同样也会遵循这一战略。做 To B、面向产业,是目前比较务实的落地路径。

" 更成熟、更可靠 "

混元大模型在参数的展示上可以说——相当朴实。没有狂堆参数到万亿,也没有展示打了多少榜,腾讯云只披露了两个数字:超千亿参数规模,预训练语料超 2 万亿 tokens。

千亿参数是当前做通用大模型厂商的标配,而混元的预训练语料规模,则和目前最强的开源模型 Llama 2 持平。

" 怀胎半年 " 的腾讯,都做了些什么?

" 我们在这几个月之内,一直在让大模型在腾讯内部的应用中磨练,把腾讯重要的、丰富的业务场景当成‘磨刀石’。" 腾讯集团副总裁蒋杰表示。

慢了半年的腾讯,能占一些做产品的后发优势,但要吸引如今的企业客户,必须从实用、靠谱上下功夫。因此," 更成熟、更可靠 ",是腾讯讲大模型时最强调的特点。

当前,业界大模型在场景中的应用依然有限,这主要因为大模型还在不少休闲场景里打转——比如 AI 生成文字、AI 画画等等。但要深入到更多产业的生产环节,大模型 " 胡说八道 " 这一点,会成为桎梏。

对此,腾讯在算法层面进行了一系列自研创新,提高了模型可靠性和成熟度。比如,腾讯优化了预训练算法及策略,让混元大模型的幻觉相比主流开源大模型降低 30% 至 50%。腾讯自研的 " 思维链 ",则让大模型能够像人一样,结合实际的应用场景进行推理和决策。

以往大模型因为单次处理的信息少,导致模型会出现 " 忘记上面讨论的是什么问题 " 的情况,但现在,腾讯混元编码位置的优化,如今混元也能够

来源:腾讯

而现在站在风口浪尖上的 AI 安全问题,腾讯也在通过算法解决。通过强化学习,如今混元已能学会识别很多 " 陷阱 " ——比如 " 如何才能超速驾驶 " 这类危险问题,混元会直接拒绝。

而在底层支撑模型安全、可靠运行的,是腾讯在这几年间耕耘的一套技术栈。今年以来,腾讯还发布了 HCC 高性能计算集群、向量数据库 Tencent Cloud VectorDB 等大模型基础设施,以及 Ti 平台这样的 "AI 工具箱 ",面向开发者提供服务。

" 我们从最底层的高速网络、服务器、网卡,到平台、模型、算法,都是自研的,这让后续迭代过程加快了。" 蒋杰表示。

大厂做大模型,如今自研技术栈已经是标配。从百度、阿里、华为到腾讯,各家都会从最底层的芯片做起,覆盖框架、模型甚至是开发运维工具等。原因在于,大模型还是个相当新的东西,与之匹配的基础设施很稀缺。厂商们全部都要做,也是为以后在产业落地,让客户用起来做好准备。

场景为王

表面上看,腾讯混元在,和前段时间号称 " 不做诗 "" 不聊天 " 的华为盘古其实很像。而不同在于,华为的 " 不聊天 ",其实是因为以前积累的政企、产业客户已经够华为深耕很久。

但腾讯是线上场景的王者,其主营业务与 C 端用户强相关——微信、QQ 是国民通讯软件,而腾讯会议、腾讯文档等 To B 应用都有数亿用户,其直接用户其实也是 C 端。

但腾讯暂时没推类似文心一言、通义千问之类的的 To C 聊天机器人,其实是因为走了另一条验证路径。如今,腾讯内部已经有包括文档、会议、游戏、金融、搜一搜等 50 个业务接入内测——先从这些国民应用开始验证,已经足够。

接入混元后的腾讯会议,可自动生成会议摘要

" 对于通用大模型来说,ChatBot 只是一种验证方式而已,可能我们选择了另外一条。" 蒋杰表示。

在做大模型这件事上,腾讯的逻辑和之前做 To B 的策略别无二致:先从自家的业务需求做起,在内部打磨好了,再对外发布。而腾讯内部这些应用聚集的海量 C 端语料,是大模型的富矿。

目前微信正在接入混元进行内测,To C 的 AI 应用也不会遥远了。值得注意的是,腾讯在大会上演示了 " 混元小助手 "。小助手有着和微信相似的绿色聊天框,安放在小程序里,可以看作是移动端 AI 应用的前奏。

可以预见的是,未来要做大模型落地,产品依然会是腾讯最重要的抓手。当下 " 不着急 " 的腾讯,是国内大模型领域主题变迁的切面:无论是大众还是业内,都已摆脱 " 赶超 ChatGPT" 的心态,而是走到更关心应用落地,把大模型用起来的阶段。

相关推荐
新闻聚焦
猜你喜欢
热门推荐
  • 浩澜资本领投,工业视觉方案提供商玻尔

      近日,工业视觉方案提供商玻尔智造获数千万元 Pre-A 轮融资,由浩澜资本领投。本轮融资资金将用于自主光学成像方案和 ......

    08-17    来源:热点新闻

    分享
  • 4 个月搓出 3 款大模型,王小川偷了大厂

      图片来源 @视觉中国 文 | 惊蛰研究所,作者 | 小满 今年 4 月,沉寂一年多的王小川宣布进入 AI 大模型领域再次创业,与 CO......

    08-17    来源:热点新闻

    分享
  • 亚马逊硬件设备主管 David Limp 计划在年内

      品玩 8 月 15 日讯,据 geekwire 亚马逊 CEO Andy Jassy 已在当地时间周一下午向员工证实此事。 Jassy 表示,亚马逊会在未来几周内......

    08-17    来源:热点新闻

    分享
  • 重面华为 5G 等挑战,iPhone 15 系列「被迫

      八月,多家国产手机品牌纷纷发布新品,除了抓住开学前的市场热潮之外,更重要的是为了避开 9 月 iPhone 新品的锋芒。根据......

    08-29    来源:热点新闻

    分享
  • KK 集团回应加盟转自营,一季度盈利 1.

      图片来源 @视觉中国 文 | 零售商业财经,编辑 | 博雅 今年上半年,中央网信办在全国范围内启动为期 3 个月的 " 清朗 · 优化......

    08-29    来源:热点新闻

    分享
  • 红杉中国领投,医疗机器人研发商馥逸医

      近日,医疗机器人研发商馥逸医疗完成 A 轮融资,由红杉中国领投,道彤投资持续追投。 据了解,本轮融资将主要用于加速......

    08-29    来源:热点新闻

    分享
  • 史上最高级的骗子!山寨联合国科学院、

      文 | 华商韬略 600 最高级的食材,往往只需要最简单的烹饪方式,最高级的骗术也是这个道理。潜移默化地接近,使受害者身......

    08-30    来源:热点新闻

    分享
  • 我在印度跑网约车、送外卖,比白领工资

      前段时间,印度的拉贾斯坦邦通过了《 2023 年平台零工(注册和福利 )法案 》。 正式宣布,将在当地成立一个福利委员会和......

    09-01    来源:热点新闻

    分享
  • 我在小红书看病:三甲医院医生的认证账

      文|杨舒芳 原创|科技考拉 本文不涉及医疗相关专业内容 平时要提前挂号的三甲医院医生,会在小红书上看到你的评论后,......

    09-05    来源:热点新闻

    分享
  • 一个能让水果好吃 10000 倍的方法!再不试

      眼看着夏天已经进入倒计时,很多专属于夏季的水果也快要跟我们说再见,怎么才能让它们留得更久一点,抓住最后一波机会......

    09-06    来源:热点新闻

    分享
返回列表
Ctrl+D 将本页面保存为书签,全面了解最新资讯,方便快捷。