北京本事12月6日凌晨,OpenAI举办了“12天12场直播”活动的首秀,推出了推理大模子o1的满血版块和进阶时势,以及每月收费200好意思元(约合东说念主民币1450元)的ChatGPT Pro订阅职业。该套餐用户不错大界限拜谒OpenAI的最好模子和器具,包括无戒指使用最智能的模子o1、较小的模子o1-mini、GPT-4o及类东说念主的ChatGPT高档语音时势Advanced Voice。
ChatGPT Pro还提供名为o1 pro mode的新o1版块,这是ChatGPT Pro特有的。新版块使用更多的缠绵资源,简略更深远地念念考并为复杂问题提供更佳谜底。异日沟通为ChatGPT Pro添加更多广泛的缠绵密集型出产力功能。
与预览版比拟,现时的o1模子在恢复顾惜现实问题时,出现紧要过错的概率减少了34%,何况处理速率擢升了约50%。举例,在恢复“列出2世纪罗马天子的名字、任期和主要建设”的问题时,o1模子用时14秒,而预览版则需要34秒。此外,智力较弱的GPT-4o在恢复这个问题时会出错。
o1模子当今赞助图片输入,用户不错在接头天外数据中心散热问题时附上手绘暗示图。OpenAI沟通在异日几个月内增多网页浏览和文献上传等功能的赞助。
在数学、科学和编码等具有挑战性的机器学习基准测试中,o1 pro mode判辨优于o1和o1-preview。具体来说,在数学方面,o1 pro mode得分为86,而o1和o1-preview永诀为78和50;在编码方面,o1 pro mode得分为90,o1和o1-preview永诀为89和62;在问答博士级别的科常识题方面,o1 pro mode得分为79,后两者永诀为76和74。
为了强调o1 pro mode的可靠性,OpenAI擢升了评估法式,要求模子必须在四次尝试中统共正确才能当作管制了问题。即使在这种高法式下,o1 pro mode的判辨仍是彰着优于o1和o1-preview。在四次答问王人必须正确的法式下,o1 pro mode在数学方面得分为80,o1和o1-preview永诀为67和37;在编码方面,o1 pro mode得分为75,o1和o1-preview永诀为64和26;在问答博士级别的科常识题方面,o1 pro mode得分为74,o1和o1-preview永诀为67和58。
ChatGPT Pro是OpenAI推出的最新订阅层次,价钱是ChatGPT Plus的十倍。用户支付200好意思元后,不错无穷量使用o1模子(Plus用户面前每周限50条信息),同期还不错无穷量使用o1 mini和高档语音时势,并能使用o1 pro时势。o1 pro时势会诈欺更多缠绵资源进行深远念念考,为最难的问题提供最好谜底。异日,这个订阅层次将增多更多广泛且缠绵密集型的功能。
在演示中,OpenAI展示了通过设定一系列无情条目,让o1 pro筛选顺应条目的卵白质。此外,OpenAI还向10名医学推敲东说念主员免费提供了ChatGPT Pro,他们的推敲界限涵盖孤儿病、癌症、呆板等。这反馈了该订阅职业的看法用户群体。
在发布会终了时,奥尔特曼提到第二天的演示将有对开荒者极度灵验的试验。