本文作者:李丹
来源:硬AI
OpenAI CEO Sam Altman预告的“王炸”首批出炉:OpenAI推出了一款高端的GPT订阅套餐ChatGPT Pro。它的收费在OpenAI目前的各产品中最高,提供OpenAI旗下所有模型的无限使用权,包括OpenAI最强推理模型o1及o1系列的一个升级版本。
美东时间12月5日周四,OpenAI确认了稍早一些网传的消息,正式推出名为ChatGPT Pro的套餐,每月订阅收费200美元。OpenAI称,该套餐的订阅用户可以大规模访问OpenAI旗下最佳的模型和工具,包括无限制访问OpenAI最智能的模型 OpenAI o1以及同系列较小模型o1-mini、GPT-4o、类人的ChatGPT高级语音模式Advanced Voice。
此外,ChatGPT Pro的套餐中还可以包括名为o1 pro mode的新o1版本,也是ChatGPT Pro独有的o1版本。OpenAI称,这个新版本使用更多的计算,能更深入地思考,并为最困难的问题提供更好的答案。希望未来为ChatGPT Pro添加更强大的计算密集型生产力功能。
Altman在社交媒体发帖而极少,OpenAI本周四有两个新动作,一是在ChatGPT Plus套餐中纳入了o1,每月收费20美元,二是推出每月收费200美元的ChatGPT Pro,它可以让订阅者无限使用模型、甚至时更智能的o1。
o1 pro mode在数学、科学和编码方面强于o1 且更可靠
OpenAI认为,ChatGPT Pro为研究人员、工程师和其他每天使用研究级智能的个人提供了一种提高他们生产力的新方式,该方式让他们能处于人工智能(AI)进步的前沿。
OpenAI特别介绍了o1 pro mode,称ChatGPT Pro提供了OpenAI“最智能模型的一个版本”,“该模型可以思考更长时间,从而获得最可靠的回应。”在外部专家测试人员的评估中,o1 pro mode可以产生更可靠、更准确、更全面的回应,尤其是在数据科学、编程和案例法分析等领域。
下图显示,在数学、科学和编码等具有挑战性的机器学习(ML)基准测试中,o1 pro mode的表现均胜过o1 和 o1-preview。在数学方面,o1 pro mode得分86,o1 和 o1-preview分别为78和50,在编码方面,o1 pro mode得分90,o1 和 o1-preview分别为89和62,在问答博士级别的科学问题方面,o1 pro mode得分79,后两者分别为76和74。
为了突出o1 pro mode的主要优势——可靠性更高,OpenAI还提高了评估门槛,要求只有在四次尝试中四次全部能够正确回答问题、而不是仅一次答对时,才能算作模型解决了问题。即使在这种高标准要求下,o1 pro mode的表现也明显强于o1 和 o1-preview。
下图可见,在以上四次答问都必须正确的标准下,o1 pro mode相比o1 和 o1-preview的优势更大。数学方面,o1 pro mode得分80,o1 和 o1-preview分别为67和37,在编码方面,o1 pro mode得分75,o1 和 o1-preview分别为64和26,在问答博士级别的科学问题方面,o1 pro mode得分74,后两者分别为67和58。
发表评论