蓝海情报网

一口气看完OpenAi后八天内容

蓝海情报网 108

一口气看完OpenAi后八天内容

文:王智远 | ID:Z201440

Open AI为期12天的直播,结束了。

科技圈博主和KOL们终于可以松一口气,对于Sam团队而言,这场马拉松式的直播无疑是一次巨大挑战,估计他们累得够呛。

你看了吗?有没有漏掉的?

我可是一天没错过,一开始像追剧一样熬夜观看,后来发现干货并不多,索性就改为白天追视频和媒体发布的新闻。

不过,我有随时记笔记的习惯,所有有价值的信息都会第一时间记录在Obsidian笔记软件里。

前四天内容,我已经分享过,没看的朋友可以点击「一口气看完OpenAI前四天内容」;今天结束之际,也把后八天的经常亮点也总结了出来,确保大家不会错过任何重要信息。

就从Day5开始吧。

Sam说:嗨,欢来到我们「12 Days of OpenAI」系列的第五天。今天,我想介绍让 ChatGPT 更加简单易用的一些新功能。

苹果的朋友们正努力将 ChatGPT 集成到 iPhone、iPad 的 iOS 系统以及 macOS 系统中;我们的目标是让 ChatGPT 在各种平台上都能轻松顺畅地使用。

我们都很喜欢 Apple 的设备,因此对这次集成非常自豪,所以,你可以在不登录的情况下使用ChatGPT了,但如果你有账户,体验会更好。

接下来,正式开始了。工程团队的 Dave和它的伙伴,利用半个小时时间,演示完一切功能。

简单讲,主要有五个核心内容:一,苹果公司将ChatGPT集成到了iPhone、iPad的iOS系统以及macOS系统中,使得用户可以在这些设备上更简单易用地使用ChatGPT。

二,当Siri认为ChatGPT能更好地解决问题时,可以直接将请求交给ChatGPT。三,Apple Intelligence的写作工具现在可以借助ChatGPT从零开始为用户起草文档。

四,在iPhone 16上,用户可以通过摄像头控制功能调动视觉智能,使用ChatGPT来了解镜头里看到的东西。

五,Siri可以直接针对预览状态的文档调用ChatGPT的能力进行问答,用户可以选择是否仅共享当前屏幕截图或共享文档全部内容。

这就是第五天的内容,用一句话总结即:苹果公司宣布将ChatGPT集成到iOS和macOS系统中,用户可通过Siri直接访问ChatGPT,甚至无需账户即可使用。

第六天,说了什么呢?

首先,发布了两个新功能:高级视频对话和屏幕共享。用户现在可以和ChatGPT实时共享屏幕了。

其次,ChatGPT里新增了一个圣诞老人语音模式。只要用户开启语音模式,然后说「hohoho」,就能启动这个模式。

在案例展示环节,团队给ChatGPT展示了水壶和滴漏器的实时视频,在ChatGPT的指导下,他们一步步完成了咖啡制作;ChatGPT给出了几个步骤提示,比如:

在滴漏器中放滤纸、把咖啡粉加到滤器里、慢慢倒热水,要转圈倒等等。

团队还宣布,这些新功能将支持最新的移动应用、桌面应用、Web平台,还有Teams集成。他们计划在明年年初,把这些功能开放给企业用户和教育用户。

所以,第六天重点是ChatGPT推出的高级视频对话和屏幕共享功能,还有新增的圣诞老人语音模式,这些更新主要展示了ChatGPT的多模态交互能力。‍‍‍‍

不知道第七天的内容算不算大招:推出了Projects。

什么是Projects?

简单来说,一个能把ChatGPT的所有功能整合到一起的工具,或者你也可以只用Projects,不用ChatGPT的其他功能。

这场发布会是由OpenAI的首席产品官Kevin Weil和他的两个同事Drew Schuster和Thomas Dimson一起主持的。Kevin Weil在直播里说,现在可以把熟悉的ChatGPT功能都整合到项目里,或者,只单独使用项目功能。

Thomas Dimson补充说,Projects像一个智能文件夹,这个功能是基于ChatGPT最近推出的对话搜索功能开发,可以查看和搜索以前的聊天内容,都是文本形式的。

用Projects的方法挺简单,大概分三步:

一.在ChatGPT界面上点「创建项目」按钮;二.把聊天记录加到项目里;三.试试搜索功能。还有个Canvas自由画布工具可以用,不过这些步骤不是一定要全做,每一步都有很多可以发挥的地方。

Projects能用来干啥?

Kevin Weil和他的团队在直播里展示了几个案例。

他们用Projects创建了一个Secret Santa项目,Schuster上传了群组的聊天记录和大家的需求,然后让ChatGPT随机分配任务,还让ChatGPT帮忙写了封邮件给群组。

还有个例子,Schuster上传了一些关于家用电器的笔记,然后问ChatGPT:冰箱的滤水器什么时候需要更换?如果你平时有记录家里的重要信息,这个功能就特别有用。

总的来说,Projects有三大功能:

一,帮我管理项目,把聊天记录、文件这些都放在一起,方便整理;二,有搜索功能,即使项目里堆了很多东西,也能快速找到需要的内容。

三,融合Canvas自由画布工具,这个功能能让我更直观地看到项目里的内容,整理起来更清晰。这个功能是免费的,我觉得有点像在模仿Claude。

这就是第七天的内容,一句话总结即推出Projects。

第八天,OpenAI给我们带来了几个新消息;首先,他们宣布ChatGPT Search现在对所有登录的免费用户开放了,不管是用网页版,还是iOS、Android手机都能用。

产品负责人Kevin Wheel说,这个搜索功能特别重要;用它能帮ChatGPT找到最新的信息,回答网上的问题。他自己也每天都在用,很高兴现在大家都能用上。

第二,ChatGPT Search还能和高级语音模式一起用。这样,用语音和ChatGPT聊天的时候,也能顺便搜索信息,让语音交流更厉害、更方便。

还有,ChatGPT Search现在和Apple Maps合作了。

如果你在iOS的ChatGPT应用里找到一家餐厅,可以直接点一下,用Apple Maps导航过去。这说明ChatGPT Search和Apple Maps合作得很紧密。

另外,在手机应用里,你可以用语音模式和ChatGPT聊天。它会把你的语音问题和网上的信息结合起来,给你答案。比如,你问圣诞市场的事,它就会告诉你什么时候开门,哪天营业。

最后,ChatGPT Search还能加到浏览器里,你可以把它设成默认的搜索引擎,这样上网搜东西就更快,还能得到智能的搜索建议。

总之,第八天的内容重点是ChatGPT Search功能的扩展和增强。包括了全球用户都能用、和Apple Maps的合作、手机应用里的语音模式,还有浏览器的集成,这些更新让ChatGPT的搜索能力变得更强了。

第九天的活动被称为「对开发者最有用的一天」。

这一天,他们推出了o1模型的正式版API;这个新版本的o1模型速度更快,成本更低,还增加了视觉识别和函数调用等新功能。这让开发者在构建应用时更加轻松。

现场演示中,Michelle Pogras和Brian John展示了o1模型的新特性。他们介绍了函数调用、结构化输出、开发者消息、推理参数和视觉输入等功能。

他们特别演示了如何使用o1模型的视觉输入功能解析税务表单,展示了模型如何识别表单中的错误,并输出修正后的结果。

接下来,实时API也进行了全面升级。OpenAI引入了WebRTC支持,这大大简化了实时语音应用的开发流程。同时,相关服务的价格也大幅降低,其中GPT-4o的音频处理费用降低了60%。

Olivier Godement介绍了WebRTC集成的新功能,展示了怎么自动处理音频流、管理网络拥堵、实时噪声抑制和音频编码,还支持了原生浏览器API。

最后,他们推出了「偏好微调」功能;这个技术让开发者可以根据用户的偏好,定制AI模型的回答风格和内容。比如,金融科技公司用了这个功能后,AI助手的准确率提高了5个百分点以上。

Michelle Pogras提到,这项技术有成对比较学习机制、人类标注和A/B测试支持,还能生成合成数据。他们展示了这项技术在金融分析助手中的应用案例,说明了怎么通过优化提升查询的准确率。

所以,这一天的重点有三个:o1模型API的正式推出、实时API的升级和价格调整、以及偏好微调功能的推出。

第十天有什么呢?

OpenAI在第10天的活动里,搞了两个新动作:

一,他们开了ChatGPT的热线电话服务。就像给朋友打电话一样,你可以直接拨1-800-CHAT-GPT(也就是1-800-242-8478)和ChatGPT聊天;这个服务每个月送你15分钟免费通话,对那些想快点问个问题或者试试新功能的人来说,挺方便的。

二,他们让ChatGPT能集成到WhatsApp里。这样,你就能在WhatsApp上直接和ChatGPT聊天,不用换应用,也不用开电脑,聊天变得更简单。

不过,这个功能有两个限制:

目前只对美国用户开放,因为号码是美国的;第二,每个月免费通话时间只有15分钟,如果你聊得更多,可能得想别的办法。

还有,聊天的时候不支持上网搜信息,只能根据它学过的东西回答。所以,如果你已经有ChatGPT Plus,可能还是用ChatGPT App里的高级语音模式更合适。今天这个功能,主要是给你多一个选择。

我觉得,第十天的活动,没那么激动人心。说白了,就是你可以打电话给ChatGPT了。其实,国内的豆包、文小言、Kimi,早就能做到。

第十一天的内容,关于「桌面应用程序」。

产品负责人Kevin Wheel和团队成员John Nastos、Justin Rushing介绍了一些新的桌面应用程序功能。这些功能是为了帮助大家在Mac和Windows电脑上工作得更快、更好。

那么,桌面应用程序都有哪些好处呢?

让ChatGPT变得更能干,不只是回答问题,还能自动帮你完成任务;这个应用程序能看你的屏幕,帮你自动化工作流程,让你工作更高效。

Justin展示了怎么用ChatGPT和Warp终端一起玩。

比如:数数Git仓库里提交了多少次代码,还能生成图表。John则演示了在Xcode里怎么用ChatGPT帮忙编程,实时写出代码,还能调试。

ChatGPT现在还能和Apple Notes、Notion、Quip这些应用互动,你可以直接在这些应用里写东西、编辑;新加的高级语音模式让你能通过说话和ChatGPT交流,立刻得到回应,让用起来更爽。

所有新功能在直播结束后就推出了,你只需要更新到最新版的ChatGPT Mac应用程序就能用;通过新功能,OpenAI希望大家能更好地掌握和自动化自己的工作流程,提高工作效率。

简单来说,三点:

一是「增强的自动化能力」,桌面应用程序能看你的屏幕,自动化你的工作流程,提高工作效率。

二是「跨应用协作」,ChatGPT可以和Warp终端、Xcode、Apple Notes、Notion、Quip等多种应用互动,不管你是编程、记笔记还是项目管理,都能实时帮忙。

三是「语音交互功能」,新加的高级语音模式让你能通过说话和ChatGPT交流,实现更自然、更便捷的交互体验,进一步提高你的工作和操作效率。

今天是最后一天,也是直播的第十二天,OpenAI重点介绍了o3和o3 mini的预告。为啥跳过了o2?为了避免版权问题,OpenAI直接用了o3这个名字。

如果要我用一句话形容o3,我会说--它强大得让人震惊,可能会给程序员带来冲击。

为什么这么说呢?

我们先来看看OpenAI的研究员怎么说。o1是第一个大型推理模型,它只是用强化学习(RL)训练的大型语言模型(LLM)。o3则是在o1的基础上,进一步扩展了RL的应用,结果非常令人印象深刻。

简单来说,o1只是证明了LLM加上RL是可行的,但我们并没有全力以赴;o3则是全力以赴,通过扩大规模,真正释放了LLM加RL的潜力。

这也验证了一点--对于编程、数学这类能够明确定义任务奖励和容易获取过程数据的任务,通过强化学习,它们的潜力可以不断被挖掘,直到达到世界顶级水平。

那么,o3有哪些核心能力呢?官方展示了一些数据。

首先,o3模型在Codeforces编程比赛中获得了2727分,这个分数让它达到了国际特级大师的水平,大约在全球竞争性人类编码者中排名前200。这个分数比o1模型的1891分高出了44%。

注释:(Codeforces是一个在线编程比赛平台,让全球的程序员在限定时间内解决算法问题,以此测试和提升自己的编程技能)。

其次,在2024年美国数学邀请赛(AIME)中,o3模型的得分为96.7%,只错了一道题。这个得分大幅超过了o1模型的83.3%,相当于一名顶级数学家的水平。从竞赛数学的角度来看,o3的准确率比o1正式版高15%,比o1预览版高近71%。

这些结果展示了o3模型在编程和数学领域的卓越性能,标志着AI在这些领域的进步。

简单来说,o3的三个亮点:

一是推理能力的大幅提升;二是在数学和逻辑测试中的卓越表现;三是编程能力的突破。

所以,o3在实践上证明了,对于编程这类能够明确定义任务奖励,和容易获取过程数据的任务,通过对强化学习的扩展,它的潜力可以不断被挖掘,直到成为世界上最顶级的程序员之一。

最让人兴奋的消息是,o3 mini预计明年一月底就会发布!只需要再等一个月!o3 mini上线后,很快就会开放API调用,并附带o1的所有API功能。

好了,以上就是Open AI这8天的全部内容。你认为哪天的发布能载入AGI史侧呢?

看完觉得写得好的,不防打赏一元,以支持蓝海情报网揭秘更多好的项目。

标签:

ad2

推荐内容