本文作者:风中摇曳

ChatGPT新能力要做Copilot?

ChatGPT新能力要做Copilot?摘要: 早些时候和一加公开了磁吸保护壳规格参数为配件行业带去了更详细的信息方便配件厂商们开发对应的配件从而提升用户的体验来到月日一加中国区总裁李杰又在微博透露了一些关于新机的信息比如他们正...

早些时候,OPPO 和一加公开了磁吸保护壳规格参数,为配件行业带去了更详细的信息,方便配件厂商们开发对应的配件,从而提升用户的体验。来到 9 月 26 日,一加中国区总裁李杰又在微博透露了一些关于新机的信息,比如他们正在准备“一加新配件的木纹设计”,带来了足足九种设计样式以供消费者投票选择。这一次的九种木纹外壳...

文章将深入探讨Ch GPT的新能力,以及它如何可能成为我们工作中的Copilot,像一个真正的助手一样,理解我们的需求,并在创作和决策过程中提供细致的支持。文章还将讨论AI如何成为各行业的基础设施,以及它对未来工作方式的深远影响。让我们一起探索AI的新边界,感受这次技术革新带来的震撼。

Copilot?什么意思?

别着急,我慢慢讲。国庆假期期间,OpenAI发布了新版的Ch GPT,叫做GPT-4.0 with Canvas。

大家已经看到不少新闻和报道,很多自媒体和专家都体验过这个新功能,并发表了看法。

比如:

沃顿商学院的教授Ethan Mollick就说,Canvas让聊天机器人有了新的突破,更像是在和同事合作。

我自己也用了三天,感觉它再次改变了人和AI的互动方式。这让我重新思考:GPT-4.0 with Canvas未来会变成什么样?‍‍‍‍‍‍‍‍‍

很多人把Ch GPT当作一个普通应用,但这种理解是远远不够的。

我认为,Ch GPT意义不仅在于与人对话,更在于它提供了一种全新的交互方式,让AI与各行各业结合, 很多过去无法 的问题。

例如:

在医疗行业,AI可以帮助医生更快地分析影像数据,从而提高诊断准确率;制造业中,AI结合自动化技术,可以预测设备故障,降低停机时间,提升生产效率。这些都是显而易见的应用。

当我们谈论AI时,不应简单地认为“AI是加上一个行业”,而应该思考如何“让行业结合AI”。

Ch GPT不仅是一个对话工具,还是一个能够为各个领域赋能的应用 ,这种赋能不是技术的简单叠加,是一种全新交互方式,帮助 实际问题的能力。很多人认为AI只是一个工具,可以应用到不同领域,但我认为Ch GPT是一个应用 ,不同行业可以围绕这个 构建自己的应用场景。

你可以利用Ch GPT来 客户服务问题、处理自然语言需求,甚至进行复杂的数据分析等;所以,Ch GPT为各行各业打开了许多新的可能性,这就是它的真正意义。

还有一点,Ch GPT不仅仅是AI+的一个应用,它是一种基础设施,为AI与行业的结合提供了一个通用的框架。

在金融、教育、医疗等行业,Ch GPT已经被用来 许多过去需要人类处理的复杂问题,这是AI+的真正价值所在,它是通过 为行业赋能,带来深层次的变革。

因此,从这个角度看,Ch GPT有两个维度: ,作为基础设施 ;第二,作为交互应用。我们应该从这个角度来看待它。

说,这是一种新工具,可以把对话内容变成图形和文字,方便用户整理、扩展和分享,用户不仅能和AI对话,还能用画布来更好地组织和管理信息,这样能更方便地和AI互动,提 率。

gpt-4o with canvas更像长在Ch GPT基础设施上的产品,用了它之后我想到了一款叫Anthropic的Artifacts的工具。

这是什么呢?

简单点说,它能帮助用户更好地和AI合作,让互动变得更加透明和安全。通过Artifacts,用户可以更清楚地看到AI是怎么做决策的,并根据自己需要去调整和优化AI的结果。

比如:

在客服场景中,Artifacts可以显示AI是如何判断用户情绪并给出回复的,这样客服人员就能更好地调整回复内容,确保服务质量。

但是,它有一个问题,所有的交互一步一步进行的。也就是说,你输入一个Prompt,AI给你一个结果。如果你不喜欢这个结果,就要再输入新的指令。这种交互有点像什么呢?

就好比你对家里的小狗说:

把“孩子”叼过来。结果它真的把邻居家的小孩带过来了,但你想让它叼门口的鞋子,你可以不满意,再发出请求,但结果不一定总是你想要的。

因为AI真的还没聪明到像人一样(其实我和很多人交流时也得不到想要的结果)。

如果你真的想得到满意的结果,有一个办法,就是在结果不可控时,直接监控并干预过程;能让你对过程进行细致干预的,才是真正的Copilot。

很多人可能都听说过Copilot这个概念。它被称为一个小助手,能在工作中帮忙,协助完成各种任务,减轻工作负担。在代码开发领域,GitHub Copilot是一个很好的例子。

它可以理解你在写的代码,然后,推荐下一步可能要写的内容,这些推荐可以是一小段代码、一个功能,甚至是更复杂的代码块。

对于需要快速写代码、 代码的程序员来说,GitHub Copilot特别有用,因为它能大大提高写代码的速度。

而且,它可以安装在Visual Studio Code、JetBrains IDE等编辑器中,让你在编写代码的同时得到智能建议。

GitHub Copilot还有一个聊天功能,程序员可以通过聊天和AI互动,生成或修改代码,写文档注释,创建单元 ,甚至帮忙修复代码中的错误。

不过,虽然GitHub Copilot功能很强大,但也有一些不足,比如它生成的代码依然要 和人工检查,所以,它和Artifacts没什么区别。

如果我没记错的话,最早提出Copilot概念的是微软。

在2023年的Build开发者大会上,微软宣布将Copilot深度集成到Windows 11,并扩展到其核心产品和服务中,如Microsoft 365、Dynami 365、Microsoft Viva和Microsoft Sec ity等。

然而,一年过去了,这一重大决策似乎并未明显推动 向人工智能辅助技术的转变。微软Office很难以做出重大改变,是有原因的。

它已经延续了16代以上,基础 坚固。要改变这样一个产品的形态,绝不是简单地加个功能或去掉某些东西那么容易,其背后涉及到更复杂的组织调整等等,一年时间显然不够。

它应该是一个能够主动理解用户需求,并在过程中提供细致支持的助手,这种Copilot需要具备更高的智能,能够预测用户的下一步需求,提供更连续和自然的互动体验。

比如说:

你在用Office写文章,写到一半时,不知道哪个成语是什么?这时,Copilot能够帮你思考,提供相关建议和素材,甚至直接补充内容,减少中断和反复操作的麻烦。

这就是Copilot。至少这次OpenAI做到了。我们再来思考一下gpt-4o with canvas主要应用场景, 表示,这款工具主要面向编辑和写作用户群体,这是openAI最大的两个用户群体。

用户只需选择模型,在对话框中输入特定指令,就能触发文本编辑和画布功能。这个新界面让用户能够在其中改进AI生成的内容。

Canvas是一个能够直接干预和精细控制过程的工具,用户不喜欢像拆盲盒一样,一次次输入提示再等待结果,他们需要能够精确控制、按需输出的工具。

坦率的说,除了Canvas,我还没见过其他产品能够更好地满足这种需求,GitHub Copilot还达不到这个水平。

OpenAI 也提到,希望Canvas能够让Ch GPT更懂用户。例如:

用户可以高亮重点部分,指出错误,Ch GPT会帮忙调整;还可以一键撤销,轻松恢复到之前的版本。

同时,在Canvas界面中,用户也可以轻松编辑文字或代码。界面还配备了快捷方式,可以快速调整写作长度、调试代码,并执行其他有用的操作。

ChatGPT新能力要做Copilot?

因此,这次OpenAI对Canvas的更新,一方面,在用户体验(UX)上已经超越了竞争对手,让我 次真正感受到什么是理想中的Copilot。

不再是那种像抽卡一样反复尝试的交互,而是更加自然和 的体验。

另一方面,我认为,这次更新也融入了对AI时代产品哲学的深入思考,不仅是在做模型,更是在精心打磨产品体验,从动画细节到交互细节,处处可以看出OpenAI这次是用心在做。

这样的交互产品,也更符合创作型交互产品的要求。

我们平时用的编辑软件,比如 Office、IDE,甚至是画图工具,都可以精确到编辑一个字、一个像素,而像 Prompt 这样的操作,根本算不上编辑,只是 AI 发展过程中的一个半成品。

而现在,Canvas结合 Prompt 的模式已经算是完成了大约 80%。如果它再进一步,比如支持图文混排、实时获取数据、利用其他文件作为辅助信息源,那它可能成为一个完成度高达 99% 的神奇工具,这个目标也不再遥远。

Kevin Weil之前是Twitter的产品副总裁,还在Instagram和Facebook的数字货币钱包项目Novi担任过高管。

他在社交媒体、金融科技和Web3领域有很多经验,尤其擅长管理产品生命周期,带领跨部门团队合作,理解用户需求,推动产品创新。

他 重视用户体验,工作方式灵活,善于团队合作,这些有助于确保产品既满足市场需求,又超出用户期待。

OpenAI拥有强大的AI技术,有实现各种应用的潜力,如果他有足够的决策权,可能会对整个AI行业产生很大的影响,虽然现在市场上有很多公司在做类似的事,但未来这些公司可能不得不让步。

另外,关于Canvas能力,OpenAI研究主管Ka na Nguyen在X 上表达了她的愿景:

“我对终极AGI界面的设想是一块空白画布,它随着人类偏好不断演变,自我变形,创造出与人类互动的新方式,从而重新定义我们与AI技术和互联网的关系。”

My vision for the ultim e AGI interface is a blank canvas. The one th evolves, self-morphs over time with human preferences and invents novel ways of interacting with humans, redefining o rel ionship with AI technology and the entire Internet。

简单来说,Canvas的目标是成为一个更大、更适合复杂工作的协作空间,像notion一样?不敢想想。

虽然现在Canvas的功能还没有完全实现这个愿景,但这个想法对整个用户体验行业是一次冲击。

想象一下,一个能自我演变、自我变形的画布;根据每个人的使用,它会变成不同的交互形式和体验;这不就是大模型在交互领域的具体体现吗?

再说了,不谈交互设计,OpenAI的整体布局也一直重视生态系统。从去年的GPTs,到代码解释器、AI搜索,再到现在的Canvas,OpenAI一直在暗示他们想覆盖上下游整个生态链。

在Canvas上,我们还能看到很多OpenAI竞争对手的产品影子,比如Anthropic的Artifacts工具和AI代码编辑器C sor等应用的功能,OpenAI在这些基础上进行了细节升级。

很明显,OpenAI正在加速应用端的发展,之前,OpenAI在应用的交互体验和细节设计上进展比较慢,但凭借GPT模型的领先优势,他们并未太关注产品本身。

而现在,模型能力的 在缩小,很多大模型和消费级AI提供商都把可编辑工作空间看作生成式AI的 突破点。

我认为,随着Claude Artifacts、C sor等功能和工具的爆火,Canvas的推出也是为了弥补市场竞争的重要缺口。

至于Perplexity、谷歌和微软,看到这一切后,会采取什么行动呢?国内产品,又会如何应对这个新的挑战呢?只有简单问答功能的AI服务,已经无法满足人们对“副驾驶”级别的需求了。

总结

这是一轮新变化。一种悄无声息的错位竞争,至少,我这两天体验下来,它确实节省时间成本。

题图来自Unsplash,基于 CC0 协议。

阅读
分享