j9九游会更像是把任务交给AI-九游娱乐(中国)有限公司-官方网站
发布日期:2026-05-10 12:45 点击次数:138

Cat Wu 是 Anthropic Claude Code 与 CoWork 的产物负责东谈主,亦然站在 AI 原生产物第一线的东谈主。
这期 Lenny’s Podcast 名义上聊的是 Claude Code、CoWork、Anthropic 的产物方法论,但确实的看点其实更横暴:当 AI 启动收受代码、文档、PPT、邮件和客户简报,产物司理到底还剩下什么?当一个团队每天都能发新功能,传统互联网期间那套半年道路图、PRD、跨部门排期,还能不可陆续成就?
Cat Wu 给出的谜底很平直:AI 莫得让产物司理隐匿,而是把产物司理再行推回了最中枢的位置——判断、试吃、弃取,以及在不笃定中界说主义。
1. AI 期间,产物司理最迫切的智商是判断“一个月后的产物应该长什么样”。已往产物运筹帷幄看半年、一年;当今模子智商几周一变,用户步履也在握住漂移。稀缺的 PM,是能在拖沓里提前看见下一步的东谈主。
2. 代码越来越低廉,产物试吃反而越来越贵。当 Claude Code 这类器用让工程终了资本急剧着落,竞争的中枢就从“能不可作念出来”变成“该不该作念、如何作念才对”。
3. 为超等 AGI 想象产物很简便,为今天这个“不完好的 AI”想象产物才难。想象一个无所不可的 AGI,只需要一个输入框就够了。但现实是,模子仍会犯错、会扭曲、会中断。确实考验产物团队的,是如安在模子还没抵达终局时,把它包装成一个真碰巧用、着实、可委派的产物。
4. 95% 的自动化,其实不叫自动化。如果一个 AI 作事流不可作念到 100% 恬逸,它就不可被确实信任。
5. Anthropic 跑得快,不单是因为模子强,而是因为组织被改形成了“高速发布机器”。功能可以先以 research preview 上线,工程师可以从用户反映一齐跑到发布,市集、文档、开发者关系团队第二天就能接上。AI 期间的产物竞争,不单是模子竞赛,亦然组织速率竞赛。
6. 产物司理、工程师、想象师的鸿沟正在被 AI 打碎。在 Claude Code 团队里,PM 要懂代码,工程师要有产物试吃,想象师也要能参与终了。将来确实有价值的东谈主,不是守住岗亭说明书的东谈主,而是看到那里缺东谈主、那里卡住,就能坐窝补位的东谈主。
7. Agent 的拐点,不是“更会聊天”,而是“真的能替你干活”。2024 年的 AI 产物如故对话框,2026 年的 AI 产物也曾启动进入举止层。用户确实的颤动时刻,不是 AI 给出一个好建议,而是它真的帮你写完代码、作念完 PPT、整理完客户简报。AI 从“回应问题”变成“完成任务”,这才是阐明断层确实启动的场合。
AI产物司理:岗亭变革与中枢智商重构
Lenny:今天咱们邀请到的嘉宾是Cat Wu,她是Anthropic Claude Coding的产物负责东谈主。Cat正站在AI、产物以及如何构建产物这场变革的最前沿。她和团队打造的产物,正在深切改变咱们每个东谈主作念产物的方式。她有相当多值得共享的洞见、造就和念念考,这是一期皆备曲折错过的节目。在启动之前,别忘了走访Lenny’s Newsletter,那里有一系列专门为订阅者准备的超值优惠。接下来,让咱们迎接Cat Wu来到节目。
Cat Wu:谢谢邀请。
Lenny:我有好多问题,也相当期待此次对话。咱们先从一个布景问题启动:能不可帮行家融会一下,你和Boris Cherny在团队中的单干?行家应该都很老到Boris Cherny,他的那期节目是本播客最受迎接的一期。他打造了Claude的Claude Code,带领团队高速推动开发,致使可以用手机完成多半代码提交。但与此同期,我以为好多东谈主低估了你在Claude Code,以及你们整个团队所构建的一切中的枢纽作用。
是以也想借这个契机,请你详实讲讲:你在团队中的变装是什么?是如何与Boris Cherny息争的?你们是如何分歧职责的?以及,在这样一个团队中,产物司理的变装具体是怎么运作的?
Cat Wu:我很庆幸能和Boris Cherny通盘作事,他是一个相当出色的念念维伙伴,亦然咱们的技艺负责东谈主和产物愿景制定者。他很擅长界说产物将来的式样,比如三个月、六个月之后产物应该发展成什么样,以及那种AGI导向的欲望版块是什么。而我的作事更多是在念念考,从咱们当今所处的位置,如何一步步走到三到六个月后的阿谁愿景,我也会花好多时候在跨团队息争上,确保市集、销售、财务、资源等各个团队都招供这个磋商,行家朝着归并个主义推动。同期也要确保当功能准备好之后,不会在上线关节碰到任何阻碍。
咱们合作顺畅,很大原因是念念路一致,但单干其实莫得明确鸿沟。约莫80%的事情是咱们共同热心、通盘推动的,剩下20%里,有一部分是我更防备的,由我来主导,另一部分是他更防备的,由他来负责。
Lenny:你刚刚提到一直在口试多半产物司理,这一丝让我很有嗟叹。如果每次有东谈主请我保举去Anthropic作念产物司理我都能收费,那我可能也曾有300亿好意思元ARR了。可以说,这是当今最受迎接的公司之一。是以我很意思意思,你在口试中到底看到了什么问题。你提到,好多东谈主融会错了成为又名优秀AI产物司理所需要的智商,能不可张开讲讲你的不雅察,以及今灵活正顺利需要具备哪些枢纽点?
Cat Wu:在前AI期间,技艺演进较慢,产物运筹帷幄庸俗基于6到12个月。由于委派节律较低,产物司理更强调跨团队协同与道路图对皆,以确保依赖智商能够按期提供解救,这在代码资本较高的布景下尤为迫切。随着AI带来的工程效用进步以及模子智商的快速进化,产物开发周期被显耀压缩,从半年裁减到一个月,致使一周或一天,这要求产物具备更高频的发布智商。
因此,产物司理的中枢职责也在回荡,从以跨团队对皆为中心,转向以最快委派为中枢。枢纽在于构建机制,使想法可以被快速考证并上线,举例建立快速实验通谈,让创意在一周内触达用户。在AI原生产物环境中,优秀产物司理的枢纽智商在于裁减从构猜测委派的周期,并界说坐蓐物中最枢纽、必须即刻可用的中枢功能。
Lenny:这个不雅点稀奇挑升念念,实质上是在说,好多东谈主还莫得适合当今这种速率,也莫得领略到,产物司理作事的中枢也曾变成了推动速率。那我很意思意思,你们具体是如何终了这一丝的?你和你的团队都作念了哪些事情,来让团队可以跑得这样快?除了模子自身,还有哪些枢纽作念法?
Cat Wu:因为LLM太通用了,反而会带来好多依稀空间,比如咱们到底在为谁作念产物、要解决什么问题、最中枢的使用场景是什么,优秀的产物司理最先要作念的是把这些问题讲通晓。比如,你可以明确:咱们的主义用户是专科开发者,这个功能要解决的问题是权限指示太多,导致用户疲乏。主义场景是,让企业开发者在安全前提下终了零权限指示。这样一来,主义就变得相当表示,同期也当然澌灭了好多分歧适的决策,让团队能更聚焦。
第二个枢纽点是,要建立一套可复用的发布机制。像Claude Code,咱们险些所有这个词功能都是以研究预览的方式上线,咱们会明确告诉用户,这是一个早期想法,正在采集反映,将来不一定经久解救。这样作念的自制是,大大诽谤了发布的神色责任,好多功能可以在一到两周内快速上线。
第三点是,产物司理需要搭建一个表示的息争框架,让团队知谈什么时候需要引入市集、文档等跨职能变装,以及他们的作事预期是什么。比如里面有一套相当详尽的历程:当工程师以为功能准备好了,况且也曾里面考证过,就会发到一个固定的发布渠谈。然后文档、产物营销、开发者关系团队会坐窝接入,致使可以在第二天就完成对外发布。恰是因为这套机制饱胀顺畅,工程师发布功能的阻力被降到很低,而建立这种机制,自身即是产物司理最迫切的职责之一。
Lenny:那PRD在这个过程中上演什么变装?你刚才说主义很迫切,实质上即是在对皆顺利程序,以及明确这个产物是为谁作念的、不为谁作念。那你们当今还会写PRD吗?如故更多是用几条枢纽要点来抒发?在当今这种环境下,PRD的方式和产物司理的作事方式发生了哪些变化?(ZP注:PRD即是用来说明“要作念什么产物、解决什么问题、如何作念”的文档。)
Cat Wu:咱们主要作念两件事。第一,咱们有一套相当严格的目的体系,况且每周都会和全团队通盘作念数据复盘。目的即是让每个东谈主都确实融会业务的全貌,包括中枢主义是什么、现时的趋势如何,以及背后的驱动成分。
第二,咱们会明确一套团队原则,比如中枢用户是谁、为什么是他们。之是以要把这些讲通晓,是为了让团队里的每个东谈主都融会业务逻辑,知谈什么最迫切、哪些是咱们惬心作念的弃取。这样一来,行家就可以我方作念判断和决策,而不是每件事都要依赖产物司理或者其他变装,从而幸免被卡住。
Lenny:我很心爱你刚才讲的这些,因为它其实在说明一件事:将来咱们如故需要产物司理的。当今外面有好多声息在说,是不是只靠工程师就可以握住开发和上线产物,不再需要产物司理了。
Cat Wu:咱们其实如故会写PRD。对于稀奇依稀的功能,写一页纸说明主义、令东谈主愉悦的用例和现时失败模式,有匡助。有些神情,尤其基础设施密集型,可能要花几个月,仍会写PRD。
Lenny:我想再深入探讨一下你们如何能这样快。我从未见过Anthropic这样的发布节律。有东谈主作念了个全公司的发布日期,险些每天都有要紧功能或产物。一个网上问题是,你们刚发布了令东谈主难以置信的模子——Mythos,还在预览阶段因为太矫健,东谈主们有点怕。你们里面用这个模子吗?这是你们能如斯快的原因之一吗?
Cat Wu:咱们也曾快了好几个季度了,是以不单是Mythos的原因。Mythos相当矫健,咱们里面照实用模子,这提高了发布速率一丝,但不是主要原因。主若是历程和团队盼望。咱们历程少量,要澌灭所有这个词阻碍发布的远程,确保团队中的每个东谈主都有智商把我方的想法从认识到发布在不到一周内完成,偶然致使一天。
Lenny:有最好的模子,同期还以这种速率构建产物,果然巨大上风。
Cat Wu:咱们很庆幸能与前沿模子通盘作事。
Lenny:果然巨大上风。构建东西,然后使用它再加快,太挑升念念了。有几个话题我想聊聊,一周前Claude Code的完整源代码泄露了,有东谈主把它放出来了,可能是造作。你有什么看法吗?发生了什么,那里出错了,行家应该知谈什么?
Cat Wu:咱们看到后坐窝窥伺,领略到这是东谈主为罪戾。有东谈主用Claude缓助写PR,是更新咱们发布包的方式。执行上经过两层东谈主工审核。这完全是东谈主为罪戾,咱们也曾加固了历程,预防将来发生。(ZP注:PR是软件工程中的程序历程,指代码变更提交后进入评审并合并至主分支的过程。)
Lenny:这个东谈主还在Anthropic吗?还好吗?
Cat Wu:是的,没事。这是历程造作,最迫切的是从中学习,增加更多防护挨次。咱们也曾在作念这些,大部分也曾上线。
Lenny:另一个问题对于Open Claw。最近有举措禁锢东谈主们用Claude订阅使用Open Claw。好多东谈主不悦,困惑为什么,嗅觉对开源社区形成了伤害。东谈主们需要融会这个决定背后的考量是什么?
Cat Wu:咱们看到了对Claude的巨大需求,一直在努力蔓延基础设施,同期让防护栏更token高效,让用户能得到更多使用量。Claude订阅不是为第三方产物想象的,它们的使用模式与第一方产物不同。咱们花了好多时候试图找出最平滑的过渡决策。很欢娱咱们能让每个订阅者得到一些credits。但咱们必须作念出重荷决定:优先保证第一方产物和API。这即是决定的起原。
Lenny:在我看来这很合理。你们以每月200好意思元的价钱补贴这种使用,基本上是无穷使用。我以为东谈主们不睬解买卖运作——需要获利,需要盈利。不可免费送出这样紧缺的算力。回到产物司理团队,Anthropic的产物司理团队是什么样?有几许产物司理?如何组织的?
Cat Wu:咱们有几个产物司理团队,八成30到40个产物司理。有research产物司理团队,由Diane带领,负责采集客户反映并反映给研究团队,同期负责模子发布历程。Claude Developer Platform团队,选藏Claude Code构建其上的API,也发布managed agents。Claude Code团队,负责Claude Code和CoWork中枢产物。企业团队匡助大型企业客户领受产物,包括资本限度、RBAC、安全限度等。增长团队负责全产物套件增长,与Claude Code和CoWork详尽合作,也参与CDP用户增长。
Lenny:说到增长,Ilya不久前上了播客,他有一个大多数东谈主不共享的洞见:行家以为将来需要更少产物司理,他认为因为工程师太快,产物司理和想象师被挤压,很难跟上每天发布的功能,是以他需要更多产物司理。你如何看?经久来看产物司理功绩会扩招吗?
Cat Wu:所有这个词变装都在交融。产物司理作念一些工程作事,工程师作念产物司理作事,想象师作念产物司理M作事,也参与提嘱咐码。你可以选择招聘更多有出色product taste的工程师,或保持工程招聘不变,招聘更多产物司理指导他们的作事。咱们团队专注于招聘有出色product taste的工程师,这样可以减少发布产物的支出。团队有好多工程师能够端到端,从看到Twitter用户反映到周末前发布产物,险些不需要产物司理参与。我认为这是最高效的发布方式。Product taste仍相当稀缺,任安在此方面弘扬强的东谈主,咱们险些都会雇佣。
Lenny:你的布景是工程,对吗?
Cat Wu:对,我作念了多年工程师,也在VC倏得待过,然后加入Anthropic。团队险些所有这个词产物司理要么以前是工程师,要么当今在Claude Code写代码。这有助于建立团队信任,也让咱们更快。想象师也有前端工程布景。
Lenny:对于来自工程、产物或想象布景的东谈主,哪个中枢手段最有价值?
Cat Wu:我仍然以为,归根结底如故产物试吃。当编写代码的资本骤降,决定写什么才变得更有价值。比如:这个功能怎么想象UX才对?用户如何用才会以为最爽?咱们收到上万条GitHub需求,琳琅满目。要从里面挑出哪些值得作念,况且选对终了方式,是需要好多心念念和品位的,这项智商可以来自任何布景,但我认为它才是最迫切的。工程布景之是以在至少将来几个月里稀奇有用,是因为有工程布景,对事情的难度会有更准的嗅觉,而这经常影响着选择。若是某个东西终了起来很容易,那还辩论什么,花一小时平直惩处,但如果一早就知谈它比较难,知谈把这东西委派出去,团队代价会大好多,那这就能更好地排优先级了。
Lenny:你提将来几个月,是不是在说模子在这段时候可能日积月累,到时候可能就不需要掌执那些东西了?
Cat Wu:迫切的手段变得太快,几个月后的事根底猜不准。是以我这话的重心,不是预测会有什么回荡,而是强召回荡一定会很大。
Lenny:是以,不是在说比及阿谁叫Mythos的东西出来,就会绝对改变一切,咱们都毋庸懂工程了吧?
Cat Wu:不是,好像每隔几个月,编程智商就会猛增一截,然后其他变装的含金量也随着变。最枢纽的,即是要有第一性道理的念念考方式,能看清技艺疆域在如何变,团队到底缺什么,然后二话没说冲上去补位。因为作事鸿沟越来越依稀,一个利弊的产物司理就得阐明所有这个词缺口在哪,锁定最高优先级的阿谁,再去琢磨:行,我如何把这项手段学到手?或者手里有什么本领可以拿来解决这个难题?是以,当下最需要的是那种能身兼数面、随时换挡、而且对活儿不分贵贱、一心帮团队加快的东谈主。
Lenny:我心爱这个谜底。我一直在问你们这些AI前沿玩家:超等智能到来前,东谈主脑暂时还有用武之地的场合在哪?听下来即是两点:一是决定作念什么、看准市集、定优先级;二是判断产物好不好、对不对,再把它推出去,哪怕只是个早期版块。对吗?将来几个月里,东谈主脑还能在哪些方面陆续阐明价值,还有莫得要补充的?
Cat Wu:东谈主在知识这一块,如故比模子强。任何一次产物发布,背后牵连的关节多如牛毛,好多小事看似不起眼,但随时都可能出现象。模子往往很难确实把执:都有哪些利益关系方,他们互相间是什么关系,各自有什么偏好,以及用什么方式、在什么步地跟他们调换,才调让他们一直站在这边。这种偏内隐的知识,也即是那种高情商的东西,依然稀奇寥落,咱们虽然但愿模子这块能越来越强,也信托会有那一天,但脚下来看,如故存在短板。
Lenny:看成身处龙卷风中心的东谈主,你如何草率连接握住的变化?
Cat Wu:咱们的团队是由一群向乱而生的灵魂构成的,咱们试着笑对每一个挑战,毕竟要作念的事永恒没完,风险和毒手现象也老是屡见不鲜。若是动不动就压力山大,东谈主早晚得累垮。是以咱们稀奇敬重这样一种东谈主:面对难题,他会以为“这有难度,但我等不足要试试,只管戮力作念到最好。就算不完好,晚上我也能铿锵有劲地安心入睡。”
Lenny:对于将来哪些手段会变得迫切,这个回应耐东谈主寻味。这让我想起一句话,忘了是出自谁,他说:此刻,已是寰宇所能呈现的最‘往往’的状态了。
Cat Wu:这照实会越来越难,好多时候是这样:周日晚上还在处理一个P0问题,到了周一变成更大的问题,致使下昼又升级一层。回头看会以为,有点可笑,昨天竟然那么惦记阿谁P0。但你缓慢会领略到一件事:能作念的事情是有限的,需要睡好觉,保证我方第二天能作念出正确判断,然后就是相当狠地排优先级,收拢最迫切的事情,同期接受有些事情必须放掉。咱们照实会发布一些没那么完好的产物,这点我以前会很难接受。但当今的中枢是:只须不影响最枢纽的用户价值,比如匡助专科开发者完成中枢任务,那就可以接受。剩下的可以通过反映,鄙人一轮迭代中开荒。以前如果上线一个有bug的功能,我会很紧张,但当今我能接受,因为我知谈会很快得到反映,并飞快把它修掉。
Lenny:我脑子里有个稀奇形象的画面,好像是《加勒比海盗》里的一个画面:一个东谈主从船上楼梯缓慢走下来,周围全在塌,但他稀奇淡定。而且很挑升念念的是,我领略的Anthropic的东谈主,险些都是这种嗅觉,即是很chill,很稳。
Cat Wu:即是一种偏乐不雅的心态。
Lenny:这其实是个挺挑升念念的点:在这种环境里,保持安详和乐不雅,比起那种“天啊,一切都在失控”的状态要迫切得多。
Cat Wu:是的,如果远程这种自我退换智商,其实很容易就会堕入窘迫致使疲顿。咱们在招聘时也会偏向那些有一定行业造就的东谈主,他们阅历过波动,更了解我方的节律,知谈什么能让我方归附能量,以及如何经久督察爽气状态,这对团队来说是相当迫切的。
Lenny:这点其实很挑升念念。我想深入问一下:随着工程师、产物司理等变装的鸿沟渐渐依稀,行家的职责越来越交叉,这种变化会带来哪些蚀本?比如,是否会糟蹋传统的功绩发展旅途?是否会对想象一致性或代码质地产生影响?换句话说,在这种更高效但更依稀的组织形态下,有哪些是你们明确领略到、并惬心为更大主义而接受的代价?
Cat Wu:在AI快速迭代的布景下,产物一致性在一定进程上被主动弱化。传统模式下,由于开发资本高,产物体系庸俗是高度运筹帷幄且一一双应使用场景的。而现时模式更强调实验速率,因此允许功能访佛,通过用户反映来完成形态选择。同期,高频发布带来了阐明责任。用户从“低频关注即可融会产物”回荡为“连接追踪更新以幸免错过”。这种节律在整个Agent器用生态中普遍存在。将来的枢纽在于,通过产物内的带领与老师机制,诽谤用户的跟进压力,使其从“被迫追逐变化”转为“当然掌执器用”。
Lenny:我注目到你们最近上线了一个很挑升念念的功能,叫“/powerup”。它基本是在带领用户了解Claude Code的多样高阶用法和最好实践。我很意思意思,这是不是亦然你刚才提到的那种上手带领念念路的蔓延?
Cat Wu:早期咱们的原则是幸免带领历程,强调产物应具备饱胀的直不雅性,使用户无需教程即可使用。但随着功能复杂度进步和用户鸿沟扩大,咱们不雅察到对系统化带领的需求显耀增加。用户濒临的中枢问题不再是“如何使用”,而是“在稠密功能中应优先使用哪些”。因此在这一丝上作念了策略调和,引入了内置的初学带领机制,以匡助用户聚焦最枢纽的功能旅途。
Lenny:这个行业当今照实有点反常。Anthropic在B2B企业市集取得了很大的顺利,但这个市集正本是低频发布的,比如按季度节律,而当今却变成了高频迭代,致使接近每天发布。更挑升念念的是,如果回来发轫,Anthropic其时其实处于显著障碍,资金、分发和先发上风都不占优,而OpenAI其时遥遥最初,外界普遍不看好它的经久竞争力。但当今它却终通晓相当刚劲的增长,在好多维度上也曾可以和致使突出更大的竞争敌手。是以想请你从里面视角共享一下:Anthropic能够其后居上,终了这种进取式发展的枢纽成分是什么?
Cat Wu:最枢纽的成分之一是长入的作事,其迫切性险些无法被高估。团队在招聘时就强调将安全AGI带给全东谈主类的认同,并在产物决策中连接以此看成最高原则。由于该作事优先级高于任何单一产物线,组织能够终了跨团队的快速决策与一致履行,这种以作事驱动的高效协同,在Anthropic这一鸿沟的组织中极为荒僻。
Lenny:我想再阐明一下这个点:当“安全对皆、让AI对寰宇产生正面影响”成为最中枢的作事之后,好多正本复杂的决策反而变简便了,是这样吗?
Cat Wu:在优先级冲突的情况下,团队会以Anthropic的作事与原则看成最高决策程序,从而笃定资源分拨主义。一朝达成共鸣,团队会长入履行。这意味着即使某些功能已具备发布要求,举例在Claude Code上的功能,也可能因更高优先级事项而被主动延后。
Lenny:这点很挑升念念,也在某种进程上证明了你们和另一家公司的各异,比如OpenAI,后者在好多方朝上都有探索。但从刚才的形色来看,你们的原则更简便也更严格:不安妥作事的事情就不作念。不论是应酬集中如故信息流产物,都不会进入优先级。这种高度克制,反而让Anthropic保持了相当强的聚焦,而这似乎恰是你们顺利的枢纽之一。
Cat Wu:在我看来,作事的中枢在于将Anthropic的举座主义优先级置于任何单一团队或产物之上。这与专注不同,后者更多是履行层面的智商,而作事是一种价值取向。具体体现为,团队惬心在必要时铁心自身OKRs,以换取公司举座主义的最大化,况且这种弃取是被主动接受的。在极点情况下,即使像Claude Code这样的产物未达预期,只须Anthropic举座顺利,团队依然会认为这是正确的驱散,并据此作念出决策。
Lenny:我很意思意思,你是否定为灵通CLA的决策,实质上亦然基于一样的判断?也即是当它不再有用推动Anthropic的作事时,就会豪迈调和致使住手?
Cat Wu:对Anthropic来说,一个相当迫切的主义是扩大用户笼罩范围。而终了这一丝的一个枢纽方式,即是通过咱们我方的产物来作念订阅服务,咱们会连接加码这一块。但这也意味着,偶然候对第三方产物的解救可能会有所弃取。
Lenny:刚才聊了Claude Code、CoWork这些器用。想帮行家搞通晓一件事,在执行使用中如何区分它们的?比如Claude Code、Claude桌面、网页版,还有CoWork,这三种分别安妥在什么场景下用?
产物落地与团队生态:器用场景、用户带领与发展逻辑
Cat Wu:我一般在末端里用Claude Code,主若是用在想快速跑一个一次性的编程任务,或者想用最新功能的时候。CLI是最早的产物形态,新功能基本都会先在这里上线,是以它亦然功能最强的一种方式。比如我只是想跑几个测试,庸俗就会平直用它。但如果是作念前端关系的事情,桌面端就稀奇好用。我很心爱它的预览功能,比如作念一个Web愚弄时,可以在右侧开一个预览窗口,一边和Claude对话,一边实时看到页面效用。另外,对于心爱图形界面的用户来说,桌面端也更友好。因为对好多非技艺布景的东谈主来说,末端其实挺不适合的,看起来有点复杂,还会弹出多样让东谈主垂死的指示,也不像其他软件那样可以点来点去。是以如果你不太习气末端,很保举平直用Claude Code的桌面版。
Desktop更像是一个总控视图,可以一眼看到所有这个词正在发生的事情,可以在里面检察CLI末端、桌面任务,以及在网页和手机上发起的任务,极度于一个长入的任务限度台。而网页和移动端的上风在于随时启动。CLI和桌面端都依赖土产货电脑,这其实是有拘谨的。比如你在外面漫衍,不可能一直带着电脑。我致使见过有东谈主在外面用手机给电脑开热门陆续作事,这其实说明这个场景一直缺一个更好的解决决策。对我来说,移动端最大的价值即是可以随时发起任务,毋庸带电脑,也毋庸保证电脑一直开着。
Lenny:我很心爱这种嗅觉,毋庸再经常刻刻盯着细节,更像是把任务交给AI,然后释怀让这个agent把它跑完。
Cat Wu:我当今基本停不下来用它了,CoWork解决的是一类很典型但被忽视的作事:好多任务的产出其实不是代码。比如终了Slack和Gmail的清零,或者为客户会议准备一份PPT,又或者写一份功能主义或上线磋商的文档。这些都是日常作事中相当高频的事情,但它们的输出都曲直代码。而CoWork在这类任务上稀奇强。是以我的使用逻辑很简便:如果要作念的是写代码,就用Claude Code,但只须产出不是代码,比如文档、PPT、调换内容,就会用CoWork。
Lenny:好多东谈主还在低估CoWork的弘扬,它的增长其实相当惊东谈主,但行家可能还莫得确实融会它的价值在那里。是以我很意思意思,能不可从你看成产物司理的日常作事开拔,共享几个具体的使用案例?有莫得一些比较道理,致使是预感除外的用法,可以匡助你检朴时候、完成更多作事?
Cat Wu:如果你刚启动用CoWork,第一步一定是把和作事关系的数据源全部接进来。只须有了饱胀的崎岖文,它才调确实帮你作念善事情。把Google Calendar、Slack、Gmail和Google Drive都连上,它就能主动找到关系信息、调取历史内容、致使串联不同起原的数据。这样作念之后,效用会显著进步。比如昨天晚上我在准备“Code with Claude”的演讲,其中一场是讲Claude Code如何从一个助手进化成确实的Agent,我但愿在这场演讲里展示咱们发布的产物,以及一些里面真实的顺利案例看成演示。
因为我也曾接入了Google Drive和Slack,产物营销共事Alex之前作念过一版内容草稿,平直把这些贵府全部喂给CoWork。只需要告诉它要讲的故事线,它就我方作事了八成一个小时,它会去看咱们在Twitter上的发布内容,查里面的发布频谈,还会翻团队共享demo的频谈,把这些信息全部整合起来。终末生成了一份八成20页的PPT,我第二天早上看了一下,举座也曾挺可以了。虽然如故作念了一些调和,比如个东谈主更偏好极简作风,而它一启动写得有点多。但举座来说,这个效用进步是巨大的。而且因为它接入了咱们的想象系统,作念出来的PPT视觉效用相当专科,看起来就像是Anthropic的想象师作念的一样。正本这种PPT可能要花好几个小时,当今它很快就能给我一个高质地初稿,只需要专注在把demo打磨到最好。
Lenny:这对产物司理来说简直即是空想成真,毕竟作念PPT真的很让东谈主头疼。
Cat Wu:太慢了,我方作念需要几个小时。
Lenny:而且这套PPT在你每次展示时都会被好多东谈主看到,也会在外部流传,显著它不是一次生成的,而是经过多轮迭代优化的。如果让行家我方动手尝试这个历程,第一步是团结这些器用,比如你提到的Slack。那么除此除外,你还建议他们接入哪些器用?
Cat Wu:建议接入Slack、GoogleCalendar、Gmail、GoogleDrive等器用,将团队关注事项、个东谈主优先级以及现时作事内容的中枢数据源长入买通,看成决策和息争的基础。
Lenny:阐明了,那你其时八成是如何写prompt来生成这份PPT的?
Cat Wu:我其时是这样跟Claude说的:帮我作念一份“Code with Claude”大会的PPT。这是产物司理M建议要笼罩的内容,那是我的一版草稿,我不太舒服,还有一版是我我方手动作念的,也不太好,不外我也通盘发给你。先帮我整理一个更完整的内容大纲,况且尽量幸免和更迫切的主题演讲重复。然后Claude会去读我给它的那些流畅,生成一个初步的大纲。我再把它给的决策过一遍,看它冷落了哪些念念路和主义,终末由我来决定哪些内容要放进最终版块里。
这碰巧说明了当今产物司理的价值所在。像Claude这样的器用,是一个相当强的念念考伙伴,可以快速整合多半信息,把多样可能的主义都摆在你面前,但最终拍板的东谈主如故产物司理,需要决定什么才应该进入最终产物。比如在这个案例里,我终末决定内容结构是一个递进过程:从进步土产货任务的顺利率,到让每一个PR都得手通过,再到匡助工程师完成更多PR。同期,我还要为每一部分挑选最有劝服力的演示方式。当这个框架笃定之后,Claude基本就可以我方完成剩下的作事,它花了几个小时就把整套PPT作念出来了。
Lenny:这真的太爽了,极度于作事里有一块可以绝对交给AI来作念。而且嗅觉就像在和一个PPT想象师合作,但这个想象师不仅会想象,还确实融会你作念过的内容,能把内容和呈现通盘作念好,而不单是让它看起来更漂亮。
那我很意思意思,你是如何处欲望象系统这一块的?它具体是如何作事的?又是如何学会Anthropic的想象表率的?
Cat Wu:咱们本来就有一套用于所有这个词对外场景的程序演示模板,把这套模板平直交给Claude,让它学习咱们的配色、字体,还有不同类型的页面结构,当今它极度于有二十页示例可以参考。
Lenny:你极度于是上传了模板,让它基于这个来作念。
Cat Wu:对。你也可以团结我方的Figma integration,如果你的幻灯片模板是存在那里,它也可以平直拉进来用。
Lenny:看成一个产物司理,在Anthropic,你的器用栈八成是什么样的?治服有Claude Code、CoWork,还有Anthropic 自家的器用。你还在用什么?你刚刚提到Slack,还有别的吗?
Cat Wu:我的器用栈基本上即是重度依赖Claude Code、CoWork和Slack。Anthropic基本上是跑在Slack上的,它有点像咱们公司的中枢操作系统。日常作事里,我八成有30%的时候是在握住试探CoWork和Claude Code的智商鸿沟,这样我能相当通晓地知谈它们面前作念不好的场合。同期我也会花好多时候和模子对话,去融会它为什么会犯那些罪戾。
从手动制作到AI生成,AI器用正在显耀进步作事效用
Cat Wu:咱们里面也作念了好多器用。Claude Code给整个公司带来的一个迫切变化是,它极大诽谤了开发自界说愚弄的门槛。于是你会看到一个景观:行家启动多半构建个性化作事软件,针对相当具体的使用场景,而不是再去用那些并不完全契合需求的通用器用。
Lenny:有什么具体例子吗?你们我方或者别东谈主作念过哪些稀奇受迎接、稀奇有用的东西?
Cat Wu:咱们Claude Code团队里有个作念销售的共事,他发现我方一直在反复作念一样类型的PPT,一遍又一遍。于是他作念了一个Web愚弄,里面内置了那些咱们已造就证效用很好的Claude Code PPT模板,比如101、201,以及Mastering Claude Code。
然后他作念了一套输入机制,可以把客户的具体布景信息拉进来,这些信息来自Salesforce、Gong,以过甚他札记系统。这样咱们就可以针对每个客户定制PPT。比如,它会自动索求信息:这个客户在用的是Bedrock、Claude for Enterprise,如故Console。这会平直影响他们能用哪些功能。
它还会识别,比如这个客户稀奇关注SLC(软件人命周期)里的代码审查阶段,那咱们就会自动加一页先容咱们代码审查功能的幻灯片。再比如,如果客户有HIPAA合规要求,或者有特定的安全限度需求,它也会自动在PPT里加上关系内容。还有一种情况,如果客户是在Vertex或Bedrock上运行,而且不策画用Claude for Enterprise,那咱们就会自动删掉那些只适用于Claude for Enterprise的幻灯片。
这些作事本来都是手动作念的,庸俗要花20到30分钟。好多东谈主要么花时候作念,要么干脆就不作念,平直用通用PPT。但当今,用这个器用只需要几秒钟,就能生成一个完全定制化的PPT。
Lenny:像Slack这种器用,险些莫得东谈主想我方再行造一个。Slack就一直在赢。你刚才说它有点像好多公司的操作系统,这个比方很贴切。比如行家当今会说,像Salesforce这种SaaS,其实不一定还需要,咱们可以我方作念。但Slack就不一样,它就像一个很讨喜的器用,莫得东谈主真的想去跟它竞争、再造一个更好的版块。
Cat Wu:它实质上是一种相当枢纽的通讯基础设施。而且在最中枢的一丝——让所有这个词东谈主实时得到更新,它作念得相当相当好。
Lenny:好多东谈主嘴上会吐槽Slack,但它在我方要解决的问题上作念得稀奇好。最前沿的团队基本都离不开它。
Cat Wu:是的。我也很心爱它在可定制性上作念得相当简便。比如咱们很心爱作念Slack bot,这种高度的可定制性让咱们可以按我方的方式把多样系统接入Slack。在这一丝上,照实很招供Slack的想象。
Lenny:你刚刚提到好多不同的团队,以及他们是如何使用Claude code和CoWork来作事的。除了工程团队除外,哪个团队用的token最多?我猜工程团队应该是最大的token消耗方。当今排第二的是哪个职能?
Cat Wu:Applied AI团队在握住推动Claude code和CoWork的智商鸿沟,这一丝相当显著。咱们好多Applied AI团队成员都会花时候和客户通盘作事,匡助他们在公司里面落地咱们的API。是以偶然候,他们会平直替客户作念一些原型,而在这方面,Claude Code比较以前,速率进步相当显著。
同期,他们还要处理多半客户调换,包括客户的历史崎岖文、会议记录、通话札记等等。是以他们在CoWork和Claude Code上的使用相当频繁。
Lenny:我想更具体融会一下Applied AI。它是不是有点类似forward-deployed engineering(前列部署工程)这种变装?一般东谈主会如何形色这个团队在作念什么?
Cat Wu:可以这样融会。他们的中枢即是匡助客户在整个公司范围内,落地最新的API和模子智商,既包括客户对外产物,也包括里面效用进步。
Lenny:可以融会为一个交融客户服务、业务拓展与技艺落地智商的复合型团队。这个团队的token使用量,可能是第二高的?
Cat Wu:是的。而且咱们也看到他们在握住探索CoWork的智商鸿沟。比如,这些东谈主庸俗要同期负责多个客户,偶然候一天要参加5到10场客户调换。他们一个很典型的用法是:在前一天晚上,让CoWork帮他们总结:来日所有这个词的客户会议有哪些?每个客户最近都提了什么需求?他们现时最热心的是什么?已往会议的待做事项是什么?
CoWork会自动整理出一个贵府包,也即是一个简报,让他们在进入下一场会议前一目了然。此外,CoWork还能帮他们作念信息检索。比如客户问:“某个功能什么时候上线?”CoWork可以平直在Slack里查找最新的ETA(瞻望时候),把驱散整理进札记里。这样在客户通话时,他们拿到的即是最新信息。这些都是职工我方搭出来的作事流,然后在团队里面共享使用。
Lenny:有一个最近庸俗被拿起的问题,或者说一种趋势,即是token的铺张启动突出东谈主的薪资。也即是说,东谈主们使用AI的资本,致使可能高于他们我方赚的钱。有莫得一些数据在流传,比如工程师或者产物司理一个月或一天八成会消耗几许token?
Cat Wu:随着模子智商的进步,东谈主们会把越来越多的任务寄予给它,同期也会在像Claude Code 和CoWork这样的器用上花更多时候。因此,每当模子出现一次跃迁,或者产物有显耀改良时,单个工程师,或者更广义上的知识作事者的东谈主均token资本都会飞腾。面前这个资本仍然远低于一个普通工程师的薪资,但它所占的比例正在渐渐提高。
Lenny:你们能战争到最前沿的模子,这自身即是在Anthropic作事的一大上风。你们基本上是无穷token,可以怪异用,对吗?
Cat Wu:咱们可以用好多token,不外也有东谈主会碰到为止。
Lenny:领有最先进模子会带来这样多上风,这就像一个启动握住加快的飞轮效应。
Cat Wu:咱们也相当爱好让里面团队尽可能快地推动作事。同期,咱们也信托行家都融会运行这些模子背后的真实资本,会负责任地使用token。阔绰token是不被饱读吹的,但咱们也信托每个东谈主都能我方作念出判断。
Lenny:回到产物司理这个变装。在当今这个阶段,产物司理需要具备哪些正在出现的新智商?或者说,AI公司在招聘产物司理时最敬重什么?
Cat Wu:最难的一项智商,是能够界说“一个月之后这个产物应该长什么样”。在这个时候程序上,模子到底能作念到什么、用户步履会如何变化,都存在很大的不笃定性。但优秀的产物司理能从用户如何冲破现时产物鸿沟的方式中,看到一些模式。最优秀的产物司理能感知这些信号,设定主义,并连接推动履行;同期,如果模子智商的发展比预期更好或更差,也能实时调和旅途。
还有一丝很难,即是在面对AGI这个终局时,保持一种恰到自制的判断力。行家都能想象这样一个将来:模子相当机灵,险些可以完成一切任务。在那种情况下,你根底不需要一个复杂的产物。你可能只需要一个输入框,告诉模子你想作念什么。模子饱胀机灵,它可以我方调用器用、接入多样系统来完成任务;它知谈什么时候不笃定,也会主动冷落清爽问题。
从这个角度来看,为一个超等AGI想象产物其实是很容易的。确实难题的是:在现时模子智商还有限的情况下,你如何把它的智商最大化地引发出来?如何匡助用户进入一条最好使用旅途?如何带领用户阐明模子的上风,同期弥补它的不足?这种智商是相当稀缺的。
Lenny:这种智商是如何培养出来的?实质上是不是去融会每一个模子的智商鸿沟,比如你刚才说的那种“试吃”,对模子能作念什么、擅长什么、不擅长什么,以及它在哪些场合发生了变化,有一种判断力?
Cat Wu:中枢如故要花多半时候去使用模子、和模子对话。有一件我稀奇心爱作念的事情,即是让模子对我方的步履进行自我反念念。偶然候我会发现模子作念了一些不太安妥预期的操作。举个例子,有些情况下模子会去修改前端代码、跑测试,但却莫得确实去使用UI。
这种时候,很有价值的一件事是平直问模子:你为什么会这样作念?偶然候它会回应说,系统指示里有些场合让它产生了扭曲;或者它莫得领略到前端考证是这个任务的一部分;又或者它把考证作事交给了某个子Agent,但这个子Agent莫得履行测试,而它我方也莫得去搜检驱散。
好多时候,只须你对模子为什么会作念出这个决策保持饱胀的意思意思心,就能发现它是在哪一步被误导了,从而可以去调和整个运行框架,把这个问题补上。
另外一个很有匡助的方法,是找出那些你最信任的用户,他们能给你对于模子的高质地反映。庸俗会有少数几个东谈主,在形色“某个模子+某种运行框架为什么好用”这件事上,比其他东谈主更表示、更准确。虽然,会有好多东谈主给你反映,但不是每个东谈主的反映都一样有价值。是以找到那样一小群你确实信任的、比如五个东谈主把握的用户,对于快速得到有用反映相当枢纽。
第三点是一个很有用、但不是每个东谈主都心爱作念的事情,即是构建评估体系。你不需要作念上百个评估才调产生价值,只需要作念十个高质地的评估,就能很好地匡助团队明确主义、斟酌进展,以及发现现时的不足。评估这件事被低估了,应该有更多产物司理和工程师参与进来。
Lenny:咱们之前其实聊过不少对于评估的话题。当今有一种趋势是,将来的产物照顾,很猛进程上即是在写评估,因为评估实质上界说了什么才算顺利。也即是说,你可以把顺利程序具体化,一朝界说通晓,就知谈我方是否达到了。那你我方八成会花几许时候在写这些评估上?
Cat Wu:评估的迫切性,取决于你在作念的具体功能,或者你要解决的问题类型。咱们团队里有不少东谈主会花好多时候在评估上。还有一个小团队,会和研究团队相当详尽地合作,更精准地融会Claude Code的步履,以及现时最大的改良空间在那里,并尽可能用量化的方式去斟酌这些问题。
对我来说,一般是在某个功能还需要进一步明确产物界说时,才会亲身下场作念评估。庸俗产出会是这样:我作念了五个评估,这是运行方式,这些是顺利的案例,这些是失败的案例,以及这是我用来进步顺利率的指示词。虽然,这个进入会因功能而异,并不是所有这个词功能都需要。但像驰念这类功能,就会从评估中获益很大。
Lenny:你刚才说,有些东谈主稀奇擅长评估模子。某种进程上,这些东谈主自身就像一个评估器,他们能判断模子在哪些场合弘扬杰出、在哪些场合不足。有莫得某些具体的东谈主,在这方面稀奇利弊,值得点名表扬一下?
Cat Wu:在这方面作念得相当出色的有两类东谈主。一个是Amanda,她主要负责塑造Claude的“变装”。这是一个相当难的作事,因为这个任务自身极其依稀。哪怕是作念编程,相对来说都更容易一些,因为你可以考证驱散是否正确;但塑造变装这件事,需要对Claude应该成为什么样的存在,有一种相当强的判断力和笃定性。她不仅在塑造这个变装上智商很强,而且还能表示地抒发:主义是什么,这个变装什么算顺利,什么不算顺利。
另一类我相当信任的东谈主,即是Claude Code团队。咱们庸俗融会盘吃团队午餐,每当有新模子在测试时,咱们获取反映最快的方式之一,即是在这种步地挨个去问行家:你对这个模子的举座嗅觉如何样?
庸俗咱们会得到一些很直不雅的反映,比如:这个模子莫得很好地证明它的念念考过程,语言太平直了;或者这个模子稀奇心爱写好多可复用崎岖文驰念,但咱们不笃定这些驰念的质地到底如何样;又或者有东谈主会注目到,这个模子很心爱自我测试,这很好;也有东谈主会说,这个模子自我测试还不够。
这些反映会匡助咱们判断接下来应该去看哪些数据,从而考证:这是不是一个更普遍的景观。咱们有相当多的数据,但要从中提真金不怕火出知悉是相当难题的。是以,这一小群东谈主的反映会匡助咱们明确:咱们应该冷落哪些假定,然后再去用数据考证这些假定。
Lenny:你刚才提到Claude的“变装”,我之前在播客里请过Ben Mann,他也谈到过这一丝——Claude的“性格”或者说“步履准则”,其实是相当中枢的一部分。我亦然其后才领略到,比如在Open Claw这样的场景里,好多东谈主之是以会感到失意,其中一个原因即是Claude的“个性”。因为Claude的性格比较其他模子来说,照实更好玩、更道理、更有诱导力。
他的说法是:恰是这种“性格”,让Claude在好多事情上弘扬得更出色。乍看之下,这好像只是一个很边际的点,比如让它更道理一丝、更会聊天一丝,但执行上它对Claude的顺利至关迫切。从你的角度看,为什么你所说的这种“变装”或“性格”会这样枢纽?有哪些是行家可能莫得领略到的?
Cat Wu:如果你记忆一下我方合作过的所有这个词东谈主,总有一些东谈主是你会以为:我真的很心爱和他们通盘作事的那种嗅觉,我很心爱他们的气场或者说氛围。当东谈主们谈到Claude和Claude Code时,这是被提到最多的一丝之一,行家真的很心爱Claude的那种舍弃、道理的嗅觉。
但与此同期,它在完成任务时又相当专科、相当可靠。行家也很心爱Claude的“低ego”。如果你告诉它:“你这里作念错了”,它会真的很对不起,会说“哦,照实是我错了,谢谢你指出来,我来改一下,咱们通盘把它作念好”。它也相当积极。如果你以为一件事情很难、无从下手,Claude会说:“不要紧,咱们可以一步一步来。这是我建议的要领,你需要我帮你先启动吗?”
一个优秀的息争伙伴,往往具备这种积极性、这种偏向举止的倾向,以及一种能够给出至意反映的智商,而不是对你说的每一句话都奖饰。是以咱们会刻意把这些性格注入到Claude里,因为咱们认为,这会让它变得更容易合作,也更让东谈主惬心与之通盘作事。
随着模子智商进步,产物功能在删减与重构中握住演进
Lenny:你刚才提到,每当新模子发布时,你们往往需要再行凝视之前作念过的东西。这点可能挺让东谈主颓废的。就像是,好曲折易把一个功能上线了,驱散当今又得再行念念考一遍。能不可讲讲这种情况八成有多频繁?比如新模子一出来,你们就会以为,几个月前上线的这个产物得再行作念一遍了。
Cat Wu:咱们在新模子发布后作念的好多调和,其实是删除那些也曾不再需要的功能。好多时候,咱们之是以在产物里加某些功能,是因为模子自身还作念不到,需要这些功能看成缓助。一个很典型的例子即是待办列表。
在咱们最早发布Claude Code的时候,用户会让它去作念一些大鸿沟的重构。Claude Code会说,好,我需要修改这20个调用点,然后它可能只改了其中5个就停驻来了。于是咱们就在想,如何让它记着必须把这20个全部改完?团队成员冷落,可以从东谈主类的作念法开拔。东谈主庸俗会先列一个清单,把所有这个词需要修改的场合列出来,就像你在VS Code里查找所有这个词调用点,左侧会列出一个清单,然后你一一处理、全部替换。
那咱们能不可给Claude一个类似的器用?于是他就加了待办列表。驱散咱们发现,有了这个之后,Claude照实可以把这20个调用点全部处理完。但到了Opus 4以及之后的模子,咱们发现,不需要再强制它使用这个待办列表了,它会当然地这样作念。
在更早的模子里,咱们需要握住提醒它:你是不是也曾完成了待办列内外的所有这个词事项?只须全部完成才调收尾任务。而在新的模子里,即使不指示,它也会自觉地把这些事情全部作念完。当今来看,待办列表对用户来说仍然是一个可以的功能,因为你可以更通晓地看到Claude正在作念什么。但从模子自身的智商来说,这也曾不是一个枢纽组件了,它用毋庸这个功能都不影响它完成完整的修改。
Lenny:有东谈主在播客里说过一句话:模子会把你的运行框架“当早餐吃掉”。换句话说,随着模子智商握住进步,那些也曾为了让模子按预期作事而叠加上去的机制,会被渐渐剥离。模子自身变得越强,就越能够平直完成你想要的任务,产物反而会变得愈加简便。
Cat Wu:是的。每当模子变得更强,咱们都可以删掉好多指示层面的侵犯。咱们每次发布新模子时,都会作念一件事:把整个系统指示从新到尾读一遍,逐条判断,这些提醒当今还需要吗?如果不需要,就删掉。不外,新模子带来的最令东谈主振作的,是全新的功能智商。
有好多功能,咱们在之前的模子上也曾尝试过,但因为准确率不够高,一直莫得认真上线。比如代码审查。咱们尝试过好几次作念代码审查产物,也上线过一些比较简便的版块,比如之前的/code-review敕令。但一直到最近的模子,咱们才确实以为,这个功能也曾好到可以依赖了。
当今,咱们的工程团队在合并PR之前,会依赖这个代码审查来通过。咱们一直但愿Claude能成为一个可靠的代码审查员,能够捕捉大部分bug,而这一丝直到Opus 4.5、4.6,以及Sonnet 4.6之后才确实终了。当今咱们可以同期运行多个代码审查Agent,遍历整个代码库,然后轮廓输出一组工程师在合并前需要解决的真实问题。这是新模子解锁的一种全新智商。
Lenny:这也让我猜测一个在这个播客里庸俗出现的趋势:去构建那些可能在将来六个月内才确实可行的产物。你其实是在智商鸿沟隔壁作念东西,然后随着模子智商追上来,它就会变成一个相当出色的产物,而你也会最初其他东谈主。
Cat Wu:是的。去构建那些暂时还跑欠亨的产物相当迫切,因为这样你才调知谈,这个产物要确实成就,还缺什么。比及新模子出来,你只需要把它替换进你也曾作念好的原型里,就可以考证:这个新模子有莫得把之前的差距补上。
Lenny:你能不可讲讲,像Claude和CoWork这些产物举座的经久主义八成是什么?你可能不便捷透露太多具体主义,但嗅觉当今握住在往上叠增多样很酷的功能,比如Dispatch、手机端限度、多样移动愚弄等等。从一个更宏不雅的角度,行家应该如何融会这些东西的经久愿景?
Cat Wu:咱们是用构建模块的方式来念念考这个问题的。对于Claude Code和CoWork来说,最中枢的构建模块是:让单个任务顺利完成。也即是说,你给它一个表示的需求形色,它能不可恬逸地产出一个可接受的驱散,这个驱散可以平直合并、共享给共事,或者对外使用。
是以,任务是最基本的单元。随着模子越来越强,单个任务的顺利率会显耀提高。接下来咱们看到的趋势是,东谈主们启动同期处理多个任务。到2025年底,多任务并行也曾成为一个很迫切的趋势,而且当今还在连接增强。也即是说,从一个任务可以作念好,发展到可以同期作念六个任务。
再往前推演,当模子更强时,也许你会同期运行50个致使上百个任务。那问题就变成:咱们需要什么样的基础设施来撑持这一丝?到阿谁阶段,你很可能也曾无法再在土产货机器上运行所有这个词东西了,因为内存根底不够。是以咱们在念念考,如何让你更容易去照顾这些任务?它们很可能会运行在而已环境中。
咱们还要念念考,如何想象一个界面,让你看成东谈主类,可以快速知谈哪些任务需要关注?如何确保Agent能够充分考证我方的作事,这样当它告诉你“也曾完成”时,你可以很快阐明,况且确实信任这个驱散安妥你的要求?还有一丝是,如何让整个历程具备自我改良智商?当你发现某个任务驱散不安妥预期时,你可以给出反映,而模子在之后的所有这个词运行中都能经受这个反映,不再重复一样的罪戾。
这即是咱们但愿带着用户通盘走的演进旅途。
Lenny:当今有好多东谈主在听这个播客,包括产物司理、创业者,还有多样跨职能变装的东谈主。行家其实都在惦记我方的变装、以及功绩将来会怎么变化。你会给他们什么建议?不仅是如何活下来,而是如安在这个高度由AI驱动的寰宇里确实变得顺利,致使作念到脱颖而出?有哪些是行家此刻确实需要认清的,以及需要启动去作念的事情?
Cat Wu:AI给了每个东谈主远超以往的杠杆。一朝你发现我方在重复作念某个手动任务,就去想:能不可用代码、CoWork,或者其他AI器用,把它自动化掉?大多数东谈主都有这样的作事结构:有一部分是我方很心爱的创造性作事,另一部分是相当繁琐、重复、让东谈主不想作念的事情。AI的价值就在于,它可以帮你完成这些重复作事。
它可以从你每一次手动操作中学习,总结法例,然后自动履行。这样你就可以把元气心灵联接在更有创造性的部分上,也意味着你能完成的事情会比以前多得多。是以我最平直的建议是:找出那些可以交给CoWork处理的重复任务,握住优化这些自动化历程,直到顺利率饱胀高。
然后再去念念考,你还能为团队、为产物、为公司作念哪些以前莫得元气心灵去作念的事情?有莫得那些你一直以为公司应该作念,但从来没偶然候推动的神情?如果AI能帮你承担那些基础性的作事,你就极度于多出了20%的时候,而这些时候以前是不存在的。主动拥抱这些器用,把那些你不想作念的作事交出去,找到它们能为你带来的加快效用。这样一来,你能作念的事情会远远突出已往。
自动化的鸿沟,不在于能否终了,而在于是否饱胀可靠
Lenny:你刚才共享的一个中枢不雅点是去找那些可以用AI解决的问题。当今这些器用的后劲都很大,但对好多东谈主来说,最难的一丝其实是:我到底该作念什么?
你这里的真谛是,要多钟情那些你反复在作念的事情,望望能不可把它们自动化;同期也可以关注那些你一直有想法、但一直没时候作念的事情。实质上即是——先为我方解决问题,这是最中枢的建议。
Cat Wu:没错。另外我也会建议行家,把注眼力放在一件事上:把自动化从“这是个挺酷的认识”,推动到“这个东西真的可以100%恬逸运行”。我偶然会看到一些用户,把某个自动化作念到90%或95%的准确率,然后就销毁了。但如果一个自动化不可作念到100%,它其实就不算确实的自动化。
而终末那5%到10%,照实需要进入更多时候。而且,构建自动化的过程,往往比你我方手动完成还要慢。我会建议行家,花时候去打磨那些你真的但愿作念到100%的自动化。多下点功夫,把你的偏好教给CoWork,多给它反映,让它握住进步智商,直到达到完全可靠的进程。只须作念到这一丝,你才调确实依赖它。95%的自动化,其不二价值不大。
Lenny:这对我来说是个很好的提醒。
Cat Wu:我我方也有这个问题。我一直在锻真金不怕火CoWork,想让它帮我把Gmail的收件箱作念到清零。但这个过程相当耗时,而且当今还远远没达到欲望状态。
Lenny:说到这个我也有同感。我作念过一个历程:每收到一封邮件,它都会判断哪些是垃圾信息,比如多样“能不可上你的播客”“要不要望望这个”的邮件,我根底没时候处理。
然后我让它把这些邮件分类到一个叫“疑似垃圾”的文献夹里。这个历程八成有95%的效用都很好,但问题是,偶然候会把迫切邮件也误放进去,驱散我就错过了。这提醒我要陆续优化,把它作念到确实可靠。
Cat Wu:咱们也在努力让这种自界说历程的体验变得更简便。因为当今的历程如故有点复杂,你需要融会好多认识,比如要界说一个手段、要调用这个手段、要握住给它反映,然后还要告诉CoWork把柄这些反映去更新这个手段。
同期你还需要知谈去那里检察这个手段,阐明它是否按你的预期更新了。让这一整套历程变得更顺畅,亦然咱们的作事之一,这样用户在使用时就不会以为很倒霉。
Lenny:在进入闪电问答之前,还有莫得什么你稀奇想补充的内容?有莫得什么你但愿听众带走的重心,或者你想再强调一下、但咱们还没聊到的?
Cat Wu:我看到好多东谈主在尝试AI,作念一些原型愚弄,或者搭一些作事流。但我会更建议行家去作念那些你每天都会用到的愚弄。因为只须在真实使用中,你才调确实得到价值。如果你作念了一个原型,但它并莫得帮你提高效用,那AI其实并莫得为你的日常作事带来执行价值。
Lenny:而且如果只是作念一次、以为挺酷,然后就再也毋庸了,你能学到的东西是很有限的。
Cat Wu:这样其实也拿不到太多确实的杠杆。有一类东谈主会花多半时候去定制我方的作事流。某种进程上可以说有两个极点:一类东谈主完全不作念定制,也不作念自动化;另一类则走向另一个极点,会相当执着于优化我方的器用,比如加好多手段、MCP,以及多样作事流优化。
但偶然候,这反而会分散注眼力,让你偏离最中枢的主义,比如发布产物、或者确实把某个功能作念出来。虽然,定制自身是很道理的,咱们也照实但愿把产物作念得饱胀可蔓延,让你可以按照我方的方式去使用。但这种优化是有鸿沟的。有一类东谈主可能会在定制上花太多时候,致使影响睡觉,反而莫得去完成他们一启动想作念的中枢任务。
Lenny:我在Twitter上庸俗看到这种情况。行家都在展示我方的配置,说你看我的setup,有多复杂、多极致优化。但问题是,你到底在作念什么?“我当今还没在作念具体的东西,但我的setup超强,我能作念好多事情。”
Cat Wu:简便的配置反而更有用。
Lenny:昨天Andrej Karpathy发了一条很挑升念念的推文,讲到一个分化景观:有一类东谈主早期尝试过ChatGPT,以为不如何样,就销毁了,对AI的智商也变得很怀疑,以为这东西没什么大不了的。但另一类东谈主,尤其是用它来写代码的东谈主,也曾看到了它确实的矫健智商,知谈它可以作念到什么进程。
而这两类东谈主互相很难融会对方是如何看寰宇的。是以你刚才的建议真的很枢纽:把它用在真实的问题上,才调确实感受到它也曾进化到什么进程。
Cat Wu:一个很大的变化是,2024年那一代产物主若是基于对话的,而像Claude Code这一代产物,更偏向举止导向。好多东谈主确实的顿悟时刻,是在发现模子可以平直帮你完成事情,而不单是是告诉你该如何作念。当你领略到Agent不单是给建议,而是可以确实替你履行任务,这种体验是相当颤动的。一朝体验到这一丝,好多东谈主的阐明都会被绝对改变。
Lenny:趁机提一下阿谁Chrome蔓延,你可以平直看着Claude帮你作念事,比如你说“帮我填这个表单”,它就真的启动操作了。好,在进入咱们接下来相当精彩的闪电问答之前,还有什么你想补充的吗?
Cat Wu:莫得,咱们来吧。
快问快答
Lenny:咱们有五个问题要问你。第一个问题,你最常保举给别东谈主的两三本书是什么?
Cat Wu:我很心爱《How Asia Works:Success and Failure in the World's Most Dynamic Region》,它讲的是经济发展,以及哪些战术和政府能够打造出经久顺利的经济体。另外一册我也很心爱的是《The Technology Trap:Capital, Labor, and Power in the Age of Automation》。这本书主要讲已往几次技艺转换,比如工业转换和诡计机转换,以及这些变化是如何影响作事者的。我之是以很心爱这本书,是因为咱们可以从历史中学到好多,从而确保这一次转型能够走得更好。如果说舍弃一丝的读物,我很心爱《The Paper Menagerie》。它是一个短篇演义集,讲成长、AI,以及自我阐明。
Lenny:最近有莫得什么你稀奇心爱的电影或者电视剧?
Cat Wu:我很心爱《Drive to Survive》。它莫得什么稀奇深切的意旨,看到东谈主们如斯专注于一个单一的工程主义,自身就很让东谈主知足,那种纯正的进入感很诱导我。
我也相当心爱《Free Solo》,讲的是Alex Honnold在莫得任何保护装备的情况下攀高酋长岩(El Capitan)。这一样是一种相当纯正的成就:去完成一条极其难题、极其危境的道路,而且需要极强的神色专注力,因为只须犯一个罪戾,就意味着升天。
Lenny:那部电影真的让东谈主难以置信。这些内容某种进程上也和你的作事有点呼应。
Cat Wu:我我方也会攀岩。我是在看完《Free Solo》之后才启动攀岩的,其时只是以为很利弊,但并莫得完全融会它到底有多利弊。这是一部很有数的电影:你对这件事了解得越多,就越会被颤动到它到底有多不可念念议。像他在岩壁上作念的那些动作,就算是在室内攀岩馆、离地只须一英尺的场合,我这辈子可能都作念不到。
Lenny:你有莫得看过另一个东谈主的记载片?阿谁更年青的,在冰面上攀高的阿谁。
Cat Wu:看过。阿谁挺让东谈主愁肠的。
Lenny:但照实也很颤动。好,下一个问题。最近有莫得发现什么稀奇心爱的产物?
Cat Wu:如果说除了云产物除外,对我生计影响最大的一个产物,八成是Waymo。我是个相当忠实的Waymo用户,每天崎岖班都会用,一天两次。我最心爱它的两点是:第一,如果车在等我,我不会有责任感。是以我毋庸在它刚到的时候就必须坐窝站在路边等着。
第二,它让我更高效。如果车里是一个东谈主类司机,我庸俗不会去接作事电话,也不太会一直在电脑上作事,会以为有点不端正。但在Waymo里,我可以平直开会,毋庸惦记被东谈主听到,也毋庸磋议会不会不端正,或者语言声息会不会太大,也毋庸去让别东谈主调音乐之类的。这个产物每天八成帮我“多拿回”了30分钟时候。
Lenny:这些技艺带来的“二阶效应”(ZP注:不是平直驱散,而是由它引发的一系列蜿蜒变化)真的很挑升念念。
Cat Wu:是的。我以前一直以为Waymo要想顺利,价钱必须比Uber和Lyft更低。但当今我很乐意为它付出两倍的价钱。
Lenny:我也很心爱Waymo。第一次看到的时候会以为,这也太不可念念议了;但用着用着,就习以为常了。
Cat Wu:它致使改变了行家的语言方式。在Anthropic,好多东谈主都很心爱用Waymo。以前行家会说,“咱们叫个打车软件吧”,但当今行家会平直问:“Waymo到了吗?”
Lenny:好,终末两个问题。你有莫得一句我方很常记忆的座右铭?不管是作事如故生计。
Cat Wu:即是一句话:去作念就对了。从第一性道理开拔去念念考是很有价值的。如果你通晓我方的主义,也有比较塌实的第一性原则,那庸俗是可以推导出正确的举止旅途的,而且也能表示地向关系各方证明通晓。接下来就应该去作念。
“岗亭”这件事自身有点被高估了。如果你融会了拘谨要求,你就能知谈我方可以作念什么。然后即是尽快去尝试,从罪戾中学习。如果作念错了,就谈歉,或者修正。
把这个理念讲给行家听,其实是一种解放。因为在好多公司里,变装分歧是相当严格的,比如这是产物司理的职责,这是想象师的职责,这是工程师的职责。致使团队的职责范围也被分歧得很死,比如这块代码咱们可以动,那一块咱们就不可碰。
而“去作念就对了”带来的变化是,它会让东谈主更有自主性,勇于作念决策,也勇于进取团队鸿沟去推动事情,只为了把事情确实作念成。
Lenny:这听起来像是一项相当迫切的智商。好多东谈主把它叫作念agency,实质即是去作念那些该作念的事情。还有东谈主会说“偏向举止”“举止优先”,都是在形色归并种智商——不等别东谈主批准。
Cat Wu:是的。这是东谈主生中某个阶段一定要去创业公司作事的一个迫切原因。对我来说,一个相当改变东谈主生的阅历,是在一家只须20东谈主鸿沟的公司里作事。其时基本莫得什么历程,但咱们要解决的问题却相当大。
我很戴德Alex和团队里的其他东谈主,他们给了我以及团队其他成员充分的解放,让咱们可以在莫得明确鸿沟的情况下我方去摸索,不再有“销售该作念什么”“运营该作念什么”“工程师该作念什么”这种为止。你手里有所有这个词可用的器用,有一个浩繁而复杂的问题需要解决,你可以用任何方式去找到一个好的谜底。
Lenny:某种进程上,你可能必须阅历过这样的环境,才调确实培养出这种智商,才调在神色上对这种作念事方式感到适意。好多东谈主从学校一齐走来,习气的是“按要求完成任务就能拿到好收货”。你需要反学习这种模式,转而变成:我要去作念那些确实需要被作念的事情。哪怕别东谈主以为这很蠢,但我认为这是正确的,我就去作念。
好,再来两个快问快答的问题。当Claude在念念考时,会用到一些“动词”?这些东西应该如何名称?
Cat Wu:咱们叫它“thinking words”(念念考词)。
Lenny:这些词其后在源码里也被曝光了。你有莫得稀奇心爱的一个?
Cat Wu:我很心爱manifesting(显化)。我电脑上还贴了这个词的贴纸。
Lenny:这个选得很好。终末一个问题,咱们也会问好多嘉宾这个问题。如果AGI在咱们豆蔻年华真的终通晓,致使你不再需要作事了,你会作念什么?你会如何使用你的时候?
Cat Wu:AGI在社会中的普及还需要很万古候,是以短期内更迫切的事情,是匡助整个寰宇通盘走到阿谁阶段。如果说一个不那么严肃的谜底,在那之后我八成会去多攀岩。我可能会搬到Fontainebleau,在那里和层见迭出块巨石通盘生计,专心攀一段时候。
我还有好多书想读,我的主义是每周能读一到两本,但当今八成只须每周0.5本,积压的书也曾好多了。咱们能从历史中学到的东西太多了,还有好多我想融会但还不够了解的领域,比如物理、机器东谈主、硬件、航空航天等等,都是相当挑升念念的话题。是以我很期待陆续学习,哪怕AGI早就也曾知谈这些知识。
Lenny:谢谢你的共享。Cat,相当感谢你今天的参与。
Cat Wu:谢谢邀请。
原文:How Anthropic’s product team moves faster than anyone else | Cat Wu (Head of Productj9九游会, Claude Code)https://youtu.be/PplmzlgE0kg?si=IJIjrCcvlZroq-13编译:Evelyn Zhang、Eleanor Liang
- 上一篇:j9九游会官方本届世乒赛濒临很大的挑战和压力-九游娱乐(中国)有限公司-官方网站
- 下一篇:没有了
