每周AI观察:Vibe Coding时代的面试

Cover created with Nano Banana 我们组的面试方式变了。 从写leetcode题变成让候选人实现一个完整功能。如果你不用AI编程,除非手速超快,否则根本完不成。这种改变看似只是工具的升级,但实际上正在重塑我们对"优秀工程师"的定义。 差距被放大了 原来的算法面试,写不出来和写得出来之间,可能只是一个提示的差别。但现在让你实现一个界面或一个功能,完成度可以是天差地别。 有人能在一小时内做出一个基本可用的页面,交互流畅,样式得体。有人却在和AI的来回修改中越陷越深,最后连基本功能都跑不通。同样是用AI工具,结果却大相径庭。 这种面试方式,把候选人之间的差异放大到了前所未有的程度。 沟通能力成了硬通货 在这种新面试下,沟通能力变得特别关键。不仅是和面试官的沟通,和AI沟通好同样重要。 我最近观察到一个有意思的现象:不善于沟通的人往往对vibe coding比较失望。这不仅体现在讲不清楚需求,更重要的是预期管理的问题。 你不能给沟通对象设定一个好的预期,就很难有好的沟通策略。拿vibe coding举例: 明确告诉AI要改哪些文件,可以大幅减少AI改错的情况 时不时把反馈提给AI让它重构,可以避免工程越写越歪 但如果把AI想得太差,事无巨细都说得一清二楚,效率又会很低 这种把握度,恰恰考验的是对工具能力边界的理解,以及与之协作的能力。 品味变得可以考察了 另一个变得重要的是品味。 这个东西在传统面试里真不太好考察,顶多看看代码风格。我想没有前端面试会去计较CSS里的配色吧。但现在因为面试做的东西展示性强了很多,品味这个以前很虚的东西,突然变得具体可见了。 界面布局是否合理?交互是否流畅?视觉是否舒适?这些过去被认为是"设计师的活"的东西,现在成了工程师面试的考察点。 所以现在应该多花点时间观察和揣摩各个出色的产品。品味不是天生的,是可以通过大量观察和实践培养的。 技术深度依然重要,但体现方式变了 那这种情况下是不是技术就不重要了?并不是。 今天我就遇到了一个特别值得学习的面试者。他在一家澳洲的大厂工作,公司提供了非常完备的AI编码工具给员工用,所以他很习惯这套面试方式。他很快就把我让他实现的功能写出来了,经过一两轮反馈,完成度又提高了不少。 但更厉害的是:他在AI开始工作前,会先给我讲一下他认为AI会在哪里做修改。等AI写完,他会打开对应的地方来验证一下。 这个策略让我对他的好感度一下子提升。一个能指挥AI、让AI放大自己生产力、当AI出错时能给与正确指示的工程师形象就这样树立起来了。 这才是技术深度的新体现方式:不是你能不能手写红黑树,而是你能不能预判AI会怎么实现,能不能快速验证AI的输出是否正确。 工具还没跟上 目前的面试工具好多都还没有适应这套范式。 比如今天用的Show Me Bug,原来他们一个网页端的IDE可以运行代码还挺好用的,但目前还没引入AI编程功能。所以现在最好用的还是视频电话然后共享桌面。 希望以后会有更好用的工具出来,专门为vibe coding面试设计。 AI作弊的悖论 想起来不久之前有个很火的用AI帮面试者作弊的公司。但现在当使用AI成为重要的考察项目,作弊是不是也就无从谈起了? 如果面试本身就是要考察你和AI协作的能力,那用AI还算作弊吗?这个问题挺有意思的。 不得不感叹这两年的变化真的太快了。 从10.11那期我提到Claude Code让我一晚上写了5700行代码,到10.19那期提到AI让我们一周完成三周的工作,再到今天我们已经开始用vibe coding来面试新同事。 AI不仅改变了我们的工作方式,也在改变我们对"优秀工程师"的定义。沟通能力、品味、对工具的掌控力,这些过去相对软性的能力,现在都成了核心竞争力。 而技术深度依然重要,只是它的体现方式变了。

November 19, 2025 · 1 min · Yuanhao

每周AI观察:当编程按下三倍速键,我们发现了这些反直觉真相

这周,我和同事进行了一场深度实验,几乎完全依靠AI编程来推进一个新项目。结果令人震撼,我们在一周内完成了过去需要三周的工作量。然而,在这前所未有的效率背后,一些反直觉的真相也浮出水面。 效率的代价与注意力的过载 当编程进入三倍速,我首先感受到的不是疲惫的双手,而是过载的大脑。任务的节奏被极大地压缩了:设计、体验、修改功能的循环快得让人应接不暇。虽然有Rate limit来让人强制休息,但当注意力频繁切换的强度也和效率一样达到了过去的三倍,这本身就成了一种新的认知负担。 我的同事采用了更极端的并行策略,他同时在三个目录上开了3个独立的工程分支用Claude Code开展工作。这虽然进一步推高了速度,但也带来了新的挑战,比如时常需要去解决代码合并时的冲突。这让我意识到,在AI时代,工具的速度与人类管理上下文的能力之间,需要寻找新的平衡。这点来看Openai的产品能力还是更强一点,早早就有web版,让每个任务都有独立的上下文。 软件工程范式的静默革命 AI编程的强大,正在悄然改变我们习以为常的软件工程范式。过去,我们花费大量心思在设计复用、规避技术债上。而现在,我们可以更大胆地选择直接重写代码,因为执行的代价已经大大降低。 这种“轻装上阵”的感觉非常好,每个新项目都能从最贴合当前需求的代码开始,历史包袱不再沉重。我们甚至实践了一次:当依赖的其他部门API无法及时修改时,我们干脆利落地自己重写了一个。 这让我联想到在周末华源年会上听Databricks的Co-founder Reynold Xin说的一个观点,未来我们或许会进入一个“个性化软件”的时代,每个公司都能拥有为其深度定制的后台系统。这就像短视频重塑内容行业一样,AI正在让软件开发的节奏和模式发生根本性的变化。 Reynold Xin真是平易近人的大佬 人的进化:从实现者到定义者 那么,在AI承担了大量实现工作的未来,人的价值在哪里? 华源年会上AMD的VP建议年轻人成为全栈工程师,我认为这个方向是靠谱的,但关键中的关键,是向上聚焦。最重要的“栈”将不再是技术实现,而是需求洞察与产品设计——包括商业模式、用户流程和交互体验。实现环节,可以大胆地交给AI。 未来的软件行业,可能会像如今的视频创作领域一样,门槛降低,创意勃发。从只有大工作室能制作视频,到今天无数UP主的百花齐放。当实现的工具变得普及,比拼的核心就变成了谁的创意更好,谁更懂用户。 Ed Chi, Yangqing和Ramine Roane的Panel质量挺高 寻找属于人的节奏 这一周的实践让我深刻感受到,我们正处在一个生产力范式转换的奇点上。AI带来的不仅是效率的直线提升,更是对整个工作节奏和人类角色的重新拷问。 正反馈来得飞快,半天就能看到一个新功能从无到有,这无疑是激动人心的。但只要最终决策者是人,我们的注意力和认知节奏就设定了生产力的天花板。如何在AI的“永动”和人类的“深度思考”之间找到属于我们的黄金平衡点,将是下一个阶段我们都需要探索的课题。 模型训练的迷思与公开模型的洪流 最后再聊一聊模型的训练。 在年会下午的路演上,我发现许多公司都在谈论收集数据、训练自己的专属模型。但这与我近两年的切身经验有些冲突。 路演上大部分是种子轮或pre-seed轮的公司,在业务方向尚未明确、用户反馈循环还没有建立起来的探索期,自训模型很可能是一种负担。它会让团队尝试新方向的步伐变得沉重。我的一个切身体会是:如果利用现成的货架模型加上优秀的产品设计,都无法达到一个及格的基线,那么指望通过自训模型来扭转局面,通常是非常困难的。 更何况,公开模型的进化速度一日千里,性能和价格都在以惊人的速度变得更好。回顾两年前,我们完成一次模型的微调并上线,周期至少一个月,而需求可能早就变了。在今天,至少需求验证阶段拥抱公开模型的洪流,或许比闭门造车更为明智。

October 19, 2025 · 1 min · Yuanhao

每周AI观察251012

这周决定换个写法,先让AI把我刚经历的一切梳理成问题,然后再把答案拼接成故事。主题集中在两个瞬间:一个是抓住 vibe coding 这股风,另一个是在三番的 Tech Week 感受到的AI热浪。 Vibe coding 让效率坐火箭 尝鲜 vibe coding 其实并不是一个突如其来的决定。之前一直在用 Copilot 当补全工具,偶尔切换到问答模式解题;Codex 则帮我撸过一些独立功能。本周被同事疯狂安利,终于认真试用了 Claude Code。真正的契机是最近开了几个需要完整端到端体验的 side project:算法做完了,总得有个前端去展示。以前这种需求我会用 Gradio 将就一下,但扩展性、体验都差点意思。现在模型写前端的能力明显升维,索性试试看。 事实证明,Claude Code 的体验的确对得起“vibe coding”这三个字。不只是模型本身换挡提速,更是整套产品设计承载起了新的工作流。同样的问题扔在 Copilot 的 agent 模式里用Claude Sonnet 4.5就是搞不定,在 Claude Code 里却能稳稳落地。工程化能力、上下文调度、交互节奏,这些外围细节直接决定了“模型能力”能否发挥出来。 Claude Code:第一次把额度用爆的工具 这是第一次我把一个 20 美元的月度套餐刷出“session limit”。用 Claude Code 紧张工作三个小时就打满了 session,周额度瞬间消耗 16%。这在 Copilot、Codex 身上从未发生过。站在生产力角度也能感受到质变:一个晚上交付了 5700 行代码。我保守估计这相当于以前一周在非常熟悉领域的输出。算一笔账:硅谷中级程序员十来分钟的工资,换来“整周产出”,到底是 AI 便宜还是人类昂贵?更讽刺的是,在国内就算找水平一般的外包,一人天也得四百块人民币。 三小时就到Session Limit 当然,“高效率人士效率更高”只是结论的一面。另一个严肃的问题是:我们需要重新审视自己的技能栈和时间配置。木桶理论正在被改写——如果某块短板 AI 可以补,那就别再死磕了。比如后端程序员为了独立开发硬啃前端,如今的 ROI 已经低得可怜。我的 vibe coding 达人朋友甚至拿 Claude Code 写完了申请日本签证所需的材料并用浏览器填表提交,证明这类工具已经具备了让人眼前一亮的通用性。 调教模型的门槛正在上升 Claude Code 能够“稳”还有一个被低估的原因:我特意读了官方的最佳实践博客,照着写了 CLAUDE....

October 11, 2025 · 1 min · Yuanhao