探索 Claude 的能力边界

自从用 Claude 完成了 Graphite – 基于 JVM 字节码的静态分析框架,工程质量和解决问题的方法和效率着实把我给震撼到了,然后又让它用 Rust 写了 Rustyman – 面向 AI 的网络代理服务,效果也很是出奇的好,名副其实的 10x 工程师。于是,便产生了一个大胆的想法 – TestPilot,在纯 JVM 上运行 Android APK 。拿到需求后,它便进入了 Plan 模式,根据对需求的理解提出了双层架构的方案,然后规划了 Road Map,分了 3 个阶段来进行,从 Phase 1 - MVP 到 Phase 3 - Production Ready。在 MVP 阶段表现跟前两个项目一样丝滑,到了 Phase 2 一开始风风火火的重写各种 Android 系统类,也没觉得有什么不对,逐步完了 Activity, View, Fragment, ViewPager, RecyclerView 的重写,接下来它提出要重写 ConstraintLayout 的时候,我意识到不对劲了– 重写系统类我能理解,但为什么要重写一个二方库?ConstraintLayout 并不属于 Android Framework?于是便跟它一起仔细地 review 了整个方案,才发现它对底层依赖的 layoutlib 的能力不太了解,才提出重写系统类的方案,这不禁让我开始思考一个问题:Claude 的能力边界到底在哪里?

阅读全文

亲眼见证程序员职业的终结

之前在做 Booster 的时候,就想实现一个能做数据流分析的框架,但个人精力有限,只能束之高阁。自从 Claude Opus 4.5 发布后,业界一度为之轰动,我抱着试一试的心态,趁着周末在家休息,于是订阅了 Claude Pro,创建了 Graphite 这个项目,应用场景主要是基于 JVM 字节码做静态分析。这类工具之前也做过,技术复杂度心里大概是有数的:设计数据结构、实现 dataflow analysis、处理各种 edge case、写 CLI、写测试……保守估计,之前纯手写一个能用的版本大概花了2天,1天开发,1天调试和处理 edge case。结果,Claude Code 用了 1 小时 就完成了一个可运行的版本。

阅读全文

短暂的停顿,是为了走得更远

每周六早上都要送儿子去 Banpo 运动场去练习足球,最近因为 Winter Break 放了两周假,足球都没碰过,我想大概是荒废了。休假的时候还想着,这荒废的两周把之前的努力都给抵消掉了。家乡有句老话「三天不打鸟,牯牛都射不倒」,所以我心里其实已经有了预期:一上场又会暴露一堆毛病。

阅读全文

AI 时代的 Mentor

就在放 Winter Holiday 的前一天,Term 3 的 School Report 下来了。看到 Report 的那一刻,我当场气炸,零下 10 度的寒风里,我连抽了 3 根烟。回家后我把报告递给老婆看,她看完冒出一句:「还行啊。」

阅读全文

2年涨30%,是什么支撑韩国的房价?

房子的合同还有几个月就到期了。现在住的这套三居,说实话并不差,采光好,通勤也方便,周围朋友也多,住久了甚至还有点舍不得。但孩子慢慢长大,总觉得空间还是局促了一些,心里盘算着要不要换个四居。于是联系了中介,说明需求,预算也交代得很清楚。两个星期过去,中介终于有了消息,给推了两套,再一看报价,令我大吃一惊,不仅远超 budget,其中一套近期还跳价了 5%,简直是不讲武德。

阅读全文

为什么乘除10的幂几乎不用思考?

周末在给儿子辅导作业时,注意到他在算 450÷10 时几乎不假思索,但遇到 450÷6 时立刻眉头紧锁,这让我突然意识到一个我们习以为常,却很少认真想过的问题:

为什么在算乘除 10 的幂时,我们几乎完全不需要思考,而换成别的数就特别费劲呢?

阅读全文

为什么计算机要区分文本和数字?

最近从零开始教儿子学编程,在讲解计算机是如何表示文本和数字的时候,儿子突然冒出了一个问题:

为什么要用不同的方式来表示?数字不也是文本吗?

阅读全文

AI 时代的教育

原本以为让孩子走国际路线可以逃离国内的内卷,但来到首尔后,我发现这里的竞争一点也不比国内少,尽管大环境如此,作为家长,我们对报补习班一直都很克制,不会自作主张给孩子报各种课后班,都是孩子说想学啥才给报。在和国际学校的其他家长们交流后,我才意识到大家的逻辑几乎惊人的一致 —— 复刻上一代国际生的成功路径:卷兴趣、卷特长、卷背景,把各种证书当成申请名校的敲门砖。

阅读全文

Circle - 链上的美联储

中国的数字人民币项目最早可以追溯到 2014 年,正式落地试点是在 2020 年。从北京、深圳到成都、苏州,各地政务场景、电商补贴、甚至红灯志愿者奖励系统,都开始接入“数币钱包”。

这是一次国家主导、央行推动的支付系统数字化尝试。但时至今日,数字人民币的普及程度依然有限:用户增长趋缓,线下覆盖不均,支付习惯难以改变,老百姓用微信支付宝惯了,基本还是“扫个码”的层面,而且对于普通人,根本分不清“数币”到底和微信钱包有啥不一样。

阅读全文

为什么 All in CRCL?

在上一篇 无暇思考:从抄底 Google/Tesla 到 All in Circle 中有提到,我凭直觉做出 All in 的决策,为什么会 All in 一个还没来得及深入研究的东西呢?这还得从 $NVDA$TSLA 说起。

阅读全文