训个能打大厂的AI编程模型,现在还没你买个车贵

发布于 2026年05月22日

上周三在中关村食宝街负一层的瑞幸,我前同事把电脑怼我脸跟前的时候,冰美式的冰还没化完。他说你看,我刚用新出的开源编程模型,把我上周熬了三个通宵写的对账系统逻辑重写了一遍,跑通只花了22分钟。我凑过去看,屏幕上的代码注释都自动生成好了,连我三年前踩过的那个多币种汇率溢出的坑,它都自动加了校验逻辑。我当时第一反应是,以后新人怕是连熬通宵证明自己的资格都没了。

小团队训个能打大厂的编程模型,只花了4天

放出这个模型的团队叫Nous Research,做开源AI的,之前出过不少性能还行的小模型,背后是投加密货币的风投Paradigm撑着。这次新出的模型叫NousCoder-14B,参数才140亿,放在去年根本没人会觉得这体量的模型能跟大厂闭源产品碰一碰,但这次人家测出来的成绩,确实够吓人。

在LiveCodeBench那个专门测编程能力的基准上,它的成绩比基础模型阿里的Qwen3-14B提了一大截,和现在网上吹得最凶的Claude Code比,差距已经小到普通开发者日常用根本感知不出来的程度。

最狠的是训练成本。他们只用了48张英伟达最新的B200显卡,训了4天就搞定了。我前阵子帮一个想做AI创业的朋友算过,公有云的B200按需付费,一张一小时大概180块,算下来整轮训练也就八十万出头。真挺直观的,还没你在北京买个中端电动车贵。

去年上半年A100炒得最凶的时候,单卡现货都要十几万,想训个同等水平的模型,光硬件成本就得大几百万,普通团队根本碰不起。我那朋友当时还吐槽,说AI创业的门槛比开火锅店还高,现在倒好,连个加盟费都用不完。

AI写代码的速度,已经比团队撕需求的速度还快了

开源模型成本降得够夸张,闭源工具的能力进化更是直接把很多开发者干懵了。

元旦之后Claude Code刚放出来,我朋友圈一半的开发者都在晒,有人说用它一下午写完了以前要做半个月的小程序,有人说连需要特定领域知识的工业控制代码,大半都能一次写对。最出圈的是Google高级工程师Jaana发的帖子,她负责Gemini API的相关开发,说给Claude Code喂了三段需求描述,对方一小时就生成了她团队花一整年才做出来的分布式代理编排系统,功能差不了多少。

我去年带团队做过一个用户行为分析看板,产品和开发前前后后撕了三周需求,改了五版PRD,上线还漏了三个埋点。上周闲着没事,我把当时的PRD精简成三段话喂给Claude Code,15分钟就生成了完整的前后端代码,跑起来连统计报表的配色都跟我们当时选的差不多。

去年双11



评论