昨天下班,正巧路过本地的数码城,想着把家里两台吃灰的旧安卓旗舰机给回收了。
走到熟悉的档口,老板接过手机扫了一眼配置(12GB运行内存),直接报了个价。我一听愣住了:“老刘,你报错了吧?上个月我问你的时候,这机器才值 800 块,今天怎么给到 1200 了?”
老刘嘿嘿一笑:“哥,你搞技术的难道不知道?这两天只要是大内存的旧手机,全网都在疯抢。别说手机了,你去电脑城看看,32G和64G的内存条最近都涨成啥样了。”
我看着到账提醒,又望望满大街的数码招牌,心里一阵恍惚。
谁能想到,就在咱们前几篇文章里疯狂探讨的 OpenClaw 和各类 AI 智能体(Agent),不仅在软件层掀翻了旧世界,现在竟然硬生生地在物理世界,催生出了一场堪比当年“显卡挖矿”的硬件扫货潮。
恐怖的Token燃烧机:Agent是怎么干活的?
咱们得先搞明白第一个问题:为什么最近大家的 Token(词元) 消耗量会成百上千倍地暴涨?
以前我们用 ChatGPT,那叫“聊天”。你发一句 50 个字的提问,它回你 500 个字的答案。这撑死也就消耗几百个 Token,一次对话可能只要一两分钱。
但现在大家都在用 OpenClaw 这种自动化 Agent 框架了。Agent 干活,靠的不是“一问一答”,而是 ReAct(推理+行动)的无限循环。
你给它一句简单的指令:“帮我把网上最近三天关于新能源汽车的研报扒下来,总结个核心观点。”
在这个看似简单的指令背后,Agent 是这么消耗 Token 的:
第1步: 它要把你的指令加上自己庞大的系统提示词(System Prompt,教它如何使用浏览器、如何反思),先消耗 2000 个 Token。第2步: 它打开浏览器,为了“看清”网页,它会把整个网页的 DOM 树或者直接一张高清截图传给大模型。这一次上下文输入,可能就是2万Token!第3步: 模型分析完,发现没找到目标,决定点击“下一页”,继续消耗。第4步: 页面刷新,它再次把新页面的几十 KB 代码或者新截图传给模型,又是2万Token...
发现问题了吗?为了完成你这一句话的微小任务,Agent 在后台可能跟大模型进行了几十次的反复交互、试错和自我纠正。
以前人类的计算单位是“次”,现在 Agent 的计算单位是“无底洞”。
这何尝不是一种“认知税”?机器替你思考和动手的每一秒,都在疯狂燃烧Token。
从云端逃向本地:一场内存的“饥饿游戏”
Token 烧得太快,最先扛不住的是普通人的钱包。如果全都走 OpenAI 或者 Claude 的云端 API,一个月下来账单能上千块。
于是,咱们技术圈的极客们做出了最理性的选择:把大模型拉回本地!也就是咱们上回说的 Local-first(本地优先部署)。
大家开始在自己的电脑和手机上部署那些 7B、8B 甚至 32B 的开源端侧模型,让 OpenClaw 直接调用本地脑力去干活。不花一分钱网费,绝对的隐私安全。
但代价是什么?代价是你的物理内存(RAM)直接被吸干。
做过模型本地部署的兄弟都知道,大模型就是个无情的“内存怪兽”。一个哪怕经过量化压缩的小模型,加载起来随便就得吃掉6G到8G的内存。
这还没完,当你让Agent去阅读几百页的文档,或者处理复杂的网页上下文时,那几十K的上下文窗会随着任务的推进迅速膨胀。
过去十年,我们习惯了8G内存办公、16G内存打游戏。但今天,当你试图在后台挂一个不知疲倦的本地Agent 时,16G内存连它的塞牙缝都不够。它一旦爆内存,你的电脑立马卡得连微信都打不开。
这就是最近32G和64G内存条最近会被买爆的根本原因。
一场被 AI 挤爆的全球产能战争
旧手机涨价的真正推手,也许根本不是几个技术宅的狂欢,而是一场由 AI 引发的、自上而下的全球半导体产能大挤压。
这大半年,大厂们为了训练更强的模型、部署更多的云端 Agent,对 AI 服务器的需求简直是疯狂的。一台顶配的 AI 服务器,里面塞满了几十上百张H100显卡,而这些显卡极其吃一种叫HBM(高带宽内存)的高端存储芯片。
全世界能造这种高端存储芯片的厂子有几家?满打满算,也就是三星、SK 海力士和美光这“御三家”。
在半导体行业有个残酷的铁律:产能是恒定的,资本是逐利的。
当那些手握几百亿美金的科技巨头,挥舞着钞票疯狂下单高端 AI 内存时,如果你是三星或海力士的老板,你会怎么选?你当然会毫不犹豫地把原本用来生产普通电脑内存条、手机闪存的生产线,强行停掉,全部转去生产利润奇高无比的 AI 专用存储。
这就导致了一个极其直接的后果:消费级市场(也就是咱们用的普通手机和电脑)的存储芯片,产能被严重压缩,断供了。
新手机和新电脑的内存成本疯狂飙升,厂商为了保利润,要么涨价,要么悄悄缩水内存容量。这时候,那些三年前发布的、带着 12G 甚至 16G 豪华大内存的旧安卓旗舰机,瞬间就成了市场上的“香饽饽”。
这就解释了老刘为什么敢大着胆子给我加价400块。因为他知道,这批大内存的旧机子,在新的产能周期恢复之前,卖一台少一台。
是泡沫狂欢,还是时代趋势?
我做了几十年技术,经历过无数次硬件的狂欢与沉寂。
当年 Windows 95 出来的时候,因为图形界面太吃资源,全世界爆发过一波内存升级潮,很多人骂这是微软勾结硬件厂商在抢钱;后来各种 3A 游戏大作爆发,又带火了无数代的显卡,也有人骂这是毒害青少年的泡沫。
今天,二手手机和内存条被扫货,很多人依然觉得这只是极客圈的自嗨和炒作。
但我看到的,是底层逻辑的彻底改变。
炒币,消耗了天量的算力和电费,最终产出的往往只是交易所里的一串击鼓传花的代码。但今天,这些爆满的内存条里运行的,是真真切切在帮你回邮件、查财报、订机票的“数字劳动力”。
也许当算力开始直接转化为“生产力”时,它就不再是泡沫,而是新基建。
软件的每一次革命,永远是以残酷地压榨硬件为代价的。
我们曾以为,AI 是一朵飘在云端的、轻飘飘的云。
但当 Agent 真正长出“爪子(Claw)”,开始在本地帮你处理那些鸡毛蒜皮的琐事时,我们才发现:所有的智能,最终都要在硅基的晶体管和沉甸甸的内存条里,结结实实地落地。