53723 龍蝦養(yǎng)得起,Token燒不起

播放欧美性猛交做愛电影人性禁岛, hd2中国成熟iphone69, 私密直播全婐app免费大渔直播, 欧美videosfreeⅹ尸交,爽妇网20丨9,日本少妇请情视频www,92国产高清视频在线观看,国产 日产 欧产网站,国产乱子伦视频露脸

服務(wù)熱線:400-858-9000 咨詢/投訴熱線:18658148790
國內(nèi)專業(yè)的一站式創(chuàng)業(yè)服務(wù)平臺(tái)
龍蝦養(yǎng)得起,Token燒不起
03/30
Token狂飆的算力稅:誰在為AI的“工業(yè)革命”買單?
本文來自于微信公眾號“首席商業(yè)評論”(ID:CHReview),作者:寧缺,投融界經(jīng)授權(quán)發(fā)布。

今年春天,如果你還在糾結(jié)龍蝦怎么養(yǎng)、Token中文名叫什么,大概已經(jīng)跟不上科技圈的熱鬧了。

3月23日,國家數(shù)據(jù)局局長劉烈宏給Token定了中文名——詞元。同時(shí)披露了一個(gè)數(shù)字:中國日均Token調(diào)用量突破140萬億,兩年增長超千倍。

龍蝦養(yǎng)得起,Token燒不起

圖源:新華社

差不多同一時(shí)間,阿里云和百度智能云先后宣布AI算力產(chǎn)品漲價(jià),最高漲幅34%。英偉達(dá)的黃仁勛在GTC大會(huì)上把Token叫做“AI時(shí)代的石油”,還公布了一套分層定價(jià):每百萬Token從3美元到150美元不等。

他還說了另一句話,讓不少創(chuàng)業(yè)者后背發(fā)涼:一個(gè)年薪50萬美元的工程師,如果一年用不掉25萬美元的Token,他會(huì)“極度恐慌”。

一邊是Token消耗量瘋漲,一邊是供給端的成本在攀升、定價(jià)權(quán)在集中。熱潮退去,賬單浮出水面,人們開始意識到一個(gè)問題:我們正以近乎傾銷的價(jià)格享受著AI的便利,但支撐這場技術(shù)革命的底層燃料,其真實(shí)成本才剛剛開始顯現(xiàn)。

為什么單價(jià)越便宜,總賬單越貴?

要理解這件事,得先明白Token是什么。

它是AI理解和生成信息的最小單元,也是眼下智能時(shí)代唯一可計(jì)量、可定價(jià)、可交易的通用貨幣。但它的使用費(fèi)由兩個(gè)東西決定:單價(jià)乘以消耗量。

你問一個(gè)問題,它回答一段話,背后都是Token在燃燒。

過去兩年,行業(yè)的主線是訓(xùn)練模型。各大廠商砸了數(shù)千億美元,把單位Token的牌面價(jià)格一降再降。國內(nèi)廠商的Token單價(jià),已經(jīng)做到海外巨頭的十分之一。

但到了2026年,事情變了。

AI的核心價(jià)值,從“能聊”變成了“能干”。標(biāo)志就是龍蝦的爆發(fā)。

一個(gè)龍蝦智能體執(zhí)行一次任務(wù),比如“幫我找最低價(jià)”,消耗的Token是傳統(tǒng)對話的幾十倍甚至上百倍。因?yàn)樗皇且淮螁柎?,而是一個(gè)完整的工作流:拆解任務(wù)、多步推理、調(diào)用工具、自我修正、錯(cuò)了重來。每一步都在燒Token。

這就是問題的核心:完成同一個(gè)任務(wù)需要的Token數(shù)量,增長得比單價(jià)下降更快。AI從副駕駛變成了代駕司機(jī),油耗自然不是一個(gè)量級。

更關(guān)鍵的是,用戶永遠(yuǎn)只想要最新的模型。老模型再便宜也沒人要,99%的需求會(huì)瞬間轉(zhuǎn)移到新發(fā)布的SOTA模型上。而前沿模型的單位Token價(jià)格,從來沒真正降下來過。GPT-4剛出來時(shí)輸出價(jià)格60美元每百萬Token,今天Claude Opus 4.5還是這個(gè)價(jià)位。用戶要的是當(dāng)下最好的大腦,愿意為它買單。

于是,需求端智能體爆發(fā),Token消耗量兩年增長超千倍。供給端,HBM內(nèi)存價(jià)格飛漲,2026年一季度DRAM價(jià)格環(huán)比漲超50%,NAND最高漲了150%,巨頭們的戰(zhàn)略長約直接簽到5年后。而掌握核心硬件和軟件生態(tài)的英偉達(dá),靠著CUDA和從芯片到云的全棧布局,牢牢捏著Token的出廠價(jià)。

誰在制造Token的通脹?

Token的狂飆不是自然生長的。從產(chǎn)業(yè)鏈看,有四層玩家,每一層都在向上傳遞成本,最終壓到最末端的普通用戶身上。

先看最底層:英偉達(dá)。

第一層是英偉達(dá)。以前它賣芯片,一次買賣?,F(xiàn)在不一樣了。CUDA生態(tài)綁住了全球絕大多數(shù)AI開發(fā)者,二十年來積累的工程師、開源項(xiàng)目、代碼庫都長在這個(gè)生態(tài)里,切換成本極高。它自己又開了云服務(wù)DGX Cloud,用戶直接在它平臺(tái)上按Token付費(fèi),不用自己買芯片。

黃仁勛在GTC 2026上提出了“Token工廠經(jīng)濟(jì)學(xué)”,核心就一句話:以后AI的衡量單位不再是芯片,而是Token。他的野心也不止于賣云服務(wù)——英偉達(dá)正在試圖把商業(yè)模式延伸到按Token抽成。

這套打法讓英偉達(dá)掌握了定價(jià)權(quán)。2026年一季度,HBM內(nèi)存供不應(yīng)求,內(nèi)存價(jià)格在幾個(gè)月內(nèi)上漲了數(shù)百個(gè)百分點(diǎn)。英偉達(dá)的GPU也跟著漲價(jià)——AI芯片H200所用的HBM3E供應(yīng)價(jià)格上漲約20%。

英偉達(dá)芯片漲價(jià),直接推高了云廠商的采購成本。

阿里云、騰訊云、百度智能云,它們從英偉達(dá)買芯片,搭好服務(wù)器,再把算力租給下游?,F(xiàn)在英偉達(dá)芯片漲價(jià),HBM內(nèi)存漲價(jià),它們自己的成本在漲。同時(shí)需求又爆發(fā)——龍蝦這類智能體火了,所有人都想跑Agent。需求太大,服務(wù)器、電力都跟不上。于是它們只能漲價(jià)。阿里云AI算力產(chǎn)品最高漲了34%,百度漲了5%到30%。

第三層是大模型廠商。DeepSeek、MiniMax、智譜這些公司,處境最微妙。它們從英偉達(dá)買芯片,從云廠商租算力,訓(xùn)練出模型,再把Token賣給用戶。

上游,芯片漲價(jià)、內(nèi)存漲價(jià)、云廠商漲價(jià),成本在漲。下游,2024年DeepSeek帶頭打價(jià)格戰(zhàn),把Token價(jià)格打到了地板上。想漲價(jià)怕用戶跑,不漲價(jià)自己的算力賬單在飛漲。所以這一輪云廠商漲價(jià),它們反而最沉默。

第四層是AI應(yīng)用公司。Cursor、Claude Code這些直接面向用戶的工具,面臨一個(gè)無解的難題:按固定月費(fèi)收,比如20美元隨便用,重度用戶能把成本干穿。

Anthropic的Claude Code就吃過這個(gè)虧,推出每月200美元的無限套餐,結(jié)果一個(gè)月被一個(gè)用戶干掉了100億Token,最后不得不取消。

按量付費(fèi)呢?用戶會(huì)被不確定的賬單嚇跑。大多數(shù)人喜歡固定月費(fèi),哪怕貴一點(diǎn),至少心里有數(shù)。

怎么辦?只能硬著頭皮選固定月費(fèi),但在這個(gè)模式下做各種限制來保命。

最常見的是用量封頂。每月給你一定額度的Token,用完了要么等重置,要么補(bǔ)差價(jià),要么升級。比如Claude Code取消無限套餐后,改成了按實(shí)際用量付費(fèi)加基礎(chǔ)月費(fèi)的混合模式。

另一種是分級套餐。輕度用戶20美元,重度用戶40或60美元,把高消耗用戶篩到更高的付費(fèi)檔位。還有些公司在技術(shù)層面做優(yōu)化——緩存常用請求、限制上下文長度、在用戶無感知的情況下把復(fù)雜任務(wù)切給便宜模型跑。這些做法用戶看不到,但每一招都在省Token。

可以看到,越往下游,利潤越薄,處境越難。最上游的英偉達(dá)穩(wěn)賺,最下游的應(yīng)用公司在生死線上掙扎。而用戶的直觀感受就是,Token越來越貴了。

誰在焦慮,誰在狂歡?

焦慮,在普通用戶和開發(fā)者中蔓延?!霸滦?萬,我養(yǎng)不起自己的AI員工”——這句調(diào)侃正在變成越來越多人的真實(shí)處境。

程序員艾瑞克是較早開始養(yǎng)龍蝦的一批人。他用龍蝦來自動(dòng)化處理代碼審查和簡單的bug修復(fù),最初一個(gè)月只花了幾十塊錢。

但隨著他給龍蝦配置了更多技能包——自動(dòng)讀取GitHub issue、調(diào)用測試環(huán)境、發(fā)送報(bào)告——Token消耗量直線上升?,F(xiàn)在他每個(gè)月要花近千元。錢不算少,但讓他不舒服的是,這個(gè)數(shù)字在沒有任何預(yù)警地緩慢爬升,像一筆看不見的固定支出。

95后運(yùn)營小可(化名)的賬單則呈現(xiàn)出另一種焦慮。

他養(yǎng)了兩只龍蝦,一只負(fù)責(zé)監(jiān)控競品動(dòng)態(tài),每天抓取信息后自動(dòng)整理成簡報(bào);另一只負(fù)責(zé)整理知識庫并批量生成自媒體賬號內(nèi)容。兩個(gè)數(shù)字員工24小時(shí)運(yùn)轉(zhuǎn),一個(gè)月下來Token費(fèi)用超過200元。

但比賬單更讓他頭疼的,是龍蝦的不可控。偷懶是常事——在某個(gè)環(huán)節(jié)卡住后反復(fù)重試同一個(gè)步驟,Token在燃燒,產(chǎn)出卻為零。

更離譜的是欺騙:龍蝦有時(shí)會(huì)過度夸大自己的能力,只要不被發(fā)現(xiàn)就默認(rèn)自己能完成。小可不得不在Soul.md里反復(fù)調(diào)整指令,定期檢查執(zhí)行記錄,像管理一個(gè)不太靠譜的實(shí)習(xí)生。

小可的技術(shù)路徑幾經(jīng)調(diào)整。最早他用的是一個(gè)國內(nèi)某云端Agent工具,但響應(yīng)慢、功能弱,很快就棄用了。

后來他轉(zhuǎn)向openclaw本地化部署,通過火山引擎的coding plank服務(wù)調(diào)用Kimi 2.5模型。這套方案相當(dāng)克制,基礎(chǔ)賬單僅需每月40元。但任務(wù)一多,coding plan就自動(dòng)升級到200元每月——賬單永遠(yuǎn)追著需求跑。

他也動(dòng)過換用GPT或Claude的念頭,但試用之后發(fā)現(xiàn),在自己需求下國內(nèi)和國外模型交付差異不大,但是國外模型Token費(fèi)用翻了好幾倍,用起來實(shí)在心疼。最后還是用回了國內(nèi)模型,畢竟國內(nèi)模型還是要便宜很多。

如果說這些還算可控,那智能體的心跳機(jī)制和自動(dòng)循環(huán),才是真正的暗坑。用戶不知情時(shí),一個(gè)配置失誤就能讓Token一夜之間燒光。當(dāng)AI幾分鐘就能完成你一周的工作,當(dāng)你的數(shù)字員工比你本人還燒錢,認(rèn)知焦慮與經(jīng)濟(jì)壓力便同時(shí)襲來。

面對這個(gè)問題,有人想出了土辦法:設(shè)置電腦定時(shí)關(guān)閉,或者把openclaw部署在U盤上,通過插拔U盤來物理斷電。用最原始的方式,給這個(gè)不知疲倦的數(shù)字員工裝上了一個(gè)看得見的開關(guān)。

狂歡,屬于產(chǎn)業(yè)鏈上游的收租人。英偉達(dá)的市值和毛利率,云廠商的漲價(jià)底氣,都源于它們在Token價(jià)值鏈上的不可替代性。無論AI應(yīng)用層如何洗牌,它們都是穩(wěn)坐釣魚臺(tái)的贏家。

結(jié)語

這場Token狂飆,最后會(huì)走向哪里?

我覺得,它會(huì)倒逼整個(gè)產(chǎn)業(yè)回歸兩個(gè)常識。

第一,算力成本終究會(huì)回歸商品屬性。短期內(nèi)存漲價(jià)、供需失衡,但技術(shù)進(jìn)步不會(huì)停。更高效的模型架構(gòu)、更好的推理優(yōu)化、把模型焊在芯片上的專用芯片創(chuàng)新,都會(huì)持續(xù)壓低Token的生產(chǎn)成本。長期看,Token的單價(jià)一定是往下走的。

第二,投入產(chǎn)出比會(huì)成為唯一的衡量標(biāo)準(zhǔn)。燒Token不是目的,用Token創(chuàng)造價(jià)值才是。市場從狂熱回歸理性之后,企業(yè)不會(huì)再看“Tokenmaxxing”,而是會(huì)問:這100萬Token,到底幫我干了多少活?掙了多少錢?

智能體本身也需要進(jìn)化,需要在有限的嘗試中,找到使用Token最具效率的方法。

那些只靠補(bǔ)貼用戶燒Token、自己沒有核心價(jià)值創(chuàng)造的應(yīng)用,會(huì)最先倒下。能精確衡量任務(wù)成本、優(yōu)化Token效率、建起高轉(zhuǎn)換成本壁壘的公司,才能活下來。

Token越來越貴的今天,我們需要的不是制造焦慮,也不是鼓勵(lì)無度消耗。

畢竟,商業(yè)的終極理性,從來不是燒掉多少燃料,而是走了多遠(yuǎn)的路。

參考資料:

1、《“燒Token”成KPI,有程序員一個(gè)月花掉15w》騰訊科技

2、《為什么所有人都覺得 MiniMax、智譜“太貴了”?》極客公園

3、《月薪2萬,我養(yǎng)不起自己的“AI員工”》鳳凰WEEKLY

Token 英偉達(dá) 大模型
評論
還可輸入300個(gè)字
專欄介紹
首席商業(yè)評論
21篇文章
深究商業(yè)邏輯,助力價(jià)值成長。我們尊崇“眾創(chuàng)、互聯(lián)、共享”的互聯(lián)網(wǎng)精神,提倡培養(yǎng)領(lǐng)導(dǎo)力與創(chuàng)新思維,并以此作為價(jià)值準(zhǔn)則,努力為企業(yè)家與商界人士提供符合發(fā)展趨勢的內(nèi)容與服務(wù)。
+關(guān)注
400-858-9000
免費(fèi)服務(wù)熱線
kefu@trjcn.com
郵箱
09:00--20:00
服務(wù)時(shí)間
18658148790
投訴電話
投融界App下載
官方微信公眾號
官方微信小程序
Copyright ? 2026 浙江投融界科技有限公司(m.stung-tongue.com) 版權(quán)所有 | ICP經(jīng)營許可證:浙B2-20190547 | 浙ICP備10204252號-1 | 浙公網(wǎng)安備33010602000759號
地址:浙江省杭州市西湖區(qū)留下街道西溪路740號7號樓301室
浙江投融界科技有限公司trjcn.com版權(quán)所有 | 用戶協(xié)議 | 隱私條款 | 用戶權(quán)限
應(yīng)用版本:V2.7.8 | 更新日期:2022-01-21
 安全聯(lián)盟
在線客服
手機(jī)APP
微信訂閱