试了太多AI工具之后,我对”烧Token”这件事已经有了PTSD。每个月ChatGPT Plus的订阅费加上API的Token消耗,账单看着就肉疼。尤其是写代码的时候,一个复杂问题的debug来回十几轮对话,几百k Token就没了。后来就想找个本地方案,至少日常的小问题不用每次都去云上请求。折腾了一圈Ollama、LM Studio之后,最后还是选了OpenClaw,原因是——简单到像我这种懒人都能用。
先说个直观对比:之前用在线API,一个稍微复杂的代码审查任务大概要消耗5-8万Token,按GPT-4的价格算就是两三块钱一次。一天搞个三四次,一个月下来就好几百。换成OpenClaw本地跑模型之后,同样的任务完全免费,就是费点电。性能方面,本地7B模型的代码能力虽然比不上GPT-4,但日常的代码补全、简单bug定位、文档生成这些任务,完成度大概有GPT-3.5到GPT-4之间的水平。安装超级简单,不用配置环境变量,不用编译,三步搞定:
第一步:打开网址 https://top.wokk.cn
第二步:找到符合你系统的版本下载(支持Windows、macOS Intel、macOS Apple芯片)
第三步:双击安装包运行,全程自动安装

安装完第一次启动的时候,选了个Qwen2.5-7B-Instruct模型下载。这个模型4-bit量化之后大概4.7GB,我这里100M宽带下载了大概5分钟。下载完自动加载,整个过程流畅得就像在Steam下游戏一样。模型加载之后我做的第一件事就是拿LeetCode上一道中等难度的算法题测试——”最长回文子串”。结果这个7B模型给出了一个中心扩展法的解法,代码逻辑正确,时间复杂度分析也对,就是变量命名稍微有点奇怪。这个水平对于日常刷题练习来说完全够用了。
然后我又测试了一些实际开发场景。第一个场景是帮我看一个Docker Compose配置文件为什么服务之间通信失败。把yaml文件内容贴进去之后,它准确识别出是网络配置的问题——我没有给服务指定自定义网络,所以它们不在同一个网络命名空间里。这个诊断速度比我自己翻文档快多了。第二个场景是让我解释一段不太熟悉的Rust代码。它逐行解释了所有权和借用的逻辑,比大部分教程写得清楚。
说到模型选择,OpenClaw内置了300多个模型,这里有个选型的小经验分享。写代码优先选Qwen2.5-Coder系列,这个专门针对代码做过微调。写中文文档选Qwen2.5或者Yi系列,中文语感好。如果你需要英文能力强的,Llama3和Mistral系列表现不错。选模型的时候看两个参数:参数量和你设备的内存。7B模型至少需要8GB内存(含系统占用),13B需要16GB,32B就需要32GB了。别贪大,合适最重要。这就像在《老头环》里选武器一样,不是数值最高的就是最好的,要看你能不能拿得动。
技能系统是另一个让我觉得值回票价的功能。目前已经积累了6万多个技能插件,我装了几个特别实用的:代码执行技能可以直接运行Python代码并返回结果,不用切换到IDE;文件管理技能可以批量重命名、整理目录结构;网页抓取技能可以自动提取网页内容。这些技能的组合使用让我基本上可以在OpenClaw里完成大部分日常工作,不需要频繁切换应用。比如我常用的一个workflow是:让AI帮我分析一个网页上的API文档,然后把关键接口整理成代码模板,最后用代码执行技能验证模板能不能跑通。整个过程在一分钟内完成。

用了两个多月,我的Token消耗降了大概70%。现在只有在需要GPT-4级别的复杂推理时才去用在线API,日常的代码辅助、文档编写、问题排查全部在本地完成。省钱是一方面,另一方面是响应速度——本地模型没有网络延迟,生成速度稳定,用起来体验反而比在线服务更流畅。如果你也是Token焦虑症患者,不想每个月在AI工具上花太多钱,OpenClaw确实是个靠谱的替代方案。去 https://top.wokk.cn 下载试试,反正免费,不好用卸了就是。但大概率你会跟我一样,用上之后就回不去了。这个工具确实值得体验。以后我会持续分享使用心得,感兴趣的可以去 https://top.wokk.cn 了解更多。