为什么我停止为 API 调用付费,自己构建了 AI 聊天
双系统问题
两周前我开始构建 ShawnOS。这个仓库。一个有三个 Next.js 站点、智能体技能、内容管道、RPG 成长系统的单仓库。运营一人 GTM 引擎的操作系统。
一周前我在 OpenClaw 上搭建了 Nio。OpenClaw 基于 GPT。想法是为我的 AI 智能体建一个独立的聊天系统。Nio 会运行定时任务,写博客文章,管理内容管道,更新仪表盘。真正的基础设施,不是玩具。
而且它有效。但 API 成本快速累积。Sonnet 用于日常运营。Opus 用于任何需要真正思考的事情。根据我构建的量,每天$50到$100。而我一直在构建。这完全是疯狂的。
我把高频定时任务路由到本地 Ollama 模型(Qwen 2.5 14B)。免费、快速、对提交跟踪和状态更新够用。但任何需要真正智能的事情...你需要 Claude。
然后真正的洞察击中了我。
仓库就是魔法
我在运行两个独立的系统。OpenClaw 用于聊天。仓库用于其他一切。但我真正依赖的模型。Opus 和 Sonnet。它们已经与我的仓库对话。它们以 GPT 做不到的方式放大我的声音和 DNA。它们读我的灵魂文件、我的提交历史、我的内容管道。它们不只是响应。它们复利。
在另一个世界里,OpenClaw 会基于 Anthropic 而不是 GPT 构建。但事实不是。而这个差距让答案变得显而易见:你不需要两个独立的系统。仓库就是系统。
Claude Code Max。$200/月固定费用。通过 claude -p 无限 CLI 访问。我已经在付了。每天用它构建仓库。从没想到驱动我编程工作流的同一个 CLI 也能驱动聊天界面。
claude -p 让你发送提示、获取响应、流式输出 JSON,以及恢复会话。全在终端。全包含在订阅中。没有 API 密钥。没有按令牌计费。没有使用上限。
它的递归本质才是让它运作的原因。Claude 构建的系统就是 Claude 驱动的系统。写代码的模型就是运行在其中的模型。这不是成本优化。这是飞轮。
构建过程
Next.js 应用。一个 API 路由。以子进程生成 claude -p。把 JSON 流作为服务器发送事件传回浏览器。
就这样。这就是整个后端。
客户端是 iMessage 风格的 PWA。深色主题,等宽字体,打字指示器。发一条消息,获取流式响应。会话 ID 跨对话持久化,所以 Nio 记住上下文。
Cloudflare Tunnel 指向我的 Mac Mini。现在我可以从手机给我的 AI 发消息。任何地方。零 API 成本。除了隧道(免费层)外零基础设施成本。
从想法到可运行 PWA 的总时间...一个下午。
灵魂文件模式
这里从架构角度开始有意思了。Claude CLI 有一个叫 --append-system-prompt-file 的标志。指向一个 markdown 文件,那个文件就成为系统提示的一部分。
我写了 nio-soul.md。定义了 Nio 的个性、能力、反垃圾规则、决策框架。所有让 Nio...成为 Nio 的东西。不是聊天机器人。是有主见的基础设施。
这意味着添加一个新智能体只需要写一个新的 markdown 文件。
多智能体扩展
一个 CLI。不同的灵魂文件。不同的个性。独立的会话。
这就是 ShawnOS Chat 正在构建的方向。一个多智能体平台,每个智能体有自己的个性文件、主题色、气泡颜色和隔离的会话状态。在 UI 中切换智能体。每个从上次停下的地方继续。
Nio 处理运营和基础设施。架构师智能体处理系统设计。写手智能体用我的声音处理内容。底层同一个 Claude CLI。同样的零边际成本。
每个智能体的状态存在客户端的 localStorage 和服务器端的基于文件的记忆中。每个智能体有自己的 MEMORY.md、自己的心跳文件、自己的每日快照。轻量、可移植、不需要数据库。
知识产权不是代码
任何人都能生成 CLI 进程。模式才是重要的。
CLI 即后端的个人 AI 基础设施。每个智能体的会话隔离。用于个性注入的灵魂文件。基于文件的记忆系统。零边际成本架构,随你的订阅而不是使用量扩展。
这种东西以前需要自定义 API 集成、数据库、认证中间件和月度云账单。现在只需要一个 markdown 文件和一个 Next.js 路由。
对构建者意味着什么
如果你在按令牌为个人 AI 工具付费,而你有 Claude Code Max 订阅...你在白白浪费钱。
CLI 就是 API。你的订阅就是基础设施预算。其他一切只是管道。
但不止如此 - 如果你在一个不与你代码库对话的平台上运行你的 AI,你在建两个系统,而你只需要一个。构建你基础设施的模型应该就是驱动它的模型。这不是走捷径。这就是架构。
这是 ShawnOS 的一部分。我正在公开构建的操作系统,用于运营一人 GTM 引擎。两周前开始构建仓库。已经在复利。
去建你的吧。