Name: Rotifer Protocol
Author: Rotifer Foundation

未来十年的 AI，不会只由模型大小决定。同样关键的是另一个问题——已经卖出去、装在口袋里和工厂里的那几十亿台设备，能不能可信地承接云端正在长出来的能力。

今天，绝大部分 AI 能力住在云端：模型在数据中心训练和运行，能力通过 API 被调用，硬件主要负责输入和显示。但物理世界已经有大量设备在持续运转——手机、车辆、嵌入式控制器、工业传感器、边缘网关。它们有算力，也有身份和本地数据，却缺少一种共同方式去声明：自己实际能跑什么、以什么保真度跑、由谁验证、用完之后能不能安全迁移。在没有这层共同语言之前，这些设备只能被动等待整机升级，或者被作为"过期硬件"提前退役。

本文讨论的不是一个新模型，而是上述问题缺失的那一层协议。它既不属于云端推理，也不属于单机本地运行——它存在于"能力声明"与"运行载体"之间，定义两者如何相互问责，又如何允许能力在不同设备之间演化、积累和迁移。Rotifer Protocol 是我们朝这个方向构建的开源框架；它是这条路径上的一个具体候选实现，本文不主张排他性。配套论文 Where Capability Lives, and How Hardware Earns the Right to Run It 展开了完整论证；本文是面向时间紧张读者的入口。

三句不能压成一句的话

大多数能力漂移源于把三句不同的话压缩成同一句话。

"X 是可以做到的。"

"X 在这一类硬件上是可以做到的。"

"X 在你现在手里这块硬件上是可以做到的。"

不区分这三句的协议会让任何产品把它们压缩成一句。第一句最容易出现在主题演讲里。第三句才是真正在替那笔承诺还利息的那一句。

近期信息论研究——Finzi 等 2026 年提出的 epiplexity，把信息内容相对于"算力有界的观察者"重新定义——让这个区分变得可以形式化：能力不是问题的属性，而是 (问题, 观察者) 这一对的属性。两代设备面对同一工作负载，不是在以不同速度跑同一场比赛——它们在跑终点位置不同的比赛。任何软件努力都不会提升观察者的算力预算；软件越来越好，但运行环境仍然有限。协议要做的，是把"载体感知"做成头等结构，让能力声明与硬件能力相互问责。

缺失的不是新模型，而是一层协议

云端能力增长是事实，存量硬件无法一一承接也是事实。把两者连起来的尝试已经不止一种：

中心化云端推理——受时延、主权、长尾可达性约束。
激进 OTA 升级承诺——产生跨硬件代际的能力漂移：设备承诺的能力与实际能跑的能力之间逐渐失配。
孤立的边缘自治——失去跨设备知识传递。

每一条路径都有真实的成功区，但单独或合在一起，都不能支撑存量规模上的分布式智能。

第四条路径——我们一直朝着它构建的——是一个元协议层：通过它，设备可以声明自己实际能做什么、证明自己运行的载体、与网络其他部分交换能力，而不向任何中心化层交出控制权。

这里的"元协议"指的是关于"协议本身如何被声明、协商、演化"的协议——它不规定能力的实现，只规定能力如何被描述、验证、流通。

HTTP 做到的事，AI 还没做到

我们假设——并愿意接受公开质疑——这一层协议对 AI 能力的意义，可能类比 HTTP 对文档的意义。

1991 年时 Web 还不存在；到 2001 年它已经在重塑商业、教育、软件本身。技术前提只有一件事：一个不拥有内容、却定义了内容如何被任何人链接、寻址、渲染的协议。HTTP 没发明文本，没发明网络。它做的事是定义一个让两个不相关的方能就"什么是文档"达成一致的协调层。Web 的价值通过 HTTP 流动，但 HTTP 本身保持轻量、不被拥有、可演化。

把这一点对照当前 AI 能力的处境：没有任何被普遍接受的方式让一个系统能问另一个系统："你能做什么？运行在什么载体上？以什么保真度？带哪些可验证的保证？" 智能单元这一层没有 HTML 文档的对应物——没有可移植、可检视、可引用、可评估的工件。Function-calling 工具 schema 与 MCP 风格描述是 SDK 层的改进，不是协议层的改进。它们规范了调用约定，但没有规范载体感知——区分"能力可以运行"与"能力应当运行"的那一层。

类比成立到哪一步，需要时间和实证来检验。本文的假设是：成立到值得认真做的那一步。

算力门槛刚刚被穿越

边缘推理的连续改进不会改变架构层面的对话。但 2026 年实际发生的事情在质上不同。

对于一类多步 Agent 工作流——工具调用、中间推理、结构化输出、若干轮决策——吞吐门槛已经具体化。Google Gemma 3 家族的公开报告显示：较小变体在 Raspberry Pi 5 CPU 上的解码速率约为 7–8 tok/s；更上一档的变体在 Qualcomm 类移动 NPU 上的解码速率超过 30 tok/s [^gemma3]。这些速率足以在用户接受为"交互式"的钟壁时间预算内，支撑一段约 4000 token 输入加两次 skill 调用的完整工作流。

我们倾向把它视为一次质变而非渐进——同一份过去只能云端驻留的工作负载，现在通过合理工程努力可以在边缘驻留。判定这一观点是否成立、以及它在多大设备覆盖率上成立，需要后续在更广 benchmark 与更多机型上的可证伪实验。基于已公开的 benchmark，部分近代旗舰智能手机、部分车载娱乐平台、以及高端工业网关，已开始穿越这一交互门槛——具体覆盖比例需要 OEM 配合的硬件 profiling 才能给出。

可以更稳妥地说的一句是：对于这一类多步 Agent 工作流，瓶颈正在从硅本身转移到协议层缺位。

[^gemma3]: 数据点来自 Google Gemma 3 model card 与第三方在 Raspberry Pi 5 / Qualcomm AI Engine 上的公开 benchmark；具体数值随量化方案、量化精度、运行时实现而变。

TEE：让能力声明长出硬件根

如果协议要让"能力声明"对硬件可问责，那么这一层必须在硬件中找到一个物理接入面。在现有存量上，这个接入面是可信执行环境（TEE，Trusted Execution Environment）——设备芯片中可证明某段代码确实在受保护边界内运行的机制；现代手机、汽车 ECU、部分工业网关已普遍内置。

Rotifer Protocol 的 L0 Kernel 规约从一开始就把 TEE 列为四种合法 trust backend 之一，与分布式账本、密码学签名链、HSM 并列。本文论证的是操作层面的取舍：在四种之中，TEE 是唯一其部署面与消费级硬件部署面重合的——这使它成为元协议接入存量硬件的合理首选，而非唯一选择。

它在这一角色上有三条具体性质：

普遍可用性：TEE 类能力已存在于"已经出货、已经付款、已经在运转"的设备硅片中。
根植于硅片的完整性：携带 TEE 证明的能力声明，做出的是对照硅片级状态可验证的主张，而非对照软件级断言可验证。
根植于具体设备的身份：参与单位是"节点"而非"账户"的元协议，需要锚定在硅片中的身份，而不仅仅在密钥中。

TEE 本身对"能力是什么"不持任何观点。它能证明某段二进制以某种隔离状态运行并产生某种输出；它不能说这段二进制是不是某条已发布能力的诚实实现、输出是不是与其他能力正确组合、声明的资源使用是不是与实际资源使用一致。这些问题正是元协议层要回答的：

TEE 提供"硬件可信"，元协议提供"能力可知"。两者都必需；任何一方单独都不充分。

能力如何在设备上活下去

到此为止本文有意只用了"能力 / 设备 / 协议层 / 载体 / 保真度"这几个词。下面才是 Rotifer Protocol 为这一层抽象给出的具体词汇——它们都对应能力在异构硬件上活下去时必须区分的工程概念。

术语	含义
Phenotype（表型）	设备实际能呈现出来的能力集合，区别于设备理论上可能支持的能力清单。
Fidelity（保真度）	一项能力在某个载体上兑现原始声明的程度——同一项能力可能以 Native（原生编译）、Wrapped（API 包装）、Hybrid（混合）三种保真度存在。
Imprinting（本地印刻）	能力在特定设备、特定用户、特定网络环境中累积的本地经验——它本质是局部的，不应被强行通用化。
Adapter（适配器）	能力跨载体迁移时的翻译层——跨设备、跨保真度、跨 TEE 家族的转换由它承担。

把这套词汇放回手机这一最干净的部署面：

考虑一台仍在活跃使用的五年期智能手机。按当前行业默认设定，它只有两种未来：要么因为新能力够不到它而退役，要么以"逐渐与购买时承诺不符"的能力承诺勉强跟上。两种未来都是浪费，且都重复出现。

元协议提供第三种未来。设备声明它真实的 Phenotype——哪些能力它能 Native 跑、哪些只能 Wrapped 跑、哪些超出它的算力类别。它的 TEE 证明这些声明是诚实的。设备不假装支持它做不到的，协议也不让它假装。作为回报，设备接收适合自己载体的能力，并在剩余运行寿命里累积本地印刻的价值——一个用户习惯的模型、一台设备交互模式的模型、一个网络环境特征的模型。这些价值无法泛化到其他用户。它们也不需要。

最终用户换设备时，协议的 Adapter 层把跨设备迁移视为一种跨保真度翻译，由两端 TEE 共同证明。这一部分目前是 Adapter 设计草案，尚无生产实现——本节描述的是目标行为，而非已交付能力。

本文不主张什么

为防止本文自身所诊断的那种能力漂移，三类排除必须显式：

本文不主张为 Rotifer Protocol 部署 TEE 后端 Binding 的工程工作已完成或迫在眉睫。这里的论证位于战略与叙事层，与协议近期发布日程的工程优先级是解耦的。本文先于完整实现发布，因为方法论受益于"在产生第一次测量之前接受公开批评"。
本文不主张 TEE 异构性已被解决。当前部署的五大主要 TEE 家族在协议层尚不互通。桥接它们是 Adapter 层的职责；跨 TEE 证明是最具体的近期开放问题之一。
本文不主张 Rotifer 变成硬件公司。Rotifer 仍是协议层。Binding 是一份契约——一个运行时据此承载协议；TEE 后端 Binding 将是这样一份契约。基金会不提议代为制造硅片、认证设备、或代表 OEM 运营 TEE 基础设施。

这些排除不是套话。它们是本文其余论证赖以成立的基底。

协议成功的反常标准

元协议的成功标准与产品不同。成功的产品对其创建者越来越重要；成功的协议让其创建者越来越可被替代。HTTP 比它的原始商业支持者活得更久，因为协议的价值从任何单一方迁出。元协议最深的考验，是能否在其创建组织退场之后继续运行。

Rotifer Foundation 在协议网络中运营一个特权节点。这一特权存在于容量、中心性、早期采纳访问上，不存在于"必需性"上。协议的设计把基金会运营的基础设施视为多个特权节点中的一个——特权是因为它最早，不是因为协议依赖它。这个故事最成功的版本是：其他特权节点——由伙伴、社区、竞争者、与基金会无关系的实体运营——与基金会节点并行运营，协议在不区分它们的情况下繁荣。

需要明确：在协议早期阶段，基金会仍承担关键的工程协调与规约维护职责；"可被替代"是远期成功标志，不是当下状态。

开放问题与参与方式

对发现论证值得参与的读者，存在四个渠道。

开源贡献：协议规约、参考实现、配套论文以宽松许可证公开可用。欢迎通过开源社区给出实现反馈、规约审查、Adapter 贡献。

学术合作：信息论框架、Capable Edge profile、跨保真度翻译分析——每一项都连接到活跃的研究传统。我们在本综合中借用了种群生物学、复杂系统、机制设计、信息论、嵌入式系统研究者的工具，欢迎合作与质疑。

OEM / 集成商：协议远期路线包含 Binding 工作——其唯一现实工程路径需要产业参与。这条轨道上的对话不预设即时商业承诺；它们是关于"在多年地平线上能支撑生产部署的 Binding spec 形态"的对话。

早期生态参与方：基金会的策略围绕"作为开放生态中的特权节点"而非"捕获生态价值的平台"构建。

仍然开放、本文不假装已经回答的关键问题：

跨 TEE 家族的统一证明协议如何设计，才能避免成为新的中心化瓶颈；
Phenotype 声明与实际行为的偏离，如何被网络在不依赖人工审计的前提下可证伪地发现；
Imprinting 的本地价值如何在迁移中被忠实保持，又不泄露到本人之外；
元协议在不被任何单一 OEM 控制的前提下，长期演化的治理机制如何形成。

完整论证——包括信息论根基、协议的载体感知词汇、实现状态诚实分层、仍活跃的开放问题——见配套论文 Where Capability Lives, and How Hardware Earns the Right to Run It。本文是入口。读者被邀请在每一页上反对。