本文是专业学术论文解读,不做医疗建议。
少有临床试验的参与者会在研究社区发文袒露心路历程,凯西·哈雷尔(Casey Harrell)算是个例外。在最近一篇博文中,凯西表示,介绍自己每天使用脑机接口(BCI)的日常“有点枯燥”,毕竟,他已经如此生活了近三年。
2023 年,加州大学戴维斯分校(UC Davis)神经假体实验室的研究团队,为罹患晚期渐冻症(ALS)的凯西进行开颅手术,在他的大脑皮层上植入了包含 256 个穿透式电极的四组微电极阵列。
不到一年后,美国食品药品监督管理局(FDA)允许凯西的护理人员独立启动系统。6 月 15 日,团队在《自然-医学》(Nature Medicine)展示最新阶段性成果:凯西居家使用 BCI 设备的 19 个月中,装置累计工作时长达 3801 小时,共处理了 18.3 万个句子。
作为迄今为止规模最大的单神经元分辨率、个体大脑记录数据集,研究人员和凯西合作证实,颅内脑机接口具备日常辅助技术应有的长期稳定性和临床实用价值。
(来源:DOI: 10.1038/s41591-026-04414-6)
为摆脱专人操控,四台电脑接管了一切
自 2019 年确诊渐冻症以来,现年 48 岁的凯西已经丧失了基本的行动和语言表达能力。UC Davis 团队的装置可将他的大脑信号实时转化为文本,再借助播放系统,输出以其患病前声音“读”出的句子。
2024 年 8 月,研究人员在《新英格兰医学杂志》(NEJM)上首次发文,记录其完成植入手术的第一次开机过程。系统预热 30 分钟后,在 50 词测试中实现了 99.6% 的识别准确率;扩展到 12.5 万词汇量规模时,准确率仍有 90.2%。
2025 年 6 月,同一团队在《自然》(Nature)发文,介绍了一项实时脑控语音合成技术,该技术可绕过文字中转环节,直接把神经信号转成带有语调和节奏的声音。不过,在测试阶段,听者对合成语音的词级理解率仅为 60%,精度远低于文字中转方案,目前尚未正式用于凯西的脑机接口系统。
研究人员在实验中意外发现,植入其左侧腹侧中央前回(负责协调说话动作的运动皮层)的电极,除了识别语音意图,还能解码尝试移动手部时产生的运动信号,以此实现操纵电脑的功能。
数据显示,同一组电极同时驱动两种解码器,光标信号处理速率与专为手部运动设计的植入装置相当。
一开始,凯西每次启动脑机接口,都必须由研究团队现场操作设备完成。由于信号漂移问题,在正式使用前,还要花几十分钟校准仪器。
图 | 研究人员正在调试设备(来源:UC Davis)
长期植入过程中,电极采集的神经活动会发生动态变化,进而影响基于先前数据训练的解码模型表现。对此,研究人员在解码神经网络中加入了“日特异性嵌入层”,开机即自动适配当天信号特征,无需人工校准。
研究证实,在软件加持下,超过 90% 的植入电极在 19 个月后仍能可靠检测神经信号,与语音相关的神经表征也保持稳定。
除了每日校准,模型此前还要定期中断使用,进行正式校准训练。新系统采用了后台持续微调方案:在正常使用过程中,设备自动收集被用户打高分的句子,每积累 5~6 句就触发一轮训练,其中约三分之二进入训练集、三分之一进入验证集,验证集表现优于当前模型时就更新权重。这些适应性处理,让每天开机时的可选校准时间从 17 分钟降至约 9 分钟。
基于这些优化,植入后第 281 天,FDA 批准了一项设备豁免修改,允许护理人员在研究人员不在场时启动该系统。
软件接管了所有组件的初始化过程,四台各有分工的电脑组成本地局域网,分别负责信号采集、特征提取、神经网络推理和语言模型解码。它们通过团队自研的 BRAND(实时异步神经解码后端)框架实现同步通信,共同支撑脑机接口的运转。
这极大减轻了照护者的工作负担,凯西的妻子每天仅需抽出 20 分钟进行简单的准备工作。通电开机后,凯西将利用它实现语音输出、电脑光标移动和点击功能,设备最长可连续工作 19 个小时。
图 | 整套设备组成了一个巨大的可移动机柜。(来源:UC Davis)
推理架构也进行了对应迭代。早期版本使用循环神经网络,其逐帧推理能力在控制类任务上表现良好,但后续加入的语音解码功能需要更强的上下文整合能力。
植入后第 600 天起,团队将语音解码器替换为 Transformer 架构,对延迟更敏感的光标解码器仍保留 RNN 结构,两种模型并行运行。除了精度提升,这一升级有效缩减了解析延迟,实时对话体验大幅提升。
图 | 语音解码模块正在工作(来源:UC Davis)
团队表示,一系列“过度配置”的技术工程优化,使这套设备的复杂程度远超临床可用的真实产品。他们牺牲了便携性,换来的是可靠性:系统在 19 个月内几乎没有发生严重故障。
为保护隐私,设备还内置了“免数据发送模式”,凯西在该模式下产生的数据不会被回传到研究人员手中。
使用数据和日常体验
居家数据显示,在总计 3,801 小时的使用时长中,约 60% 被用于自由对话和语音通信,通过光标操作个人电脑的时间约占 20%,剩余时间分散在其他通信和娱乐场景。
值得一提的是,利用这套设备,凯西保住了他在气候政策领域的咨询工作,维持着家庭收入和医疗保险,每天还能和七岁的女儿玩英文猜词游戏。
图 | 凯西·哈雷尔(Casey Harrell)一家(来源:UC Davis)
在生成的 18.3 万个句子里,凯西将其中的 53.3% 标记为“完全正确”,另有 38.4% 被标记为“基本正确但有错误”,整体可用率达到 92% 左右。受控测试中,凯西借助脑机接口复述屏幕上预先准备好的提示句,词级准确率高达 99.2%。
数据揭示脑机接口也会“疲劳”:连续使用的时间过长,解码精度就会出现显著下降。对此凯西表示,自己会“劳逸结合”。
在效率方面,凯西的平均通信速度为每分钟 56 词。虽然比此前使用的头部鼠标拼写工具(每分钟约 6.3 词)快了不少,但还达不到正常英语对话水平(每分钟 120 到 150 词)。
系统支持发声尝试和默语两种模式。前者需要努力发声,这种模式的神经活动信号最完整,解码准确率达到约 99%,但速度较慢,且耗体力;默语功能只需“对口型”,神经信号略弱,准确率降至约 96.5%,速度提升至每分钟 50 词。
凯西在二者之间主动做出了取舍,他在日常使用中更倾向于默语模式。他给出的解释是,对于渐冻症患者,省力在大多数情况下比绝对精准重要。
一个人的成功能推广吗?
凯西表示,介绍自己每天使用脑机接口的过程其实很“无聊”,这让研究者感到震惊。但他们进一步解释道,“无聊”其实是个好信号,说明脑机接口已经完全融入日常生活,成为一种自然而然的习惯。
只是,实现这种“无聊”的条件极其严苛。凯西是一个近乎理想化的脑机接口使用场景:他的认知功能完全正常,对系统的反馈准确而具体,同时有稳定的护理支持。而且,为了支撑工作和家庭收入,凯西的使用动机极强,对漫长的迭代周期极具耐心,愿意配合团队不断更换解码器架构、调整界面设计、采集训练数据。
凯西的 BCI 系统在长达 19 个月的居家使用中未见明显退化。然而,抛开性能不谈,设备在更长时间尺度中的稳定性,还取决于疾病进展程度和大脑受损状况。
团队明确指出,这项结果无法直接推及其他植入位置、其他疾病或其他参与者。这套系统的运作前提是使用者有能力激活大脑发出运动指令。因此,脑干中风导致的闭锁综合征、高位脊髓损伤等,将因运动皮层本身或更上游通路受损而不适用。
此外,渐冻症属于进行性神经退行性疾病,随着病程发展,运动皮层功能也可能受累。荷兰乌得勒支大学(Utrecht University)团队此前报告过另一项长期使用植入式脑机接口的案例。
从 2016 年起,一位渐冻症患者在家独立使用一套基于皮层脑电(ECoG)的脑控点击系统。CT 成像显示,渐冻症导致的脑萎缩使神经信号幅度下降,在第 6 年后,患者逐渐失去了控制脑机接口的能力。
博文中,凯西给出的设备改进优先级排名依次是便携、无线、实时脑到声合成。
他头上的电极阵列虽然解码精度高,但必须在他人协助下有线连接至四台大型外部设备,与便携性可谓背道而驰;团队研发出了实时信号合成语音技术,精度却不够理想。
事实上,截至目前,有关脑机接口的探索都难以兼顾信号质量、侵入程度、电极寿命和功能要求。
马斯克旗下的 Neuralink 使用穿透式无线电极,可通过手术机器人植入,主要实现光标和键盘控制,未公开语音解码成果;Synchron 利用血管介入放置电极,侵入性最低,但信号分辨率也最低;Paradromics 正在开发专注于语音恢复的全植入式高数据率装置。
技术之外,脑机接口的落地还与监管和商业体系密切相关。对于用于通信和运动控制的植入式脑机接口,FDA 目前只授予研究性器械豁免(IDE),仅可在严格控制的临床试验中使用,不允许商业销售。
Synchron 系统的进度最快,预计将在 2026 年内启动关键性试验。即便一切顺利,第一款通信类脑机接口产品获批也要等到 2028 年前后。更远的商业推广阶段,生产商、手术资质、保险体系和后续运维支持等都是门槛。
(来源:Springer Nature Research Communitis)
凯西在博文最后写道,希望自己再也不要出现在与脑机接口有关的报道里。“换句话说,我不想再被当成特例。”
但事实是,在未来相当长一段时间内,他很可能依然是世界上唯一一个每天用脑机接口上班、陪女儿读绘本、玩游戏的人。
参考内容:
https://www.nature.com/articles/s41591-026-04414-6
https://ucdavis.app.box.com/s/hqmpk4s8s1s40wradelji6gpo89oyh34
https://www.nature.com/articles/d41586-026-01863-4
https://health.ucdavis.edu/news/headlines/first-of-its-kind-technology-helps-man-with-als-speak-in-real-time/2025/06
https://health.ucdavis.edu/news/headlines/new-brain-computer-interface-allows-man-with-als-to-speak-again/2024/08
https://communities.springernature.com/posts/living-life-through-a-brain-computer-interface-223d2ee9-5491-4929-91cf-306d6429eeab
本文是专业学术论文解读,不做医疗建议。
运营/排版:何晨龙
注:封面/首图由 AI 辅助生成