【资料图】
一种称为语义解码器的新型人工智能系统可以将一个人在听故事或静静地想象讲故事时的大脑活动转化为连续的文本流。德克萨斯大学奥斯汀分校的研究人员开发的系统可能会帮助那些有精神意识但无法用身体说话的人,例如那些因中风而虚弱的人,再次进行清晰的交流。
这项研究发表在《自然神经科学》杂志上,由计算机科学博士生 Jerry Tang 和 UT Austin 神经科学和计算机科学助理教授 Alex Huth 领导。这项工作部分依赖于变压器模型,类似于为 Open AI 的 ChatGPT 和谷歌的 Bard 提供动力的模型。
与开发中的其他语言解码系统不同,该系统不需要受试者进行手术植入,从而使该过程无创。参与者也不需要只使用规定列表中的单词。在对解码器进行大量训练后,使用 fMRI 扫描仪测量大脑活动,在解码器中,个人会在扫描仪中收听数小时的播客。之后,如果参与者愿意解码他们的想法,他们听一个新故事或想象讲一个故事就可以让机器仅从大脑活动中生成相应的文本。
“对于一种非侵入性方法,与以前所做的相比,这是一个真正的飞跃,以前通常是单个单词或短句,”Huth 说。“我们正在让模型用复杂的想法长时间解码连续的语言。”
结果不是逐字逐句的成绩单。相反,研究人员将其设计为捕捉所说或所想内容的要点,尽管并不完美。大约一半的时间,当解码器被训练来监控参与者的大脑活动时,机器会生成与原始单词的预期含义密切(有时精确)匹配的文本。
例如,在实验中,一位参与者在听演讲者说“我还没有驾照”时,他们的想法会被翻译成“她甚至还没有开始学开车”。听着这句话,“我不知道是该尖叫、哭泣还是逃跑。相反,我说,"别管我!"”被解码为,“开始尖叫和哭泣,然后她只是说,"我告诉过你别管我。"”