研究示意圖。圖片來源:《自然·神經(jīng)科學》
科技日報記者?張夢然
英國《自然·神經(jīng)科學》發(fā)表的一篇論文,描述了一種非侵入性的語言解碼器,可通過功能性磁共振(fMRI)數(shù)據(jù),重建感知到或想象出的語言。
過去的語音解碼器被用于侵入性神經(jīng)外科手術后記錄神經(jīng)活動,這限制了它們的用途。其他使用非侵入性腦活動記錄的解碼器限制在解碼單個詞匯或短語,還不清楚此類解碼器是否可用于連續(xù)的自然語言。
美國得克薩斯大學奧斯汀分校研究人員開發(fā)了一個解碼器,可通過來自fMRI數(shù)據(jù)獲得的腦模式重建連續(xù)語言。他們記錄了3名參與者傾聽16小時敘事故事的fMRI數(shù)據(jù),以訓練模型在腦活動和語義特征之間進行映射,捕捉特定詞組含義和相關的大腦響應。這一解碼器模型隨后測試了參與者聽新故事的腦響應,這些故事沒有用在初始訓練數(shù)據(jù)集中。使用這一腦活動,解碼器可生成詞匯序列,捕捉到新故事的含義,還生成了一些精確的故事詞匯和短語。他們發(fā)現(xiàn),解碼器可從大多數(shù)已知處理語言的腦區(qū)和網(wǎng)絡的活動中推斷連續(xù)語言。
這一解碼器還可通過fMRI數(shù)據(jù)預測某個參與者想象的故事的含義,或觀看一部無聲電影的內(nèi)容。當一名參與者主動聽一個故事,忽略其他同時播放的故事,解碼器可識別出那個被主動聽的故事的含義。
團隊對解碼器作了隱私分析,發(fā)現(xiàn)當它基于一名參與者的fMRI數(shù)據(jù)進行訓練時,對預測另一名參與者數(shù)據(jù)的語義內(nèi)容預測表現(xiàn)不佳。他們總結說,參與者的合作在訓練和應用這些非侵入性解碼器中非常關鍵,而未來此類技術的發(fā)展,亦需要政策保護心理隱私。