“亞楠是現(xiàn)代的具有文藝復(fù)興風(fēng)格的研究者?!?/p>

加州理工學(xué)院的 Yisong Yue 教授對(duì)眭亞楠給出了頗富詩(shī)意的評(píng)價(jià)。這個(gè)通常用來(lái)描述建筑或文藝作品的形容詞放在他身上,意味著導(dǎo)師對(duì)其研究風(fēng)格和成果的高度肯定。

過(guò)去十年中,眭亞楠一直身處機(jī)器學(xué)習(xí)、神經(jīng)工程、機(jī)器人三個(gè)前沿學(xué)科的交叉領(lǐng)域,通過(guò)將原創(chuàng)機(jī)器學(xué)習(xí)方法引入神經(jīng)調(diào)控技術(shù),對(duì)癱瘓、帕金森病等神經(jīng)系統(tǒng)疾病進(jìn)行臨床治療,在理論、方法、實(shí)踐三個(gè)方向均有建樹。

在 2020 年機(jī)器人與自動(dòng)化國(guó)際會(huì)議(ICRA)上,他與合作者關(guān)于偏好反饋學(xué)習(xí)優(yōu)化機(jī)器人外骨骼的研究成果同時(shí)斬獲大會(huì)最佳論文獎(jiǎng)和最佳人機(jī)交互論文獎(jiǎng),成為首位獲得最佳論文獎(jiǎng)的中國(guó)大陸學(xué)者。這也是大會(huì)歷史上首次有論文同時(shí)獲得兩項(xiàng)大獎(jiǎng)。

憑借在機(jī)器學(xué)習(xí)和神經(jīng)調(diào)控技術(shù)領(lǐng)域的基礎(chǔ)理論研究以及創(chuàng)新技術(shù)應(yīng)用,清華大學(xué)航天航空學(xué)院助理教授眭亞楠入選了《麻省理工科技評(píng)論》“35 歲以下科技創(chuàng)新 35 人” 2020 年中國(guó)區(qū)榜單。

清華學(xué)者讓AI學(xué)習(xí)神經(jīng)調(diào)控,幫癱瘓患者重新站立-肽度TIMEDOO

圖 | 《麻省理工科技評(píng)論》“35 歲以下科技創(chuàng)新 35 人” 2020 年中國(guó)區(qū)榜單入選者眭亞楠

讓 AI 學(xué)習(xí)神經(jīng)調(diào)控

眭亞楠本科畢業(yè)于清華大學(xué),曾在中國(guó)科學(xué)院神經(jīng)所研究神經(jīng)環(huán)路可塑性。在 2019 年加入清華任教之前,他先后在加州理工學(xué)院和斯坦福大學(xué)攻讀博士學(xué)位及從事博士后研究,師從 Joel Burdick 教授、Yisong Yue 教授及 Fei-Fei Li 教授。

談到返回清華的原因,他表示自己 “在留學(xué)之前就希望回國(guó)建立自己的實(shí)驗(yàn)室做研究,現(xiàn)在我就在清華,是如愿以償。”

神經(jīng)調(diào)控技術(shù),一般指利用植入或非植入技術(shù)、電或化學(xué)作用方式,刺激或改變神經(jīng)系統(tǒng)中的神經(jīng)元或神經(jīng)信號(hào)。目標(biāo)人群通?;加猩窠?jīng)系統(tǒng)損傷、運(yùn)動(dòng)障礙、癱瘓、視覺或聽覺障礙等疾病。

眭亞楠告訴 DeepTech,神經(jīng)調(diào)控是治療此類疾病的重要方法。他長(zhǎng)期關(guān)注脊神經(jīng)損傷導(dǎo)致的癱瘓,因?yàn)檫@個(gè)領(lǐng)域曾長(zhǎng)期缺乏安全高效的治療手段。

通過(guò)植入脊髓的陣列電極,刺激感覺-運(yùn)動(dòng)神經(jīng)通路,是目前治療脊髓損傷導(dǎo)致癱瘓的最先進(jìn)醫(yī)療方案。

清華學(xué)者讓AI學(xué)習(xí)神經(jīng)調(diào)控,幫癱瘓患者重新站立-肽度TIMEDOO

圖 | 將刺激電極(中)植入脊髓硬膜外進(jìn)行治療(來(lái)源:眭亞楠)

不過(guò)使用這些陣列電極時(shí),還要面臨不少問(wèn)題,其中核心難點(diǎn)是尋找最佳刺激模式。

患者的生理和病理差異,決定了每個(gè)人對(duì)電壓水平和刺激頻率的承受能力不同。而在臨床治療中,面對(duì)海量的刺激模式組合,用試錯(cuò)、窮舉的實(shí)驗(yàn)方法為每個(gè)患者尋找最佳方案也是不切實(shí)際的。

那能不能讓人工智能(AI)來(lái)解決這個(gè)問(wèn)題?

如果把所有可能的刺激模式視作一個(gè)輸入空間,那么就可以把諸如電極、電壓、頻率一類的變量的排列組合都羅列出來(lái),然后進(jìn)行全局優(yōu)化。把這個(gè)過(guò)程抽象成函數(shù),就可以嘗試用傳統(tǒng)優(yōu)化算法找到函數(shù)的最優(yōu)解。

遺憾的是,傳統(tǒng)優(yōu)化方法在實(shí)際操作中行不通,因?yàn)槠胀ǖ娜謨?yōu)化策略無(wú)法顧及安全約束,尤其是未知的安全約束。

在沒(méi)有在患者身上施加刺激之前,沒(méi)人知道哪種刺激模式會(huì)奏效,同樣也沒(méi)人知道哪種刺激模式會(huì)造成傷害 —— 這就是所謂的 “未知安全約束”。

清華學(xué)者讓AI學(xué)習(xí)神經(jīng)調(diào)控,幫癱瘓患者重新站立-肽度TIMEDOO

圖 | 脊神經(jīng)刺激在線臨床實(shí)驗(yàn)(來(lái)源:yanansui.com)

醫(yī)生會(huì)充分考慮在施加神經(jīng)刺激的過(guò)程中保障患者安全,但傳統(tǒng) AI 方法面對(duì)未知的安全約束時(shí),尋找最優(yōu)解的過(guò)程可能缺乏安全性。

針對(duì)這個(gè)難題,眭亞楠開發(fā)了用于控制復(fù)雜多電極刺激陣列的新型在線學(xué)習(xí)算法的理論和實(shí)踐方法,在保證算法滿足安全約束的前提下,高效尋找最優(yōu)解。這些方法還能拓展到如深部腦刺激等其他多電極問(wèn)題和機(jī)器人系統(tǒng)的安全控制。

更重要的是,他的研究成果已經(jīng)成功幫助下肢癱瘓患者重新站起來(lái),并恢復(fù)高位截癱患者手部抓握功能,是這個(gè)領(lǐng)域最早用于有創(chuàng)臨床治療的機(jī)器學(xué)習(xí)算法之一。

如何滿足未知的安全約束

具體來(lái)說(shuō),眭亞楠利用并融合了自己之前的兩項(xiàng)研究成果:面向未知安全約束的在線機(jī)器學(xué)習(xí)方法和利用偏好反饋進(jìn)行在線強(qiáng)化學(xué)習(xí)。

第一項(xiàng)工作是他在加州理工學(xué)院攻讀博士時(shí)開始的,主要解決在線強(qiáng)化學(xué)習(xí)方法缺乏安全性保證的問(wèn)題。

在探索優(yōu)化問(wèn)題時(shí),研究者通常會(huì)設(shè)立約束,但有時(shí)人們并不知道全部的約束條件。以此為前提,AI 算法需要既滿足約束條件,又要求出最優(yōu)解。

他提出的方法是首先將安全約束抽象成一個(gè)函數(shù) —— 由于安全約束條件未知,因此函數(shù)的形狀也是未知的 —— 但可以利用高斯過(guò)程作為數(shù)學(xué)工具對(duì)其建模,由此得到安全約束在數(shù)學(xué)上的顯式表達(dá)式。

在此基礎(chǔ)上加入一些合理的假設(shè)和初始值,比如由人類專家提供一套安全的神經(jīng)刺激模式作為初始點(diǎn),然后就可以利用在線學(xué)習(xí)等 AI 算法不斷摸索并擴(kuò)大安全區(qū)間,勾勒出滿足安全約束的函數(shù)的形狀。

清華學(xué)者讓AI學(xué)習(xí)神經(jīng)調(diào)控,幫癱瘓患者重新站立-肽度TIMEDOO

圖 | 利用高斯過(guò)程進(jìn)行安全優(yōu)化(來(lái)源:眭亞楠)

這個(gè)過(guò)程有點(diǎn)像打游戲,玩家在探索戰(zhàn)爭(zhēng)迷霧籠罩的未知區(qū)域:選擇安全的出生點(diǎn)之后,玩家要一點(diǎn)點(diǎn)逼近迷霧邊緣,才能開拓視野,探明地圖上哪些區(qū)域是安全的,哪些區(qū)域是不安全的,然后確保自己在安全區(qū)內(nèi)活動(dòng)。

眭亞楠提出的安全在線探索理論和方法,經(jīng)過(guò)理論證明和實(shí)踐驗(yàn)證,其安全性和有效性受到了肯定,并且引發(fā)了學(xué)術(shù)界和產(chǎn)業(yè)界的廣泛關(guān)注。相關(guān)成果已成為加州理工學(xué)院、斯坦福大學(xué)、卡耐基梅隆大學(xué)等頂尖高校的本科課程和教材內(nèi)容。

清華學(xué)者讓AI學(xué)習(xí)神經(jīng)調(diào)控,幫癱瘓患者重新站立-肽度TIMEDOO

圖 | 入選頂尖高校教材的 SafeOpt 算法(來(lái)源:yanansui.com)

處理非量化信息的偏好反饋

利用偏好反饋進(jìn)行在線強(qiáng)化學(xué)習(xí),則是從 AI 算法難以處理非量化信息的角度切入。相關(guān)研究成果不僅用于脊髓電刺激治療上,還能用于外骨骼機(jī)器人控制優(yōu)化上。

以外骨骼機(jī)器人為例,它的參數(shù)包括重量、尺寸、步態(tài)、跨步長(zhǎng)度、關(guān)節(jié)靈敏度等等。通過(guò)改變這些參數(shù),研究者可以在一定程度上調(diào)節(jié)使用者的舒適度,比如盡量減少消耗的能量,使其走起路來(lái)更輕松。

但在實(shí)際應(yīng)用中,使用者的反饋通常是 “不舒服”,“現(xiàn)在感覺不錯(cuò)”,或者 “更喜歡上一種控制模式”,這些都是不易量化的信息。

“每個(gè)人的偏好是不同的。即使是客觀的量化指標(biāo),比如代謝率、呼吸頻率、心率等等,它們和使用者的偏好之間的關(guān)聯(lián)度也不太強(qiáng),沒(méi)辦法準(zhǔn)確描述使用者的偏好,” 眭亞楠解釋道。

針對(duì)這個(gè)問(wèn)題,他將偏好反饋構(gòu)建成一個(gè)對(duì)弈過(guò)程的勝負(fù)結(jié)果,通過(guò)構(gòu)建自博弈機(jī)制,可以靈活處理結(jié)構(gòu)化與非結(jié)構(gòu)化的輸入,并且從理論上證明了漸進(jìn)最優(yōu)的收斂性。

通過(guò)對(duì)偏好反饋的有效收集和利用,外骨骼機(jī)器人可以快速且自動(dòng)地適應(yīng)每個(gè)用戶,實(shí)現(xiàn)控制方案的優(yōu)化。

也就是關(guān)于這項(xiàng)研究的論文,最終斬獲 2020 年機(jī)器人與自動(dòng)化國(guó)際會(huì)議(ICRA)大會(huì)最佳論文獎(jiǎng)和最佳人機(jī)交互論文獎(jiǎng)。

應(yīng)用廣泛,科技向善

如文章開頭所說(shuō),眭亞楠的研究方向正處于機(jī)器學(xué)習(xí)、神經(jīng)工程、機(jī)器人三個(gè)前沿學(xué)科的交叉領(lǐng)域,其研究成果有著十分廣泛的應(yīng)用場(chǎng)景。

譬如在醫(yī)學(xué)領(lǐng)域,可以改善癱瘓、帕金森病等神經(jīng)系統(tǒng)疾病的臨床治療效果,讓患者重新恢復(fù)運(yùn)動(dòng)能力,還能拓展到如深部腦刺激等其他多電極問(wèn)題。而在機(jī)器人和航空航天領(lǐng)域,可以用于外骨骼機(jī)器人,無(wú)人機(jī)飛行器,甚至是火星車上,實(shí)現(xiàn)更高效地控制參數(shù)優(yōu)化以及安全操控。

目前,除了持續(xù)拓展上述科研項(xiàng)目,眭亞楠還啟動(dòng)了有關(guān)醫(yī)療數(shù)據(jù)隱私保護(hù)的新課題,專注于解決醫(yī)學(xué)人工智能領(lǐng)域的現(xiàn)實(shí)挑戰(zhàn)。

用于醫(yī)學(xué)研究的數(shù)據(jù)共享一直是業(yè)界難題,如果操作不當(dāng),開源臨床數(shù)據(jù)很可能會(huì)泄露患者的隱私。

相較于醫(yī)學(xué)影像等數(shù)據(jù),有關(guān)運(yùn)動(dòng)障礙或者交互行為的視頻資料更難處理。雖然可以打上馬賽克,但會(huì)影響后續(xù)的分析工作。

眭亞楠另辟蹊徑,選擇了 Deepfake 作為患者隱私保護(hù)的工具。這是一種可以替換視頻中人臉的技術(shù),但因被用于制造假視頻而受到廣泛批評(píng)。

這并不妨礙技術(shù)本身的價(jià)值。他的研究表明,利用 Deepfake 技術(shù),醫(yī)療視頻中患者的臉部可以被替換為適當(dāng)?shù)哪繕?biāo)臉部,保護(hù)患者面部隱私,同時(shí)保留所需的互動(dòng)信息(例如面部表情)供研究人員分析和診斷。

清華學(xué)者讓AI學(xué)習(xí)神經(jīng)調(diào)控,幫癱瘓患者重新站立-肽度TIMEDOO

圖 | 用 Deepfake 實(shí)現(xiàn)患者視頻隱私保護(hù):左圖是換臉之前,右圖是換臉之后(來(lái)源:眭亞楠)

這是一個(gè)很好的科技向善的應(yīng)用案例:技術(shù)作惡還是從善,很大程度上取決于人們?nèi)绾问褂盟?/p>

清華大學(xué)航天航空學(xué)院院長(zhǎng)李路明教授認(rèn)為,眭亞楠獨(dú)特而新穎的嘗試使得 “開源高質(zhì)量的醫(yī)學(xué)視頻數(shù)據(jù)集更加可行,并且促進(jìn)了有益于整個(gè)社會(huì)的未來(lái)醫(yī)學(xué)研究?!?/p>

相關(guān)成果發(fā)表于人工智能倫理學(xué)研究領(lǐng)域的領(lǐng)先會(huì)議 AIES 上,是第一篇被 AIES 接收的中國(guó)論文,也受到?Science?雜志的關(guān)注和報(bào)道。

談及未來(lái),眭亞楠表示將繼續(xù)帶領(lǐng)研究組從事機(jī)器學(xué)習(xí)、機(jī)器人學(xué)和神經(jīng)調(diào)控的基礎(chǔ)研究,推動(dòng)患者隱私保護(hù)和在此基礎(chǔ)上的醫(yī)學(xué)人工智能研究。他還將繼續(xù)與醫(yī)院合作進(jìn)行臨床轉(zhuǎn)化研究,服務(wù)更多患者。

“我希望以人工智能為代表的先進(jìn)計(jì)算技術(shù)能做到更多人類做不到的事情,而非人類擅長(zhǎng)的事情,”他強(qiáng)調(diào),“隨著相關(guān)技術(shù)的進(jìn)步,人類在智能層面將面臨越來(lái)越多的挑戰(zhàn)。作為研究者,我們應(yīng)該有更強(qiáng)的責(zé)任意識(shí),要從超越技術(shù)的角度看待 AI 的發(fā)展?!?/p>

來(lái)源:麻省理工科技評(píng)論