天津工生所在哺乳動(dòng)物細(xì)胞高通量基因編輯平臺(tái)構(gòu)建及堿基編輯AI預(yù)測(cè)模型方面獲進(jìn)展
堿基編輯器(Base Editor,BEs)能夠有效修改基因組的特定堿基,為糾正人類已知的致病性單核苷酸變異(Single nucleotide variations,SNVs)帶來希望。基礎(chǔ)科學(xué)探索和疾病治療應(yīng)用亟需構(gòu)建大量具有致病性SNV的疾病細(xì)胞模型用于科學(xué)研究,而傳統(tǒng)疾病細(xì)胞模型的構(gòu)建主要依賴人工操作,不僅耗時(shí),而且成本高昂、易出錯(cuò)。
中國(guó)科學(xué)院天津工業(yè)生物技術(shù)研究所研究員王猛帶領(lǐng)的高通量編輯與篩選平臺(tái)實(shí)驗(yàn)室、研究員畢昌昊帶領(lǐng)的合成生物技術(shù)實(shí)驗(yàn)室、研究員張學(xué)禮帶領(lǐng)的微生物代謝工程實(shí)驗(yàn)室合作,首次建立了自動(dòng)化的哺乳動(dòng)物細(xì)胞高通量基因操作平臺(tái),可在一周內(nèi)實(shí)現(xiàn)上千個(gè)動(dòng)物細(xì)胞樣本的自動(dòng)化編輯,且編輯效率與手動(dòng)操作效率相當(dāng)?;诟咄科脚_(tái)獲得的293T細(xì)胞大量原位基因組編輯數(shù)據(jù),研究人員開發(fā)了機(jī)器學(xué)習(xí)模型(CAELM)來預(yù)測(cè)胞嘧啶堿基編輯器(BE4max)的性能。與基于慢病毒整合靶點(diǎn)的傳統(tǒng)機(jī)器學(xué)習(xí)建模相比,本研究創(chuàng)新性地在模型構(gòu)建中考慮目標(biāo)序列的真實(shí)染色體環(huán)境,結(jié)合編輯靶點(diǎn)序列信息進(jìn)行機(jī)器學(xué)習(xí),首次提出染色質(zhì)可及性對(duì)編輯結(jié)果的影響權(quán)重相對(duì)于靶點(diǎn)序列是1/6。為了擴(kuò)展CAELM預(yù)測(cè)的兼容性,使CAELM模型適用于更多類型的細(xì)胞及不同的CBE堿基編輯器,科研人員在追加的相對(duì)較小的不同細(xì)胞類型(HepG2)及堿基編輯器(hyA3A-BE4max和Anc-BE4max)的編輯數(shù)據(jù)集上,使模型進(jìn)行進(jìn)一步訓(xùn)練學(xué)習(xí),擴(kuò)展了CAELM的預(yù)測(cè)范圍。該模型可以比現(xiàn)有模型更準(zhǔn)確的預(yù)測(cè)細(xì)胞原位靶點(diǎn)的堿基編輯結(jié)果,并為準(zhǔn)確預(yù)測(cè)人類或其他物種細(xì)胞堿基編輯結(jié)果的機(jī)器學(xué)習(xí)模型的構(gòu)建奠定了基礎(chǔ)。這一工作有望加速基于BEs的基因療法的開發(fā)和臨床應(yīng)用。
相關(guān)研究成果發(fā)表在《自然-通訊》(Nature Communications)上。研究工作得到國(guó)家自然科學(xué)基金、國(guó)家重點(diǎn)研發(fā)計(jì)劃、天津市合成生物技術(shù)創(chuàng)新能力提升行動(dòng)、天津市自然科學(xué)基金的支持。
高通量自動(dòng)化哺乳動(dòng)物細(xì)胞編輯流程示意圖
來源:中科院


本文系作者 @TIMEDOO 原創(chuàng)發(fā)布在 肽度TIMEDOO。未經(jīng)許可,禁止轉(zhuǎn)載。