在紐約剛剛舉辦的第十一屆RECOMB/ISCB會(huì)議公布了DREAM Challenge 單細(xì)胞轉(zhuǎn)錄組挑戰(zhàn)賽和多靶點(diǎn)藥物預(yù)測(cè)挑戰(zhàn)賽的比賽結(jié)果。上海科技大學(xué)和中科院上海藥物所聯(lián)合培養(yǎng)的博士研究生熊招平以總分28分的最高分獲得多靶點(diǎn)藥物預(yù)測(cè)挑戰(zhàn)賽冠軍,指導(dǎo)老師是來(lái)自中國(guó)科學(xué)院上海藥物研究所的蔣華良院士和鄭明月研究員。
多靶點(diǎn)藥物,是指同時(shí)作用于疾病相關(guān)網(wǎng)絡(luò)中多個(gè)靶點(diǎn)的藥物。多年來(lái),一些科研人員認(rèn)為多靶點(diǎn)作用就意味著選擇性差,更加傾向于開(kāi)發(fā)作用于單一靶點(diǎn)的高特異性藥物。然而,人體是一個(gè)有機(jī)整體,很多疾病必須要同時(shí)精細(xì)調(diào)控多個(gè)靶點(diǎn)才能得到控制。這種背景下通過(guò)調(diào)控多個(gè)靶點(diǎn)發(fā)揮作用的藥物不是選擇性低,而是選擇性更高,作用更精準(zhǔn),即一定要作用于某些靶點(diǎn),而又一定不能作用于另外一些靶點(diǎn)。以針對(duì)多靶點(diǎn)設(shè)計(jì)的蛋白激酶抑制劑PP121為例,該化合物不僅可以靶向酪氨酸激酶,還可以阻斷mTOR和PI3K之間的負(fù)反饋通路,從而具有更好的協(xié)同作用。目前已發(fā)現(xiàn)有多種靶向激酶抗腫瘤藥物的臨床療效與其多向藥理學(xué)作用相關(guān)。然而,目前大多數(shù)激酶抑制劑通過(guò)與激酶高度保守的ATP結(jié)合口袋結(jié)合發(fā)揮作用,選擇性低且易于產(chǎn)生毒副作用。因此,開(kāi)發(fā)新型、有效和安全的激酶抑制劑,需要實(shí)現(xiàn)化合物多向藥理和選擇性的均衡,這是十分具有挑戰(zhàn)性的。
在本次比賽中,要求選手利用私有和公開(kāi)的生物活性數(shù)據(jù),找到對(duì)幾個(gè)特定蛋白靶點(diǎn)有活性,但對(duì)另外幾個(gè)靶點(diǎn)不能有活性的化合物,也就是要求化合物具有高度精準(zhǔn)的多靶點(diǎn)選擇性。為了對(duì)算法進(jìn)行客觀驗(yàn)證,比賽組織方要求找出的化合物是ZINC15數(shù)據(jù)庫(kù)中可購(gòu)買的化合物,之后賽方會(huì)根據(jù)參賽者提交的算法創(chuàng)新性和可擴(kuò)展性,以及化合物結(jié)構(gòu)的新穎性來(lái)選擇性地購(gòu)買化合物樣品進(jìn)行生物活性測(cè)試。最后根據(jù)第三方的實(shí)驗(yàn)測(cè)試結(jié)果給參賽者打分。熊招平在甲狀腺髓樣瘤和tau蛋白神經(jīng)退行性模型兩項(xiàng)任務(wù)中均斬獲全場(chǎng)最高分,從190個(gè)參賽隊(duì)伍中脫穎而出。
據(jù)悉,這次挑戰(zhàn)賽中并不是所有靶點(diǎn)蛋白都有被解析的三維結(jié)構(gòu),熊招平發(fā)揮中國(guó)科學(xué)院上海藥物研究所藥物設(shè)計(jì)與發(fā)現(xiàn)中心長(zhǎng)期積累的基礎(chǔ)優(yōu)勢(shì)以及團(tuán)隊(duì)最近發(fā)展的將人工智能處理自然語(yǔ)言等序列類型數(shù)據(jù)的創(chuàng)新方法,對(duì)靶點(diǎn)蛋白進(jìn)行編碼,并利用最新的圖神經(jīng)網(wǎng)絡(luò)原理對(duì)小分子圖結(jié)構(gòu)建模,最終生成一個(gè)端到端的神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型,該AI模型不需要像傳統(tǒng)機(jī)器學(xué)習(xí)算法進(jìn)行人工特征選取,從而使模型具有很高的擴(kuò)展性和預(yù)測(cè)能力。這一結(jié)果也表明人工智能和機(jī)器學(xué)習(xí)在提高創(chuàng)新藥物研發(fā)效率方面的巨大潛力。
熊招平的導(dǎo)師之一蔣華良院士說(shuō):人工智能正成為藥物研發(fā)的重工具,上海藥物研究所多年前已布局這一研究方向,并與化學(xué)生物學(xué)、DNA編碼庫(kù)等新技術(shù)以及傳統(tǒng)藥理學(xué)和藥物化學(xué)結(jié)合,在提高藥物研發(fā)效率方面已經(jīng)取得了較大的進(jìn)展。
據(jù)悉,該大賽是國(guó)際計(jì)算生物醫(yī)學(xué)領(lǐng)域歷史最悠久也最有影響力的算法挑戰(zhàn)賽。從2006年開(kāi)始,每年一屆,已經(jīng)舉辦了12屆,贏得比賽的參賽者會(huì)被邀請(qǐng)到次年由國(guó)際計(jì)算生物學(xué)會(huì)舉辦的RECOMB計(jì)算生物大會(huì)作口頭匯報(bào)。該比賽由美國(guó)哥倫比亞大學(xué)的Gustavo Stolovitzky 和Andrea Califano教授發(fā)起,每一屆會(huì)由不同的比賽組織方開(kāi)放自己的私有數(shù)據(jù)、設(shè)計(jì)不同主題的任務(wù)由參賽者建模預(yù)測(cè)。這些任務(wù)都是當(dāng)時(shí)最新最緊迫的科學(xué)問(wèn)題,如轉(zhuǎn)錄因子結(jié)合位點(diǎn)預(yù)測(cè),體細(xì)胞突變識(shí)別算法,疾病模塊預(yù)測(cè),腫瘤病人生存期預(yù)測(cè),帕金森動(dòng)作體態(tài)模式識(shí)別,阿爾茲海默癥生物標(biāo)志物預(yù)測(cè),乳房X片識(shí)別,腫瘤蛋白組生物標(biāo)志物預(yù)測(cè),細(xì)菌或病毒急性感染后動(dòng)態(tài)時(shí)序性的血液生物標(biāo)志物識(shí)別等等。
【來(lái)源:快資訊】