當(dāng)前位置：首頁(yè) > 財(cái)經(jīng)要聞 > 正文

AI在藥物領(lǐng)域的應(yīng)用情況如何？十問(wèn)拆解“AI+醫(yī)藥”2023-04-23 10:19:19 | 來(lái)源：智通財(cái)經(jīng) | 查看： | 評(píng)論：0

第一部分：大分子

1、AI在不同藥物領(lǐng)域的研發(fā)進(jìn)展?

AI在早期藥物發(fā)現(xiàn)的各個(gè)領(lǐng)域都有應(yīng)用，化藥因?yàn)楦哔|(zhì)量數(shù)據(jù)多，用算法做分子生成、藥效評(píng)估、成藥性預(yù)測(cè)和毒性分析都有應(yīng)用。AI在化藥領(lǐng)域的應(yīng)用已經(jīng)很成熟，比較容易實(shí)現(xiàn)，但是可以做的創(chuàng)新東西不多。

(資料圖片僅供參考)

大分子的AI計(jì)算還處在非常早期的階段，多肽發(fā)展稍微快一些，從單體計(jì)算到復(fù)合物再到多肽/核酸、多肽/蛋白開始做結(jié)構(gòu)設(shè)計(jì)。但是現(xiàn)在的生物藥都是通過(guò)序列和物理結(jié)構(gòu)做設(shè)計(jì)，大分子都有柔性片段和三維空間結(jié)構(gòu)，結(jié)構(gòu)這塊的預(yù)測(cè)和算法發(fā)展很慢。多肽現(xiàn)在已經(jīng)可以做到三四十個(gè)氨基酸的大環(huán)肽，可以做peptide-ADC和peptide-核藥。

蛋白抗體的空間結(jié)構(gòu)更加復(fù)雜，抗體的數(shù)據(jù)都是高度保密的，數(shù)據(jù)的真實(shí)性問(wèn)題比較大，很多體內(nèi)篩出來(lái)的抗體流式分析假陽(yáng)性，實(shí)際沒(méi)有辦法和抗原結(jié)合，非特異性結(jié)合體導(dǎo)致體內(nèi)脫靶效應(yīng)很嚴(yán)重?，F(xiàn)在大部分公開數(shù)據(jù)都是沒(méi)有經(jīng)過(guò)抗原抗體結(jié)合驗(yàn)證的，整體數(shù)據(jù)質(zhì)量都比較差。

2、藥企利用AI技術(shù)篩選藥物的主要商業(yè)模式?

藥企和AI公司的合作主要有幾種：1)AI公司自己做藥物開發(fā)，做到PCC或者IND，然后授權(quán);2)大型制藥公司自己組建AI部門做算法;3)通過(guò)CRO外包的形式把自己的業(yè)務(wù)外包給AI公司做藥物結(jié)構(gòu)優(yōu)化，按照工時(shí)收費(fèi)。

大型制藥企業(yè)目前主要通過(guò)收購(gòu)AI公司，或者拿到AI公司的算法授權(quán)，用企業(yè)內(nèi)部數(shù)據(jù)訓(xùn)練模型的方式生成藥物分子，不會(huì)與AI企業(yè)共享數(shù)據(jù)。但是能夠開發(fā)的藥物領(lǐng)域非常多，跨國(guó)藥企也很難在每個(gè)細(xì)分領(lǐng)域做到數(shù)據(jù)上的全球領(lǐng)先，AI公司能夠在細(xì)分領(lǐng)域做出產(chǎn)品的差異化。

國(guó)內(nèi)真正掌握AIDD的技術(shù)人員非常少，都自己出去創(chuàng)業(yè)了，從2021年開始全市場(chǎng)都在招人。企業(yè)自建AI部門前期投入成本很大，一條管線需要配3-5個(gè)人，整套的計(jì)算軟件的費(fèi)用也比較高。

找AI公司合作一般會(huì)簽署排他協(xié)議，每個(gè)靶點(diǎn)在幾年時(shí)間內(nèi)只能給一家客戶服務(wù)。AI公司會(huì)在確定靶點(diǎn)的時(shí)候讓團(tuán)隊(duì)評(píng)估公司現(xiàn)有的模型能不能做，或者通過(guò)簡(jiǎn)單的算法迭代能不能實(shí)現(xiàn)，然后再?zèng)Q定接手這個(gè)項(xiàng)目。

3、AI算法與傳統(tǒng)CADD篩選藥物分子的區(qū)別?

目前大部分的化學(xué)藥物篩選都是使用的CADD，傳統(tǒng)的CADD講究的是人的研發(fā)經(jīng)驗(yàn)和計(jì)算機(jī)輔助設(shè)計(jì)之間的結(jié)合;AIDD的思維方式更偏計(jì)算機(jī)，會(huì)篩選出全新的藥物骨架。

純算法公司算法的地位很高，實(shí)驗(yàn)團(tuán)隊(duì)只是個(gè)工具團(tuán)隊(duì)做結(jié)果驗(yàn)證。但是傳統(tǒng)制藥企業(yè)是以臨床導(dǎo)向來(lái)設(shè)計(jì)開發(fā)產(chǎn)品。

4、AI數(shù)據(jù)庫(kù)和算法的核心競(jìng)爭(zhēng)力?

藥物發(fā)現(xiàn)的數(shù)據(jù)量越多，準(zhǔn)確度就越高，需要不斷去擴(kuò)充自己的數(shù)據(jù)庫(kù)。公開的文獻(xiàn)資料大家都能檢索，但是從自然獲得的天然序列和功能片段每家都會(huì)不一樣。

通用的底層算法在網(wǎng)站上都能免費(fèi)獲取，但是基于機(jī)器訓(xùn)練學(xué)習(xí)的優(yōu)化模塊都是需要商業(yè)付費(fèi)的。因?yàn)槊考业讓觾?yōu)化算法的邏輯不一樣，AI公司在篩選同一個(gè)靶點(diǎn)藥物的時(shí)候也會(huì)生成完全不同的藥物分子。

AI公司的算法團(tuán)隊(duì)每天會(huì)通過(guò)網(wǎng)上發(fā)表的新文獻(xiàn)不斷更新和調(diào)試自己的模型，某些熱度比較高的領(lǐng)域甚至每天都會(huì)上線幾百篇新的科研文章。由于數(shù)據(jù)的真實(shí)性和重現(xiàn)性問(wèn)題，訓(xùn)練模型采用的方法非常關(guān)鍵。

5、AI行業(yè)近幾年的發(fā)展變化?

蛋白質(zhì)分子結(jié)構(gòu)預(yù)測(cè)，算法和通量都在提升?，F(xiàn)在6個(gè)氨基酸的已經(jīng)篩的差不多了，氨基酸的序列數(shù)量在不斷提升。大分子需要通過(guò)酵母、噬菌體或者mRNA展示平臺(tái)進(jìn)行結(jié)果確認(rèn)，現(xiàn)在可以做到酵母展示平臺(tái)同時(shí)分析1000條序列。以多肽為例，人工合成幾百條的成本已經(jīng)很低，現(xiàn)在也有在開發(fā)多肽的自動(dòng)化合成儀，通量一直在提升。

自動(dòng)化設(shè)備只能做重復(fù)性的工作，對(duì)于不穩(wěn)定的產(chǎn)品需要多次改變參數(shù)，不需要通量提到非常高的水平就足夠用來(lái)訓(xùn)練模型。

ChatGPT現(xiàn)在有嘗試用氨基酸序列去訓(xùn)練蛋白質(zhì)語(yǔ)言。

第二部分：算法

1、AI算法在藥物研發(fā)當(dāng)中的應(yīng)用場(chǎng)景?

早期主要做靶點(diǎn)發(fā)現(xiàn)，聯(lián)合用藥機(jī)理研究，通過(guò)敲出基因降解蛋白研究疾病發(fā)生的原因。小分子目前已經(jīng)發(fā)展到給定一個(gè)蛋白表面的口袋(與藥物結(jié)合的位點(diǎn))，就可以用算法生成藥物分子，交給藥物化學(xué)專家再做進(jìn)一步的結(jié)構(gòu)優(yōu)化和CMC。大分子這兩年進(jìn)步很快，可以根據(jù)靶點(diǎn)生成蛋白，然后交給做實(shí)驗(yàn)的部門確認(rèn)。

AI能夠幫助研發(fā)人員尋找到親和力最好的藥物分子，但是在實(shí)際疾病治療過(guò)程中, 親和力最好的分子不一定是藥效最好的分子，對(duì)疾病發(fā)生治療的全面了解，是AI目前無(wú)法替代的部分。

2、AI算法底層架構(gòu)的來(lái)源?

有些公司會(huì)直接用已經(jīng)公開發(fā)表的算法，有些公司會(huì)根據(jù)公開算法做進(jìn)一步優(yōu)化，有些甚至?xí)I用其它企業(yè)的算法。算法底層的邏輯都差不多，但是在細(xì)分抗體結(jié)構(gòu)域的優(yōu)化方面每家有自己的特點(diǎn)，各家企業(yè)會(huì)通過(guò)自己獨(dú)有的數(shù)據(jù)庫(kù)訓(xùn)練優(yōu)化，形成各家獨(dú)有的產(chǎn)品管線。算法的更新迭代騰訊和字節(jié)這類公司做得更多。傳統(tǒng)大藥企的核心在于CMC、臨床和商業(yè)化，海外的大藥企也更傾向從biotech購(gòu)買新發(fā)現(xiàn)的分子。

3、傳統(tǒng)大藥企和AI制藥公司的差異?

傳統(tǒng)的大藥企也在嘗試搭建相關(guān)的團(tuán)隊(duì)，但是生物學(xué)家不懂計(jì)算, 生物學(xué)家更傾向通過(guò)自己的經(jīng)驗(yàn)去優(yōu)化分子，有自己的路徑依賴，但是比較費(fèi)錢費(fèi)時(shí)間;算法公司可以直接生成分子，但是算法的底層框架和傳統(tǒng)篩選方法不同，不一定能夠被生物學(xué)家很好的理解。藥物研發(fā)到了CMC之后的階段，算法能夠提供的幫助就非常有限了，臨床試驗(yàn)的時(shí)間也是沒(méi)有辦法通過(guò)算法縮短的。

4、AI制藥目前在國(guó)內(nèi)的發(fā)展階段?

過(guò)去幾年Google、Amazon、Microsoft在底層算法上取得了非常大的進(jìn)步, 2017年Transformer模型出現(xiàn)，2020年α fold在此技術(shù)上實(shí)現(xiàn)了蛋白結(jié)構(gòu)的解析，算法層面實(shí)現(xiàn)比較大的突破。數(shù)據(jù)方面一直是在緩慢積累的，屬于緩變量。大分子結(jié)合面比較大，這幾年進(jìn)步非?？?小分子在分子動(dòng)力學(xué)方面(小分子和蛋白結(jié)合)進(jìn)展很慢，小分子結(jié)合面很小，算法要求非?？量?，進(jìn)展緩慢。

2018年設(shè)計(jì)的分子, 可能剛做到IND階段，這兩三年很關(guān)鍵，能夠初步驗(yàn)證第一批篩選出來(lái)的分子是否能夠成功進(jìn)入臨床實(shí)現(xiàn)商業(yè)化。以前篩選分子需要耗費(fèi)上千萬(wàn)的費(fèi)用, 一年以上的時(shí)間;AI算法可能幾十萬(wàn)一個(gè)月就能完成。分子生成的速度現(xiàn)在很快，根據(jù)特定的靶點(diǎn)生成對(duì)應(yīng)的蛋白幾周就可以完成，然后通過(guò)2-3周的實(shí)驗(yàn)驗(yàn)證就可以完成初步的驗(yàn)證。以前傳統(tǒng)的藥物篩選方式需要建立10^8以上的蛋白庫(kù)做驗(yàn)證，非常耗時(shí)成本也很高。AI在計(jì)算的時(shí)候就可以直接完成親和力方面的結(jié)構(gòu)優(yōu)化，傳統(tǒng)篩選方式篩出來(lái)的蛋白還需要后續(xù)進(jìn)行結(jié)構(gòu)優(yōu)化。現(xiàn)在計(jì)算已經(jīng)很快了，但是都需要做實(shí)驗(yàn)驗(yàn)證，速度沒(méi)有辦法提得更快，也沒(méi)有必要在后續(xù)實(shí)驗(yàn)數(shù)據(jù)不充分的情況把所有的分子結(jié)構(gòu)都計(jì)算完。

5、各AI企業(yè)的主要差異?

所有的AI模型都是基于α fold的基礎(chǔ)建立的，每家用自己獨(dú)有的數(shù)據(jù)庫(kù)進(jìn)行訓(xùn)練和微調(diào)，方法論是通用的，只是大家選的研究方向不一樣，國(guó)外開源的數(shù)據(jù)庫(kù)很多。理論上國(guó)內(nèi)的CRO公司是不能采用客戶的數(shù)據(jù)進(jìn)行模型訓(xùn)練的，需要得到客戶的授權(quán)，并且客戶的數(shù)據(jù)也不夠完整。

分享到：收藏

上一篇：滾動(dòng)：新股解讀|內(nèi)修品牌+渠道+產(chǎn)品開發(fā) 看好珍酒李渡（06979）長(zhǎng)期發(fā)展勢(shì)能這一疫苗將影響數(shù)億人口：牛津瘧疾疫苗率先達(dá)到75%有效性目標(biāo)下一篇：

亚洲最大av无码国产网址_日韩少妇高清无码_久久国产精品免费一级片_色综合久久综合欧美综合网_影音先锋亚洲熟女AV网

AI在藥物領(lǐng)域的應(yīng)用情況如何？十問(wèn)拆解“AI+醫(yī)藥”2023-04-23 10:19:19 | 來(lái)源：智通財(cái)經(jīng) | 查看： | 評(píng)論：0

最新文章

熱門內(nèi)容

最近更新