

2023/01/31
圖文引用自:ithome
Profluent、Salesforce研究院和UCSF的科學家,以類似生成文字人工智慧的方法,使用模型ProGen設計百萬種蛋白質,並且成功找出具有殺菌效果的蛋白質。這個研究實際應用人工智慧設計蛋白質,並經測試和證明其具有特定效果,也就是説,同樣的方法將能夠被用於加速新藥製造。
這項研究使用一個由Salesforce研究院所開發的ProGen模型,該模型能夠預測人造蛋白質的氨基酸序列。ProGen的運作方式和生成文字的人工智慧相似,研究人員將來自19,000個家族的2.8億種蛋白質的氨基酸序列輸入到模型中,並添加蛋白質特性控制標籤,經過數周的訓練,ProGen便學會生成新蛋白質的方法。
研究人員使用5個溶菌酶家族的56,000個氨基酸序列,以及有關這些蛋白質的上下文資訊微調ProGen後,該模型迅速產生一百萬個氨基酸序列,研究人員根據與天然蛋白質序列相似程度,和潛在氨基酸語法和語義的自然程度,篩選出100個序列並在細胞中實驗進行實驗,其中有66個和蛋白、唾液裡的溶菌酶一樣,能夠殺死細菌。
研究人員篩選這66個氨基酸序列,製作出5種活性最強的人工酶,將這些酶添加到大腸桿菌樣本中,並且和溶菌酶HEWL相比較,發現其中兩種人工酶,能夠以和HEWL相當的活性分解細菌細胞壁,而這兩個人工酶序列僅有18%的相似程度,和已知蛋白質序列的相似度各別為90%和70%。
天然蛋白質的功能很大程度受組成影響,只要有一個突變就會使蛋白質失去作用,而在另外一輪的篩選中,研究人員找出一個只與天然蛋白質序列有31.4%相似的蛋白質,但是該蛋白質仍然具有活性。…