舊金山灣地區(qū)的初創(chuàng)生物技術(shù)公司Zymergen的實驗室,乍看之下普普通通——實驗室的桌子上整齊的放著試管,架子上是各種化學藥品。然而環(huán)顧四周,你會發(fā)現(xiàn),這個實驗室的工作人員似乎不太一樣,他們身上發(fā)出一些機械運動以及風扇的聲音。沒錯,在這個實驗室里工作的全是機器人,這里是Zymergen公司的未來生物學實驗室。
在這里你可以看到機器人伸出一個機械手,抓取一個上面有數(shù)百個小孔的塑料板,然后掃描了這個板上的條形碼。下一步動作則是肉眼無法觀察到的,機器人通過給予這個塑料板一個聲波的沖擊,使每個小孔都能濺出一滴小液珠,這個液滴迅速地被機械手獲取,然后送往下一個儀器進行分析。相比起傳統(tǒng)上科研人員使用移液器一個孔一個孔的操作,這個機器人1秒鐘可以取500個樣本。
不過,Zymergen的科學家會告訴你,這些一點都不未來。使用機器人進行實驗操作,通過條形碼來進行記錄都已經(jīng)獲得了相當廣泛的應用。而通過聲波取液的技術(shù),稱之為聲微滴噴射,甚至已經(jīng)存在了數(shù)十年之久。那么這個實驗室究竟“未來”在哪里呢?Zymergen的共同創(chuàng)始人Jed Dean博士會告訴你:“我不知道這些機器人在做什么實驗。因為這些實驗完全是由一個人工智能程序設計的?!?
沒錯,盡管機器人在實驗室中有了普遍的應用,但是,從提出假說、設計實驗、到分析數(shù)據(jù),這些還都是人類科學家的工作。對于Zymergen來說,他們的目標就是完全取代人類科學家們的作用,由人工智能程序完成這些工作。近一段時間以來在機器學習方面的發(fā)展,使得機器人有望完全勝任這些工作。
Zymergen公司的實際業(yè)務是想提高可以生產(chǎn)重要工業(yè)原料的微生物的產(chǎn)量,這些原料可以用于生物燃油、塑料、制藥等許多領(lǐng)域。通過改造這些微生物的基因組,Zymergen想要找到大量提高產(chǎn)量的方法。
不過,這些工業(yè)微生物已經(jīng)經(jīng)過多年的選擇和優(yōu)化,要想更進一步的提高產(chǎn)量,需要對其基因組進行非常深入的研究,并且根據(jù)初步數(shù)據(jù)再做下一步研究。這即使對于非常的科學家來說也是一件費時費力的事情。Zymergen首席執(zhí)行官Joshua Hoffman的估計是一個科學家一個月大約可以完成10項實驗。通過傳統(tǒng)機器人的幫助,這個數(shù)字可以提高到每周1000項,不過前提是需要給機器人提供正確的實驗設計和指令,這往往是一個瓶頸。
對于一個有5000個不同基因的微生物來說,如果每個基因可以有10個變種,那么至少有50000個不同的微生物需要測試。你可以從中找出可以提高產(chǎn)量的幾十個,接下來還要對這些不同的單個基因變種的組合進行測試。即使每周能夠測試1000種,這仍然是一個漫長的過程。此外,光測試產(chǎn)量是不夠的,微生物本身的生長能力也需要密切關(guān)注。而這就是機器學習能夠發(fā)揮作用的地方,通過上一步實驗的結(jié)果,機器學習算法能夠設計出下一步需要進行試驗的假說。
Hoffman先生表示,目前為止,Zymergen能夠提升一些微生物產(chǎn)量的10%。這看上去是一個小數(shù)字,但是對于年產(chǎn)值1600億美元的化學工業(yè)來說,10%的提升可能意味著數(shù)十億美元的經(jīng)濟效益。
不過,人工智能能夠找到提升產(chǎn)量的方法,但是卻不知道其背后的生物學機制。Dean博士卻認為,這其實是人工智能的優(yōu)勢之一。因為傳統(tǒng)科學方法只會從已知的與生產(chǎn)特定產(chǎn)品相關(guān)的基因入手,這其實有很大的局限性。Zymergen的實驗發(fā)現(xiàn),許多人工智能發(fā)現(xiàn)的能夠提高產(chǎn)量的基因變化與其化學合成通路沒有直接的聯(lián)系,其中甚至許多基因的功能是未知的。
科學的許多環(huán)節(jié),都可以交由人工智能來完成(圖片來源:《科學》)
而對于生物學家來說,這些發(fā)現(xiàn)又是令人激動的。因為他們可以通過提高產(chǎn)量這一結(jié)果出發(fā),進行反向推理,這有望揭開更多不為人所知的基因的功能。還有一種更的可能,那就是有一天人工智能程序能夠自己去尋找這背后的機制。到那時,恐怕人類科學家真的沒有用武之地了。
參考資料
[1] A new breed of scientist, with brains of silicon
[2] Zymergen官方網(wǎng)站