當前位置:首頁 > 生物研究 > 生化與分子生物學 > 正文

Cell綜述: CRISPR技術研究歷史及展望

 

三年之前,科學家們宣布,CRISPR技術能夠對真核活細胞進行精準與有效的基因組編輯。自此,這項技術手段已然震撼了科學界,數以千計的實驗室正在將其運用于從生物醫藥到農業的各個領域。然而,從一種奇特的細菌重復序列現象的發現開始,到確認這種現象為適應性免疫系統,進而對它的生物功能特性的了解,直至開發為一項基因工程的技術,這此前二十載相關的研究歷程卻不為人所知。本文正是著眼于填補這段科學歷史的空白,它講述的是觀念的演化歷史和先鋒人物的傳奇故事,并且從中獲得關于支撐科學發現的優秀科研環境的啟迪。

 

前言

 

很難想起曾經有哪一次科學革命像CRISPR這般如此迅速地改變生物學界。僅僅三年之前,科學家宣布,CRISPR系統,即細菌通過紀錄和精準攻擊入侵病毒的DNA序列而進行自身防御的適應性免疫系統,可以利用轉化為一項簡單而有效的技術在哺乳動物和其它生物體的活體細胞內進行基因組編輯。CRISPR即此被全球數以千計的實驗室運用于廣泛的領域,如創建人類遺傳疾病和癌癥的復雜動物模型;在人類細胞內進行全基因組篩選從而精確定位作用于生理過程的具體基因;開啟或關閉某個特定基因的作用;改變植物的基因。CRISPR有可能用于改變人類生殖系統的前景引發了全球范圍的爭論。

 

雖然我還沒見過沒有聽說過CRISPR的分子生物學家,但是,你如果問他們到底這項科學革命是如何發生的,他們往往一頭霧水。免疫學家彼得?梅達沃爵士(Sir Peter Medawar)有云:“科學的歷史會讓大多數科學家感到無聊透頂”(Medawar,1968)。的確,科學家總是義無反顧地專注于未來。一旦一項事實在科學上得到確立,那么通向發現此事實的迂回路徑則被歸為無關緊要的軼聞。

 

然而,科學突破背后的科學家的故事可以使我們對于善于激發生物醫藥進步的這種神奇的科研環境有更多了解:有關靈感與規劃,純粹好奇心與實踐運用, “無假設驅動(Hypothesis-free)”與“假設驅動(Hypothesis-driven)”的研究方法,個人與團隊,新穎的視角和深厚的專業知識在其中發揮的各自功能。這些理解對于政府和基金會都尤為重要,因為僅在美國,這些組織就在生物醫藥研究領域一共投資了超過四百億美元。對于常常把科學家想象為離群索居于實驗室的孤獨天才的普通公眾,這些理解也同樣重要。此外,對于正在接受科學訓練的科學學徒而言,能對科學職業生涯有一個現實的圖景式的把握,并將其作為導向和激勵,更是十分有益。

 

在過去的幾個月里,我一直試圖理解CRISPR背后的20年的前程往事,這其中包括科學觀念的歷史和科學家的個人經歷。本文的視角是建立在已發表的論文,個人訪談和其它材料(含期刊拒絕信)的基礎之上的。最后,我嘗試從其中得出一些普遍的經驗。(作為背景,圖1提供了一個對II型CRISPR系統的簡要概述,正是這一種類被轉化利用于基因組編輯。)本文的關鍵內容是描述了一群躊躇滿志的科學家偕同他們的合作者和其它未能詳述的貢獻者一起發現了CRISPR系統,揭開它分子機制的面紗,并將它轉化利用為生物與生物醫藥研究的強大工具。他們共同列名于CRISPR英雄譜。

 

CRISPR的發現

 

故事開始于西班牙白色海岸上的地中海港口圣波拉(Santa Pola),那里的美麗的海岸與廣闊的鹽沼地幾個世紀以來吸引著度假客、火烈鳥和鹽業生產商(這個故事的地理如圖2所示)。Francisco Mojica就在附近長大,常常光顧這片海灘,自然而然,當他于1989年開始在位于海岸上端的阿利坎特大學(University of Alicante)作博士研究的時候,他加入了一個研究地中海嗜鹽菌(Haloferax mediterranei)的實驗室,這是一種從圣波拉的沼澤分離出的具有極端耐鹽性的古細菌。他的導師發現,培養基的鹽含量似乎會影響限制性內切酶切割此微生物的基因,Mojica于是開始鑒定這一異種片段。在他檢查的第一個DNA片段里,Mojica發現了一個奇怪的結構,即一個近乎完美的大致呈回文式對稱、有30個堿基并被36個堿基的間隔隔開的多拷貝重復序列,而它與任何已知的微生物的重復序列家族都不相同(Mojica 等,1993)。

201604051432522252.jpg

這個28歲的研究生被此深深吸引,并且將他接下來的十年學術生涯貢獻給了破解這一神秘現象。他不久在相近的沃氏嗜鹽富饒菌(H.volcanii)和關系更遠的嗜鹽古菌中還發現類似的重復序列。在梳理科學文獻過程中,他發現了這一現象與真細菌的關聯:一個日本研究組(Ishino et al., 1987)的一篇論文提到在大腸桿菌(Escherichia coli)中的一個重復序列有相似的結構,雖然與嗜鹽菌(Halofarax)的重復沒有序列的相似性。論文的作者們對這一現象并未深究,但是Mojica意識到,在關系如此遠的微生物上存在如此相似的結構一定意味著一個尚未被發現的原核細胞里的重要功能。在去牛津作短暫的博士后研究之前,他寫了一篇論文報道了這一新的重復序列類別(Mojica 等, 1995)。

 

Mojica之后返回阿利坎特大學擔任教職。由于學校缺乏啟動科研基金和實驗室空間,他只好轉而通過生物信息學的方法來研究這種奇怪的重復,并將其命名為short regularly spaced repeats (SRSPs)。這一名稱在他自己的建議下后來改為“聚集的規律插入間隔回文重復”(Clustered Regularly Interspaced Palindromic Repeats, CRISPR) (Jansen 等, 2002; Mojica 和 Garrett, 2012)。

 

到2000年,Mojica已在20個不同的微生物上發現了CRISPR基因位點,其中包括結核分枝桿菌(Mycobacterium tuberculosis),艱難梭菌(Clostridium difficile),和鼠疫桿菌(Yersinia pestis)(Mojica 等, 2000)。。在兩年的時間內,研究人員已經將這相關微生物的名錄翻倍并且列錄了基因位點的關鍵特征,包括存在近親緣的特定的“CRISPR關聯基因”(cas基因),這通常認為與他們的功能相關(Jansen 等, 2002)。(列表1列舉了CRISPR系統的最新分類。)

201604051433033126.jpg

但是,CRISPR系統的功能究竟是什么呢?各種假設層出不窮:比如設想與基因調控,復制分區,DNA修復還有其它功能有關。然而大多數的這類假設都沒有證據支持,它們一個一個都被證偽了。如同CRISPR的發現一樣,重要的睿見來自于生物信息學。

 

CRISPR是一種適應性免疫系統

 

2003年8月的假期,Mojica 避開圣波拉的酷暑,躲在阿利坎特的空調辦公室里。如今已然作為初興的CRISPR領域的領軍人物,他將目光從重復序列轉向分隔它們的間隔序列。使用文字處理器,Mojica 不辭辛勞地抽出每一個間隔并將其插入BLAST軟件來搜索與其它任何已知DNA序列的相似性。雖然他嘗試這種方法失敗過,但是DNA序列數據庫在不斷擴大,這一次他成功掘到金礦了。在他最近從一種大腸桿菌菌株測序到的一個CRISPR基因位點上,其中一個間隔與一種P1噬菌體的序列相匹配,而這一噬菌體可以感染多種大腸桿菌菌株。然而,攜帶這一間隔的菌株已知對P1感染具有抵抗力。那一周結束時,他已經檢索了4500個間隔。其中88個間隔與已知序列相似,三分之二同攜帶間隔的微生物相關的病毒或接合質粒相匹配。Mojica意識到CRISPR基因位點儲存了用于為保護微生物抵抗感染的適應性免疫系統所需的信息。

 

Mojica 于是和同事們一起外出飲干邑白蘭地慶祝,并在第二天清晨開始撰寫相關論文。如此竟開始了長達18個月的痛苦煎熬。認識到這一發現的重要性,Mojica 將論文投給了《自然》。 2003年11月期刊在未征詢外部評審的情況下拒絕的論文的發表。難以理解的是,編輯聲稱論文的關鍵論點屬于已知范疇。2004年1月,《美國國家科學院院刊》的決定是這篇論文缺乏“充足的新穎觀點和重要性”因而不夠資格送審。《分子微生物學》和《核酸研究》也相繼地拒絕發表。此時,絕望而又擔心被別人搶先一步發表的Mojica將論文投給了《分子演化雜志》。在經過12個多月的審稿和修訂,這篇宣布CRISPR可能功能的論文終于在2005年2月1日發表了(Mojica et 等, 2005)。

 

與此同時,CRISPR正是另一個意想不到的地點的研究人員的關注焦點,那是巴黎向南30公里以外,法國國防部的一個研究部門。Giles Vergnaud 是在巴斯德研究所受訓的人類遺傳學家,他的博士和博士后研究都受到法國武器裝備總局的資助。他在1987年完成博士后研究之后加入法國國防部并建立它的第一個分子生物學實驗室。在以后的十年間,Vergnaud繼續著人類遺傳學的研究工作。但是,情報部門在九十年代后期關于伊拉克的薩達姆·薩達姆政權正在發展生物武器的報告引起關切之后,國防部在1997年要求Vergaud和他的團隊將研究重心轉向法醫微生物學,籍此發展基于微生物種類間細微遺傳學差別來追蹤病原體來源的手段。在與附近的巴黎第十一大學的遺傳與微生物學研究所的聯合實驗室,他開始使用串聯重復序列多態性,這一法醫學人類DNA指紋圖譜的主要工具,來繪制導致炭疽病(anthrax)和鼠疫的細菌種類。

 

法國國防部擁有一批特殊的來自1964至1965年越南鼠疫爆發期間的61件鼠疫桿菌樣本。 Vergnaud發現這些密切相關聯的分離株在串聯重復基因位點上是一致的,除去一個位置是例外,即由他的同事Christine Pourcel所發現的CRISPR基因位點。它們的品系由偶爾出現新間隔所區分,而這些間隔無不是在CRISPR基因位點的前段末端(Pourcel 等,2005)。值得注意的是,其中許多的新間隔與存在于鼠疫桿菌基因上的原噬菌體(prophage)相配。作者們推斷,CRISPR基因位點是在執行防御機制,用詩化的語言來說,就是“CRISPR可能重現‘過往遺傳攻擊’的記憶。”Vergnaud試圖發表他們發現的努力和Mojica遇到了相同的阻礙。論文被《美國國家科學院院刊》、《細菌學學刊》、《核酸研究》以及《基因組研究》相繼退稿,直到在2005年3月1日的《微生物學》上發表。

 

最后,第三個研究者Alexander Bolotin,供職于法國國家農業研究院的俄裔微生物學家也在2005年9月的《微生物學》上發表了關于CRISPR 起源于染色體之外的論文(Bolotin等,2005)。由于他的論文之前被另一家期刊拒絕,所以事實上是在Mojica的2005年2月論文發表之后一個月后才得以提交。值得注意的是,Bolotin第一個提出了CRISPR是如何提供免疫功能的設想,他推測來自CRISPR基因位點上的轉錄物是憑借反義RNA對噬菌體基因表達的抑制來工作的。這一假設雖然聽上去合理,但是很快會被證偽。

 

CRISPR提供適應性免疫功能并且使用核酸酶的實驗證據如同Mojica,Philippe Horvath可能找不到一個更有地方特色或者說更無趣的論文題目了。身為斯特拉斯堡大學(University of Strasbourg)的博士生,他的研究對象是一種用于德式腌白菜(sauerkraut)生產的乳酸菌, 這種腌白菜正是阿爾薩斯(Alsatian)風味菜品腌白菜豬肉土豆(choucroutegarnie)的主要配料。出于他對食品科學的興趣,Horvath跳過博士后研究而在2000年加入了羅地亞食品公司(Rhodia Food),一家位于法國西部當熱圣羅曼(Dange-Saint-Romain)的細菌發酵劑生產商,在那里建立這家企業的第一個分子生物學實驗室。這家公司之后由丹麥公司丹尼斯科(Danisco)收購,而丹尼斯科自己則在2011年被杜邦公司(DuPont)收購了。

 

羅地亞食品公司對于Horvath的微生物學專長十分感興趣,因為其它的乳酸菌諸如嗜熱鏈球菌(Streptococcus thermophiles)一直用于乳制品的生產,比如酸奶和芝士。Horvath的目標包括開發出基于DNA的技術手段,以精確識別菌株并且戰勝頻繁性噬菌體感染這一困擾著乳制品發酵所用的工業發酵劑生產的痼疾。因此,理解特定嗜熱鏈球菌菌株是如何抵御噬菌體攻擊而自我保護的機制則具有了科學和商業上的雙重價值。

 

在2002年下半年的一次乳酸菌主題的荷蘭會議上得知CRISPR之后,Horvath就開始使用這一手段來鑒定他的菌株的基因型。到了2004年下半年,他注意到間隔與抵抗噬菌體能力之間存在關聯,相同的發現在幾個月之后正是由Mojica和Vergnaud發表的。2005年, Horvath和他的同事們,包括任職丹尼斯科美國分公司的新科博士Rodolphe Barrangou和魁北克城( Quebec City)的拉瓦爾大學(Universite Laval)的著名噬菌體生物學家Sylvain Moineau一同著手檢驗CRISPR是一種適應性免疫系統這一假設。巧合的是,Moineau也曾是在工業領域任職的科學家。他在拉瓦爾取得食品科學博士學位,研究乳酸菌,并且在返回拉瓦爾任教職之前在聯合利華公司(Unilever Corporation)工作。他自2000年以來曾同羅地亞食品公司保持合作。

 

利用一種特征顯明而對噬菌體敏感的嗜熱鏈球菌菌株和兩種噬菌體,研究人員通過遺傳篩選的方法來分離出對噬菌體有抵抗力的菌株。并非包含傳統的抵抗性突變(諸如在噬菌體侵入所需要的細胞表面受體上的突變),這種具有抵抗力的菌株在它們的CRISPR基因位點上獲得了源于噬菌體的序列(Barrangou 等,2007)。此外,多重間隔的插入與增強的抵抗力相關。它們正是在這一過程中獲得了免疫功能。

 

他們還研究了其中的兩個cas基因的作用:即cas7和cas9。細菌需要cas7來獲得抵抗力,但是這些攜帶噬菌體源的間隔卻不需要這個基因來保持抵抗力,這就說明cas7協助產生新的間隔和重復,但它并不涉及免疫功能本身。與此相反,cas9則對抵抗噬菌體的能力產生必不可少,因它的序列包含兩種核酸酶模塊(HNH和RuvC)而它的產物繼而被認為對核酸進行了切割(Bolotin等,2005; Makarova等,2006);并且,cas9蛋白是組成細菌免疫系統的活躍成分。(提示:在早期的CRISPR文獻中,如今大名鼎鼎的cas9基因被稱作cas5或者csn1。)最后,他們發現,能夠克服基于CRISPR免疫功能的稀有噬菌體分離株在它們的基因里攜帶有單一堿基變化,如此就改變了本來與間隔相配的序列。這樣,免疫功能就是依賴間隔與目標物之間的精準DNA序列匹配來實現的。

 

設計CRISPR

 

John van der Oost于1989年在阿姆斯特丹自由大學(Free University of Amsterdam)獲得博士學位,他最初志在解決世界清潔能源的需求而研究如何利用藍藻來生產生物燃料。在返回阿姆斯特丹之前,他相繼在赫爾辛基和海德堡研究細菌的代謝途徑。1995年,瓦赫寧根大學(Wageningen University)向他發出終身教職的聘任邀請,但是條件是需要由他來壯大一個專攻極端條件生存的微生物的團隊。Van der Oost 在德國期間已經聽說過能夠在黃石國家公園的溫泉中繁衍的嗜熱鏈球菌,于是對探索這些奇特微生物在代謝途徑上的演化區別躍躍欲試。他開始和隸屬于美國國家衛生研究所(National Institutes of Health)的國家生物科技信息中心(NCBI)的微生物進化和計算機生物學領域的專家Eugene Koonin合作。Koonin早已開始對CRISPR系統進行數據分類和分析,他在2005年的一次訪問中將van der Oost領入當時還鮮為人知的CRISPR領域(Makarova等,2006)。

 

Van der Oost當時已從荷蘭國家科學基金獲得了主要資助。他決定在研究申請書的課題之外,將部分經費用作CRISPR的研究。(在五年之后的報告中,他強調了上述機構給予研究人員改變研究計劃方向的自由這一政策的有益價值。)他和同事們將一種大腸桿菌的CRISPR系統嵌入另一缺乏這一自身內源性系統的大腸桿菌品系。這樣就可以使他們可以在生物化學上鑒定一組擁有5個cas蛋白的復合體,它被稱作Cascade(Brouns等,2008)。(大腸桿菌擁有更復雜的1類,I 型CRISPR系統,其中cas9的功能是由Cascade復合體聯同核酸酶cas3一起來實現的。見列表1。)通過將每一個組成部分逐一剔除,他們證明Cascade是將經由CRISPR基因位點轉錄的一個長前體RNA接入61個核苷酸長的CRISPR RNA(crRNAs)所必需的。經過對一組與Cascade復合體一同純化的crRNAs進行克隆和基因測序,發現它們都從8個堿基的重復序列開始,緊隨其后的是完全間隔和新重復區的出現。這一發現支持了先前的假設,即重復序列的回文(palindromic)結構特性導致crRNA中次級結構的形成(Sorek等,2008)。

 

為了證明crRNA序列是產生基于CRISPR的抵抗力的原因,他們著手創造首個人工CRISPR排列,設定使CRISPR將λ噬菌體的四種基本基因作為定向靶位。正如他們所料,攜帶新的CRISPR序列的品系對噬菌體呈抵抗性。這是有史以來第一個直接由程序設計的基于CRISPR的免疫,對細菌而言猶如流感疫苗。

 

這些實驗結果暗示,CRISPR的目標不是RNA(Bolotin所設想的),而是DNA。研究人員設計了兩種版本的CRISPR排列,一種是反義鏈方向的(與mRNA和DNA位點的編碼鏈互補),另一種是正義鏈方向的(僅僅與另一條DNA鏈互補)。雖然,間隔在有效性上各有差別,但是實驗在正義鏈方向的版本上起了效果這一事實有力說明目標不是mRNA。但是,它不是直接證據。在《科學》的編輯們針對論文作出堅定論斷保持謹慎的要求下,van der Oost將CRISPR定位DNA為目標物的觀點以“猜想”的方式提出。

 

CRISPR的靶標是DNA

 

Luciano Marraffini正在芝加哥大學完成博士學位的研究,研究方向是葡萄球菌(Staphylococcus),此時從系里的噬菌體遺傳學世界權威Malcolm Casadaban那里了解到CRISPR。Casadaban于2005年旋即看出CRISPR有可能是適應性免疫系統這一發現的重要程度,而且對所有對此表現出興趣的人都談論CRISPR。和許多噬菌體研究領域的科學家一樣,Marraffini堅信CRISPR不是由RNA干擾來作用的,因為這一機制對于克服發生在噬菌體感染過程中的爆發式增長是無能為力的。他推斷,CRISPR必然對DNA進行了切割,這個功能就好像限制性內切酶的作用。

 

Marraffini本來熱切希望加入世界上為數不多的幾個正在研究CRISPR的研究團隊來做博士后的研究,可是由于他的妻子在庫克縣的伊利諾伊(Cook County, Illinois)刑事法庭有一個做翻譯員的好工作,他感覺自己必須留在芝加哥。他說服西北大學(Northwestern University)的生物化學家Erik Sontheimer讓自己加入他的實驗室研究CRISPR,Sontheimer一直從事RNA剪接和RNA干擾的工作。

 

早在搬去西北大學之前,Marraffini在完成博士研究同時就開始了關于CRISPR的工作,研究葡萄球菌(Staphylococcus)的CRISPR系統是否可以阻止質粒接合。他注意到,一種表皮葡萄球菌(Staphylococcus epidermidis)擁有這樣一個間隔,它與來自具有抗生素耐藥性的金黃色葡萄球菌的質粒上存儲的切口酶(nickase,nes)基因的某區域相匹配。他證明了,這些質粒不能轉化表皮葡萄球菌,而中斷質粒內nes序列或者它在CRISPR基因位點上的相配間隔的兩者之一都會取消干擾功能(Marraffini 和 Sontheimer,2008)。顯而易見,CRISPR如同阻止病毒一樣阻止了質粒。

 

Marraffini和Sontheimer一度考慮在試管里重組CRISPR系統來證明它可以切割DNA。但是表皮葡萄球菌的系統太過復雜,它有9個cas基因,并且它的基因特點還完全未被掌握。于是,他們將目光轉向分子生物學。他們聰明地對CRISPR系統定向射靶的質粒中的nes基因進行了改變,就是通過在它的序列中間嵌入一個自我剪接的內含子。如果CRISPR是以mRNA為目標的話,那么這一變化就不會影響干擾功能,因為內含子序列會被剪除。而如果CRISPR是以DNA為目標的話,那么這種嵌入就會取消干擾功能因為間隔將不再匹配。結果已經清楚:CRISPR的目標是DNA。

 

Marraffini和Sontheimer認識到CRISPR在本質上是一種可編輯設定的限制性內切酶。他們的論文則第一個清楚提出了預測:CRISPR可以被轉而用于在異源性系統內進行基因組編輯。 “從實踐的觀點來看,” 他們宣布,“可以對包含任何已知24至48個核苷酸目標物的DNA進行可定位滅除的導向能力具有可觀的功能性用途,特別是如果這個系統還可以在原來的細菌或古菌環境以外發揮作用。”他們甚至提交了涉及使用CRISPR在真核細胞內切割和糾正基因位點的專利申請,然而由于尚缺乏實驗證明而最終放棄了申請(Sontheimer和Marraffini,2008)。

 

Cas9是由crRNAs指引并且在DNA中產生雙鏈裂斷

 

在2007年影響深遠的研究確認了CRISPR是一種適應性免疫系統之后(Barrangou等,2007),Sylvain Moineau繼續與丹尼斯科公司合作來弄清CRISPR切割DNA的機制。

 

問題是CRISPR在通常情況下總是如此高效,使得Moineau和同事們沒法輕易觀察到入侵的DNA是如何被消滅的。但在研究嗜熱鏈球菌的質粒干擾過程中他們受到了幸運女神的眷顧。研究人員發現了少量品系,它們的CRISPR對依靠電穿術(electroporation)轉化的質粒僅僅可以提供部分防衛。在其中一個低效的品系的細胞內,可以看見呈線性的質粒依舊存在。一定程度上,質粒干擾的過程能夠被減緩到使CRISPR活動的產物可以被觀察到(Garneau等,2010)。

 

這一品系使他們得以研究切割的過程。與他們先前的結果一致(Barrangou等,2007),這次的結果顯示質粒的切割依賴cas9核酸酶。當對線性化的質粒進行測序時,他們在PAM(proto-spacer adjacent motif)的上游發現了單個精準平端切割的三核苷酸,PAM是一種關鍵性序列特征,而先前的論文對它的作用已有描述(Deveau等,2008;Hovath等,2008)。將分析的范圍擴展之后,結果表明病毒的DNA也是在與PAM序列有關的相同位置被精準切割的。此外,匹配同一目標的不同間隔的數量與切口數量一致。

 

實驗結果確定無疑地表明Cas9的核酸酶活性是在精準的點位上對DNA進行切割的,而這些點位則由crRNA的特定序列編碼。

 

tracrRNA的發現

 

即使在對CRISPR-Cas9系統的密集研究之下,組成這個難題一塊拼圖卻仍然缺失,就是后來被稱作反式作用CRISPR RNA(tracrRNA)的一個小RNA。事實上,它的發現者Emmanuelle Charpentier和J?rg Vogel并不是專門研究CRISPR系統的;他們僅僅試圖鑒定微生物RNA。

 

Charpentier于1995年從巴斯德研究所(Pasteur Institute)獲得博士學位,之后在紐約做了6年的博士后研究,然后相繼于2002年在維也納大學和2008年在瑞典的于默奧大學(Ume?University)建立自己的實驗室。她在化膿性鏈球菌(Streptococcus pyogenes)里發現了一種不尋常的可控制其傳染力的RNA之后(Mangold等,2004)開始對鑒定更多微生物內的調控性RNA發生了興趣。她用生物信息學的程序檢索化膿性鏈球菌的基因區間,設想它們可能編碼非編碼RNA。她發現了若干候選區間,包括在CRISPR基因位點附近的一個,——但是缺乏關于這些RNA的直接信息,就太難繼續研究了。

 

當Charpentier在威斯康辛的麥迪遜(Madison, Wisconsin)召開的2007年RNA學會上遇見Vogel時,解決方法出現了。在德國受訓為微生物學家的Vogel在烏普薩拉(Uppsala)和耶路撒冷(Jerusalem)做博士后研究期間開始專攻在病原體內尋找RNA,這一工作持續至2004年他在位于柏林的馬普感染生物學研究所建立自己的研究小組時。(5年之后,他轉去烏茲堡(Würzburg)領導一個傳染病研究中心。)隨著“下一代測序”技術的到來,Vogel意識到大規模平行測序將使得繪制任何微生物轉錄組的整體圖錄成為可能。他當時已經將這種方法用于導致胃潰瘍的細菌——幽門螺桿菌(Sharma等,2010),同時正在用于其它細菌。Charpentier和Vogel決定將目標瞄準化膿性鏈球菌。

 

此方法產生了一個驚人的結果:僅次于核糖體RNA和轉運RNA之后數量第三多的RNA轉錄本屬于一類新的小RNA,它是從緊挨著CRISPR基因位點(就是那個曾引起Chapentier注意的區間)的序列轉錄過來的,并且它有25個與CRISPR重復序列近乎完美地互補的堿基。這一互補性說明tracrRNA和crRNA的前體一起雜交并且被RNaseIII切割處理成為成熟產物。遺傳刪除實驗也證實了這個觀點,即tracerRNA對處理crRNA是必不可少的,因而就對CRISPR作用也是必不可少(Deltcheva 等, 2011)。

 

之后的研究揭示了tracerRNA還有另一個關鍵作用。接下來的生物化學研究表明tracerRNA不僅僅涉及處理crRNA,它還對Cas9核酸酶復合體剪切DNA是必需的(Jinek 等, 2012; Siksnys 等, 2012)。

 

在遠緣物種內重建CRISPR

 

Virginijus Siksnys成長于蘇聯時代的立陶宛(Lithuania),從維爾紐斯大學(Vilnius University)畢業之后于1980年代早期前往莫斯科國立大學(Moscow State University)攻讀博士學位,研究酶動力學。這之后他回到家鄉維爾紐斯加入應用酶學研究所,從事當時熱門的限制性內切酶領域的研究。20年之后,他對于研究限制性內切酶已經感到厭煩。Horath,Barrangou和Moineau的2007年論文重燃了他對于細菌抵御外部DNA的屏障的興趣。作為化學家,他意識到想要理解CRISPR,就必須在體外重建它。

 

他的第一步就是要測試他是否已經獲取了所有的必要組成部分。他和合作者們著手觀察來自嗜熱鏈球菌(S. thermophiles)的CRISPR基因位點是否能夠在一個遠緣的微生物大腸桿菌(E. coli)內被重建成為完全發揮作用的形態。令他們感到欣喜的是,他們發現轉入整個CRISPR基因位點就足以實現對質粒和噬菌體DNA的靶向干擾(Sapranauskas 等,2011)。他們用異源系統還證明了Cas9是干擾活動唯一必需的蛋白,而它的Ruvc和HNH核酸酶結構域都是必不可少的。

 

隨著CRISPR-Cas9干擾系統的必要與充分的組成部分——Cas9 核酸酶,crRNA和tracrRNA都被發現了,這一領域的研究到達了一個關鍵性的里程碑。這個系統依靠尖端的生物信息學、遺傳學和分子生物學已經被化整為零地完全掌握了。如今是時候將方向轉向精確的生物化學實驗來證實并且在試管里拓展這些結論了。

 

在試管里研究CRISPR

 

利用它們在大腸桿菌里的異源表達系統,Siksnys和同事們通過使用鏈酶親和素標記物標記Cas9來純化嗜熱鏈球菌的Cas9-crRNA復合體,并在在試管內觀察它的活動(Gasiunas 等,2012)。結果表明,復合體能夠在體外切割DNA目標,創造出一個距離PAM序列恰好3個核苷酸的雙鏈斷裂——正好與Moineau及其同事在細菌體內觀察到的現象一致。最重要的是,實驗證明他們能夠在CRISPR陣列里對Cas9和專門設計的間隔序列一同改編,從而實現在試管內對選擇目標位置的切割。通過轉變HNH與RuvC核酸酶結構域的催化殘基,他們還證明了前者切割與crRNA互補的基因鏈,而后者則切割與之相對的那條鏈。他們同時又證明了crRNA可以被修剪至只剩20個核苷酸而仍然保持有效切割力。最后,Siksnys證明這個系統還可以用第二種方法重建——就是把純化的His標記的Cas9、在試管內轉錄的tracrRNA和crRNA,還有RNase III混合起來——而上述兩種RNA對于Cas9切割DNA都是必不可少。(最終他們在修訂后的論文里刪除了第二種重建方法,但是在他們已發表的提交于2012年3月的美國專利申請書中報告了所有的研究內容[Siksnys 等,2012])。

 

與此同時,Charpentier已經開始與維也納的一個同事一起對CRISPR進行生物化學鑒定。在2011年3月在波多黎各(Puerto Rico)舉行的美國微生物學學會會議上報告她關于tracrRNA的研究的時候,她遇見了Jennifer Doudna,加利福尼亞大學的世界著名結構生物學家和RNA專家。夏威夷長大的Doudna在哈佛大學獲得博士學位,與Jack Szostak合作將一個RNA自我剪接內含子重塑為具有復制RNA模版能力的核酶。她在之后跟科羅拉多大學的Tom Cech做博士后研究時解決了核酶的晶體結構問題。在她自己的實驗室(起先于1994年在耶魯建立,之后于2002年在伯克利),她鑒定了多種現象下的RNA蛋白復合體,諸如與內部核糖體入口位置有關和microRNA的加工有關等。她一直使用晶體學和冷凍電鏡來解決I型CRISPR系統的Cascade復合體的組成部分的結構問題,這是一種用于諸如大腸桿菌的較為復雜的系統。

 

兩位科學家于是決定聯手。她們使用重組Cas9(來自在大腸桿菌里表達的化膿性鏈球菌[S. pyogenes]的基因)和體外轉錄的crRNA及tracrRNA(Jinek 等,2012)。和Siksnys一樣,她們也證明了Cas9可以在體外切割純化的DNA,它可以和專門設計的crRNA一起被設計,兩種核酸酶結構域分別切割相對的兩條DNA鏈,并且crRNA和tracrRNA對Cas9發揮作用都是必需的。此外,她們證明兩種RNA在被融合為單一的導向RNA(sgRNA)時也可以在體外發揮作用。在經過其他科學家的修改而變得可以更高效地在體外作用之后,sgRNA的概念在基因組編輯領域被廣泛使用。

 

Siksnys于2012年4月6日向《細胞》提交了論文。6天之后,在沒到外部評審的情況下就被期刊拒絕了。(事后,《細胞》的編輯承認這篇論文其實是非常重要的。)Silsnys于是做了此論文的精煉版本,于5月21日將其投稿給了《美國國家科學學院院刊》,得以于9月4日在線發表。Charpentier和Doudna的合作論文的運氣則要好得多。在Siksnys的論文提交之后的2個月,她們的論文于6月8日提交給了《科學》,順利通過評審并于6月28日在線發表。

 

兩組研究團隊都清楚地認識到CRISPR對于生物技術的潛在價值。Siksnys宣稱:“這些發現為構造普遍可設計的RNA引導的DNA核酸內切酶鋪平了道路。”而Charpentier和Doudna則提到:“利用這一系統來進行可設計的基因組編輯的潛力。”(幾年之后,Doudna讓世界的注意力里投向編輯人類生殖系統這一前景所引起的重要社會性問題。)在哺乳動物細胞內進行基因組編輯。

 

在1980年代后期科學家們設計出一種可以在活細胞內改變哺乳動物基因的方法,這徹底改變了生物醫學研究,包括使得在老鼠的胚胎干細胞內的特定位置嵌入DNA并且培育出攜帶這一遺傳改變的后代成為可能(綜述見Capeccchi,2005)。雖然這個方法是革命性的,但是過程卻是低效的,因為它需要通過篩選識別出那些百萬分之一的細胞,就是在其內通過同源重組與由實驗者提供的修改過的版本之間交換了一個基因。1990年代中期,哺乳動物學家在酵母遺傳學的觀察基礎上發現在某個基因位點上引進一個雙鏈斷裂可以極大地增強同源重組和由非同源末端接合導致的小缺失的發生頻率(綜述見Haber,2000和Jasin與Rothstein,2013)。他們意識到,高效基因組編輯的秘訣在于找到一種可以在任何想要的位置制造出雙鏈斷裂的可靠手段。最初的普遍策略是使用鋅手指核酸酶(ZFNs)——一種由一個鋅手指DNA結合域和一個取自限制性內切酶的DNA切割結構域所組成的融合蛋白,它可以結合并切割基因組位點(Bibikova 等,2001)。不久科學家們就在果蠅和小鼠身上證明了ZFNs依靠同源重組對于具體位置上的基因組編輯的用途(Bibikova 等,2003;Porteus和Baltimore,2003)。到2005年,桑加莫生物科學公司(Sangamo Biosciensces)的研究小組報告了針對在人類細胞系上造成重度聯合免疫綜合癥的基因的突變進行了成功的修正(Urnov 等,2005)。然而,塑造能夠可靠辨認具體位置的ZFNs的過程是緩慢而費力的。更好的方法則出現在2009年下半年,兩個研究小組描述了一組來自于植物病原體黃單胞菌(Xanthomonas)(Boch 等,2009;Moscou和Bogdanove,2009),叫做TALEs的特殊轉錄激活蛋白,TALE使用一個特定的模塊密碼來瞄準具體的DNA序列。但是,這一方法還是需要可觀的工作量,因為針對每個目標都要求設計一個新的蛋白。

 

自從Marraffini和Sontheimer的2008年論文證明了CRISPR是一種可設計的限制性內切酶以來,研究人員已經意識到如果它可以在哺乳動物細胞內發揮作用的話,CRISPR也許就能為具體基因位點的切割和編輯提供強大的工具。但是,這個“如果”是非常關鍵的。相對于微生物,哺乳動物細胞擁有不同的內部環境,它們的基因要大1000倍,位置在細胞核內,并且嵌在一個精致復雜的染色質結構內。轉入諸如自我剪接II類內含子的其它簡單微生物系統已經失敗了,而使用核酸來瞄準基因位點的嘗試也問題重重。CRISPR究竟能否被設計構造成為一種用于編輯人類基因組的強力工具?直到2012年9月,專家們是持懷疑態度的(Barrangou,2012; Carroll, 2012)。

 

張鋒11歲時從中國石家莊搬到愛荷華州的得梅因(Des Moines, Iowa)。他在一次周六興趣課程中被分子生物學深深吸引,在16歲時就在一家當地的基因療法實驗室每周工作20小時。在哈佛念本科的時候,他因為室友患了重度抑郁癥的事而開始對大腦發生興趣,后來他到斯坦福跟隨神經生物學家兼精神病學家Karl Deisseroth攻讀博士學位,期間他們(聯同Edward Boyden)發展出了光遺傳學(optogentics),這是一項革命性的技術,依靠此技術可以通過光束來觸發攜帶微生物光敏感通道蛋白的神經元。在波士頓身為獨立研究員期間(先后在哈佛和麻省理工學院的腦及認知科學系還有博德研究所[Broad Institute]作初級研究員),張致力于進一步擴展研究神經生物學的分子工具。在開發出一種使用光來激活基因表達(通過把一個DNA結合結構域和一個轉錄激活結構域同兩個在光條件下相互結合的植物蛋白偶聯)的方法之后,他開始探索一種用來設計轉錄因子的普遍方法。在TALEs被解碼之后,張與他的合作者Paola Arlotta和George Church(此外還有一個來自桑加莫生物科學公司的研究小組)都成功地將TALEs改造用于哺乳動物,使得精準激活、抑制和編輯基因成為可能(張等,2011;Miller等,2011)。然而,張鋒并沒有停止尋找更好的方法。

 

2011年2月張聽了哈佛的微生物學家Michael Gilmore關于CRISPR的報告就立刻被它吸引住了。他次日飛赴邁阿密參加一個學術會議,卻悶在酒店房間里一頭扎進CRISPR的文獻資料。回來之后,他就著手創造嗜熱鏈球菌的Cas9版本用于人類細胞(用優化密碼子和一個核定位信號)。到2011年4月,他已經發現,通過表達Cas9基因和一個設計過的靶向攜帶熒光素酶的質粒的CRISPR RNA,他可以在人胚胎腎細胞(HEK)內降低熒光度。但是,效果還是不盡如意。

 

接下來的一年間張一直在優化這個系統。他探索著可以增加進入細胞核的Cas9比例的方法。當他發現嗜熱鏈球菌Cas9在細胞核內并非平均分布(它在核仁處聚集),他就測試其他的選擇,發現化膿性鏈球菌(S. pyogenes)的Cas9分布地更均勻。他發現哺乳動物細胞雖然缺乏細菌的RNaseIII,但是仍然可以處理crRNA,盡管是用和在細菌里不同的方式。他測試了tracrRNA的各種同工型(isoform)來造鑒定在人類細胞內保持穩定的那一個。

 

到了2012年的中期,他已經獲得了一個由三部分組成的強有效的系統,包含來自化膿性鏈球菌和嗜熱鏈球菌兩者之一的Cas9、tracerRNA和CRISPR陣列。以人和小鼠基因的16個位置為靶向,他證明了,高效而準確地改變基因是可能的——通過非同源重組的末端接合制造缺失和通過與修復模版進行同源重組來實現插入新序列。此外,多重基因可以通過設計CRISPR陣列,用彼此匹配的間隔來同時編輯。當Charpentier和Doudna的論文在那年初夏發表之時,他還用在她們的實驗里描述的短sgRNA融合來測試一個兩部分組成的系統。在體內環境下這一融合的效果很差,僅僅低效地切割了位點的一小部分,但是,他發現一個復原了3‘端發夾結構的全長融合可以解決問題(Cong 等,2013;Zhang,2012)。(張之后很快繼續證明了CRISPR比原想的更加功能多樣:它可以被用于在數周內創造遺傳疾病和體細胞癌的復雜小鼠模型,也可以用于實施全基因組篩選來尋找某一生理過程中的必須基因——它的精確度還可以通過降低脫靶切割來提高。他和曾與van der Oost共事的計算機生物學家Koonin還將發現新的第2類CRISPR系統,包括那個與Cas9切割方式不同而且僅需要crRNA卻不需要tracrRNA的核酸酶系統[Zetsche 等,2015]。)張于2012年10月5日提交了報告哺乳動物基因組編輯的論文,發表在2013年1月3日的《科學》上(Cong 等,2013);這篇論文將成為該領域內被引用次數最多的論文,而他的試劑由一家非營利性組織Addgene分發,在之后的3年間接受到25000次申請。

 

大約一個月后的10月26日,一個在基因組學和合成生物學領域極有專長并且曾與張有合作的才華橫溢而非同尋常的哈佛大學資深教授George Church遞交了他關于在人體細胞內進行基因組編輯的論文。自從1970年晚期跟隨DNA測序先鋒Walter Gibert在哈佛讀研究生期間,Church就專注于發展大規模“閱讀”和“書寫”基因的強大技術——此外他還因具有挑釁性的建議,譬如使用合成生物學來復活長毛的猛犸象(wooly mammoths)和尼安德特人(Neanderthals)而引起社會爭論。清楚張的研究,同時受到Charpentier和Doudna的啟發,Church著手在哺乳動物細胞內測試crRNA-tracer融合。和張一樣,他也發現短融合在體內環境是無效的,而全長融合則效果好。他瞄準7個位置,證明了非同源重組末端接合和同源重組的作用。他的論文和張的論文是相繼發表的(Mali 等,2013)。(Church和其他研究者都在不久之后使用CRISPR來提升“基因驅動力”(gene drive)——合成基因在自然群體中可以迅速擴散,從而引發將其應用于控制攜帶瘧疾的蚊子的驚喜和對于破壞生態系統的擔憂。他還將尋求使用CRISPR在豬的基因組里滅活逆轉錄病毒來推動豬的器官移植給人。)到了2012年的夏末,隨著體外研究獲得矚目,而成功的體內基因組編輯的消息在發表之前就傳播開來,好幾個團隊開始競相開展基因組切割的概念驗證實驗,盡管不是基因組編輯。Doudna在Church的協助下提交了一篇論文,證明在一個基因組位點進行低效率的切割(Pandika 2014;Jinek 等,2013)。曾從事ZFNs和TALEs基因組編輯的韓國首爾國立大學(Seoul National University)的Jin-Soo Kim 教授報道了在兩個位點進行切割(Cho 等,2013)。在以上兩個例子中,切割都是低效的,因為sgRNA缺乏tracerRNA的關鍵性3’端發夾結構。作為使用ZFNs和TALEs進行基因組編輯的領軍人物,哈佛大學教授Keith Joung 則更進了一步。使用由他的合作者Church提供的全長sgRNA結構,Joung通過在斑馬魚的實驗證實CRISPR可以在生殖系上有效地制造缺失(Hwang 等,2013)。這些短論文提交于2012年末,在張和Church的論文2013年1月初發表不久之后被接收,于1月末在線發表。

 

CRISPR迅速躥紅

 

2013年初,用谷歌搜索“CRISPR”開始井噴,這一趨勢至今未減弱。在一年之內,研究人員已經報告了在多種生物內使用基于CRISPR的基因組編輯,包括酵母、線蟲、果蠅、斑馬魚、小鼠和猴子。科學和商業上對其在人類醫療和農業生產的潛在應用的興趣也開始上升,同時這個技術可能被用來培育設計嬰兒的前景也引發了社會關注。

 

CRISPR的早期開拓者并未停止拓展邊界,但是他們不再孤單。全世界的科學家都涌入了這一領域,他們是一批新的英雄隊伍,他們進一步地闡明CRISPR的生物學,推進和擴展了基因編組輯技術,并且將它運用于廣泛范圍的生物學問題。在這篇文章的范圍內公正描述他們的貢獻是不能的;讀者可以參考最近的綜述(Barrangou和Marraffini,2014;Hsu 等,2014;van der Oost 等,2014; Sander和Joung,2014;Jiang和Marraffini,2015;Sternberg和Doudna,2015;Wright 等,2016)。

 

發現20年前的一處西班牙鹽沼而曾經不為人知的微生物學系統如今卻成了科學期刊特刊、《紐約時報》的頭條、生物科技創業公司和國際倫理學峰會的焦點。CRISPR的時代已經到來了。

 

CRISPR的啟迪

 

CRISPR的故事充滿了關于產生科學進步的人文環境的啟迪,與學術資助機構、一般公眾和躊躇滿志的研究人員相關。

 

其中最重要的一點是醫學突破往往來源意想不到的地方。CRISPR的早期英雄們都不是專門研究編輯人類基因的,甚至都是不是研究人類疾病的。他們的動機混合了個人興趣(弄清楚耐鹽細菌內奇怪的重復序列)、軍事上的特殊需要(防范生物戰爭)和工業應用(提高酸奶產量)。

 

這段歷史還說明了基于大數據的“無假設驅動”式發現在生物學研究中愈發重要的位置。CRISPR基因位點,它的生物學功能和tracrRNA的發現都不是來自實驗臺上的實驗,而是來自對大范圍、常常是公開的基因數據庫的生物信息學的開放式探索。“假設驅動”科學當然依舊是基本的研究方法,但是21世紀將會看到更多的是兩種科學研究方法的結合。

 

如此眾多的CRISPR英雄們都在科學生涯的開頭(包括Mojica,Marraffini Charpentier,Vogel還有張)于30歲之前就做出了他們各自的重要成果是很有啟發意義的。年輕常常意味著愿意在未知的方向和看似無人問津的問題上冒險——和想要獲得成功的動力。對于如今這個首次獲得NIH資助的年齡已經升至42歲的時代而言,這是個重要的提醒。

 

還值得注意的是,他們中的許多人都是在可能被一些人看作遠離科學研究的常規渠道的地方做出標志性工作的(西班牙的阿利坎特;法國的國防部;丹尼斯科的公司實驗室;Vilnius在立陶宛)。此外,他們的重要論文都被一流期刊拒絕了——在很久的延遲之后得以發表在并不令人矚目的位置。這些遭遇恐怕并非偶然:這些研究地點可能給予了從事不那么熱門選題研究的更大自由,但是對于如何克服期刊和評審人的懷疑與不信任態度所給予的支持幫助卻是較少的。

 

最后,這些科學突破背后的故事鮮有靈感迸發的瞬間。它們通常是一幕群戲,演出了10年以上,在其中的演職人員共同實現了他們各自孤身奮戰所無法企及的高度。對于一般公眾和希冀科學生涯的青年人,這都是精彩的一課。

參閱文獻:

The Heroes of CRISPR

Cell. 2016 Jan 14;18-28. pii:S0092-8674(15)01705-5. doi:10.1016/j.cell.2015.12.041.

Three years ago, scientists reported that CRISPR technology can enable precise and efficient genome editing in living eukaryotic cells. Since then, the method has taken the scientific community by storm, with thousands of labs using it for applications from biomedicine to agriculture. Yet, the preceding 20-year journey-the discovery of a strange microbial repeat sequence; its recognition as an adaptive immune system; its biological characterization; and its repurposing for genome engineering-remains little known. This Perspective aims to fill in this backstory-the history of ideas and the stories of pioneers-and draw lessons about the remarkable ecosystem underlying scientific discovery.

閱讀次數:  

發表評論

吉林时时开奖直播