基因組學

求聞百科,共筆求聞

基因組學(英語:Genomics),或基因體學,是研究生物基因組和如何利用基因的一門學科。該學科提供基因組信息以及相關數據系統利用,試圖解決生物醫學,和工業領域的重大問題。

基因組學能為一些疾病提供新的診斷、治療方法。例如,對剛診斷為乳腺的女性,一個名為「Oncotype DX」的基因組測試,能用來評估病人乳腺癌復發的個體危險率以及化療效果,這有助於醫生獲得更多的治療信息並進行個性化醫療。基因組學還被用於食品與農業部門。

基因組學的主要工具和方法包括:生物信息學,遺傳分析,基因表達測量和基因功能鑑定。

發展史

早期的測序工作

隨著在1941年左右羅莎琳·富蘭克林對於DNA的螺旋結構的確認,詹姆斯·沃森弗朗西斯·克里克在1953年發表的DNA的結構,還有弗雷德里克·桑格在1955年出版的胰島素的胺基酸序列,核酸測序成為早期分子生物學家們的一個主要目標。

DNA測序技術的開發

弗雷德里克·桑格(Frederick Sanger)
沃特·吉爾伯特(Walter Gilbert)
弗雷德里克·桑格沃特·吉爾伯特共享1980年度的諾貝爾化學獎,由於他們獨立開發的用於DNA測序方法。

除了他對胰島素的胺基酸序列的開創性工作之外,弗雷德里克·桑格和他的同事在能夠啟動建立全面的基因組測序計劃的DNA測序技術的發展中起到了關鍵作用。在1975年,他和艾倫·庫爾森(Alan Coulson)發表用DNA聚合酶和放射性標記核苷酸的測序過程,他稱為"加減測序法技術"。該過程可以達到80個核苷酸測序一次性測序,和之前還是非常費力的過程相比是一大進步。然而,在1977年,他的小組能測序5386個核苷酸的單鏈噬菌體Φ-X174噬菌體(Phage Φ-X174)中的絕大多數,完成了世界上第一個以DNA為基礎的基因組完全測序。"加減測序法"的改進導致鏈終止法(chain termination method),或桑格測序法,形成了DNA測序,基因組圖譜,數據存儲的技術的基礎,和在下一個四分之一世紀的研究中最廣泛使用的生物信息學分析。在同一年,哈佛大學沃爾特·吉爾伯特艾倫·馬克薩姆(Allan Maxam)獨立開發出DNA測序的馬克薩姆-吉爾伯特測序(Maxam-Gilbert法,又稱化學法),涉及在DNA已知的鹼基優先斷裂,一種效率較低的方法。由於他們在核酸測序開創性的工作,吉爾伯特和桑格與保羅·伯格重組DNA)分享1980年度的諾貝爾化學獎

完整的基因組

基因組學出現於1980年代,1990年代隨著幾個物種基因組計劃的啟動,基因組學取得長足發展。相關領域是遺傳學,其研究基因以及在遺傳中的功能。

  • 1977年,噬菌體Φ-X174;(5,368鹼基對)完全測序,成為第一個測定的基因組[1]
  • 1995年,嗜血流感菌Haemophilus influenzae,1.8Mb)測序完成,是第一個測定的自由生活物種。從這時起,基因組測序工作迅速展開。
  • 2001年,人類基因組計劃公布了人類基因組草圖,為基因組學研究揭開新的一頁。
  • 2012年,千人基因組計劃

「組學」革命

「組」在基因組一詞中,意指一個物種的「全部」遺傳組成。由於諸如基因組測序這樣的大規模定量生物項目的成功,「組」的這個意義的使用已經擴展到其他相關領域。例如,蛋白質組指的是一個物種組織細胞內的全部蛋白質(表達的基因這裡指被翻譯成蛋白質)。蛋白質組學現在已經作為研究蛋白質組的專業術語。

請參見:組學主題列表 (生物學)

基因組分析

在一個生物體已被選擇以後,基因組項目涉及三個部分:DNA測序,該序列的組件生成原有染色體的表示法,以及該表示法的注釋和分析。[2]

DNA測序

霰彈槍定序法

研究領域

比較基因組學

基因組間的相互比較已經導致一些驚人的生物學發現。如果某特定的DNA序列或DNA基序在某進化樹分支上所有的物種都出現,則稱該序列在這些物種間是保守的。某DNA序列的進化保守性提示擁有這些序列的物種具有相應的自然選擇優勢。同時也提示,其具有重要功能。這可能是蛋白編碼序列或調控區域。對這些序列的實驗研究表明,其中一部分被轉錄成小RNA,而這些小RNA的功能尚未研究清楚。

在兩個進化樹上距離較遠,相關而又不處於同一進化分支中的物種間鑑定出相似序列(包括許多基因),促成了新理論的產生,該理論認為這些序列是通過水平基因轉移而獲得的。儘管這些基因看起來是從古細菌真細菌進行轉移,而這種現象在細菌間尤其顯著。同時還注意到,細菌基因在真核生物核基因組中出現,而這些基因通常用來編碼粒線體葉綠體蛋白,這種現象也支持細胞器起源的內共生學說。該理論認為動物和植物基因組中發現的粒線體和葉綠體最初是自由生活的細菌,由祖先真核細胞吸收而來,後來逐步變成真核細胞的有機組成部分。

結構基因組學

由中西部結構基因組學中心確定的蛋白質結構的一個例子。

結構基因組學(Structural Genomics)是基因組學的一個重要組成部分和研究領域,它是一門通過基因作圖、核苷酸序列分析確定基因組成、基因定位的科學。結構基因組學尋求通過研究給定的基因組編碼來測定每一種蛋白質的三維結構。這種基於基因組的方法允許通過實驗和建模方法的組合來實現結構確定的高通量方法。 結構基因組學與傳統結構預測之間的主要區別在於結構基因組學試圖確定基因組編碼的每種蛋白質的結構,而不是專注於一種特定的蛋白質。

功能基因組學

功能基因組學(Functional genomics)的研究又往往被稱為後基因組學(Postgenomics)研究,它是利用結構基因組學提供的信息和產物,通過在基因組或系統水平上全面分析基因的功能,

元基因組學

元基因組學(英語:Metagenomics),又譯宏基因組學總體基因體學,是一門直接取得環境中所有遺傳物質的研究。研究領域廣泛,也可稱為環境基因體學、生態基因體學或群落基因體學。在早期研究微生物基因體必須將環境基因DNARNA轉殖進入大腸桿菌體內,利用複製選殖方式,分析在自然環境中複製選殖特定基因(通常為16S rRNA)的多樣性。但是,這樣的工作表明,絕大多數的微生物生物多樣性已被基於複製選殖的方法所遺漏[3]。最近的研究使用「霰彈槍」或PCR定向測序來獲得來自所有樣本社區所有成員的所有基因的大部分無偏差的樣本基因[4]。由於其能夠揭示以前隱藏的微生物多樣性,總體基因體學提供了一個強大的鏡頭,用於觀察微生物世界,這些微生物世界有可能徹底改變對整個生命世界的理解[5][6]

營養基因組學

營養基因組學的研究方面是檢測和操縱植物中的微量營養代謝途徑,

遺傳相似性

學界常用某特定物種的DNA序列共享人類序列的百分比來表示相似性。該數字顯示了兩物種之間鹼基對相同的百分比。這裡所列的是相對於人類的遺傳相似性,並列出了數據來源。

這些數據來源於不同的二級數據源,並用不同的方法獲得(例如DNA-DNA雜交序列比對),這可能導致相同物種間的比較得到不同的結果。因此,這些數據應該僅僅用作大致相似性。

物種 相似性 數據來源
人類 99.9% 引自2000年1月,美國總統柯林頓國會演講;同時參見人類基因組計劃
100% 同卵雙生
黑猩猩 98.4% 醫學發展美國人聯會(AMP); Jon Entine in the San Francisco Examiner
98.7% Celera基因組中心Richard Mural, quoted on MSNBC
倭黑猩猩 同黑猩猩
大猩猩 98.38% 基於物種間非重複DNA的研究,發表在Am J Hum Genet.(2001)Feb;682:444-56上
小鼠 98% 醫學發展美國人聯會(AMP)
85% 比較所有的蛋白編碼序列, NHGRI
95%
秀麗隱桿線蟲 74%
香蕉 50% 醫學發展美國人聯會(AMP)
水仙花 35%

基因組學的應用

基因組學已經在許多領域,包括醫學生物技術人類學和其他社會科學提供應用。

基因組醫學

下一代基因組技術允許臨床醫生和生物醫學研究人員對於大量的研究種群數量大幅增加收集的基因組數據。也有越來越多的案例使用基因組學所得到的數據應用在個人化的治療上。[7]

合成生物學和生物工程

基因組學知識的增長,使合成生物學有越來越多的複雜的應用。

參考

參考資料

  1. Sanger F, Air GM, Barrell BG, Brown NL, Coulson AR, Fiddes CA, Hutchison CA, Slocombe PM, Smith M. Nucleotide sequence of bacteriophage phi X174 DNA. Nature. 1977-02, 265 (5596): 687–95. 
  2. Pevsner, Jonathan. Bioinformatics and functional genomics 2nd. Hoboken, N.J: Wiley-Blackwell. 2009. ISBN 9780470085851. 
  3. Hugenholz et al.(1998) Impact of Culture-Independent Studies on the Emerging Phylogenetic View of Bacterial Diversity. J. Bacteriol 180 (18): 4765–74.
  4. Eisen, JA (2007) Environmental Shotgun Sequencing: Its Potential and Challenges for Studying the Hidden World of Microbes. PLoS Biology 5 (3): e82
  5. Marco, D (2010) Metagenomics: Theory, Methods and Applications. Caister Academic Press. ISBN 978-1-904455-54-7.
  6. Marco, D (2011) Metagenomics: Current Innovations and Future Trends. Caister Academic Press. ISBN 978-1-904455-87-5.
  7. Lu, YF; Goldstein, DB; Angrist, M; Cavalleri, G. Personalized medicine and human genetic diversity. Cold Spring Harbor perspectives in medicine. 2014-07-24, 4 (9): a008581. PMID 25059740. 

外部連結