<p class="ql-block">大千世界,花鳥魚蟲、飛禽走獸,欣欣向榮;花開花落、進化演化、生老病死。佛祖說,眾生平等。那眾生是什么?按照現代生物學來說,眾生就是一切生命,即所有動植物和微生物。那為什么平等?因為大家都來自一個源頭——生命的基礎代碼。</p> <p class="ql-block">這代碼,就是堿基。</p><p class="ql-block">在DNA序列中,指A、T、C、G四種(即腺嘌呤、胸腺嘧啶、胞嘧啶、鳥嘌呤);在mRNA(稱為“信使”,負責把DNA中儲存的遺傳指令傳遞給蛋白質合成工廠)序列中,指A、U、C、G四種(尿嘧啶U替代了T)。</p><p class="ql-block">它們既是物質(生物學中稱為堿基,化學視角下是分子),又是信息的載體。我們今天只討論科學已證實的層面,至于比堿基分子更微觀的原子及量子層面,以后再探討。</p> <p class="ql-block">從堿基說起。堿基是核苷酸的組成部分,這里不細說。重要的是,DNA編碼區(qū)上連續(xù)三個堿基構成一個信息存儲單元(三聯(lián)體序列)。到了mRNA轉錄時,mRNA通過堿基互補配對(A配U,C配G)從DNA的三聯(lián)體序列中轉錄遺傳信息,形成對應的三個相聯(lián)堿基一組,稱為密碼子。比如DNA三聯(lián)體序列為AAG,轉錄為mRNA密碼子則是UUC。密碼子承載著合成氨基酸的信息——例如UUC指令合成苯丙氨酸。4個堿基的排列組合理論上可產生64種密碼子,不過由于存在簡并性(多種密碼子對應同一種氨基酸),比如UUU和UUC都對應苯丙氨酸,GAA和GAG都對應谷氨酸。64種密碼子中,除3種不編碼氨基酸的終止密碼子外,其余61種對應20種氨基酸。蛋白質是由一串氨基酸(比如600個)連接形成的肽鏈,經折疊后形成的功能分子,其氨基酸序列就來源于mRNA上特定順序排列的密碼子片段。這些密碼子的模板來自DNA上的某一段基因,這個過程稱為轉錄,有點像水中的倒影。人類基因組包含約2萬個蛋白質編碼基因,但由于可變剪接和翻譯后修飾,實際功能蛋白質種類遠超此數。</p> <p class="ql-block">可以說,密碼子發(fā)揮兩大關鍵作用:一是單個密碼子決定合成哪種氨基酸;二是一串密碼子的排列順序決定氨基酸的連接順序,讓氨基酸形成肽鏈,多條肽鏈再折疊成蛋白質。也就是說,基因憑借密碼子的指令信息與排列順序,決定了氨基酸序列與蛋白質結構。接著,蛋白質參與構建細胞,細胞進一步組裝成各個器官,各器官協(xié)同運作,支撐起生命體的各項活動——這便是生命的邏輯。</p> <p class="ql-block">我們以《易經》八卦來比喻。易經的基礎單元為爻,分為陽爻和陰爻(“?”和“--”),類似代表生命基礎代碼的4種堿基(A、T、C、G)。三爻一組構成八卦(如乾卦“?”、坤卦“?”),兩個卦上下組合形成64卦(如屯卦“?”、蒙卦“?”);就像4種堿基每3個為一組構成64個密碼子。</p><p class="ql-block">二者都以有限元素通過排列組合衍生出復雜變化:不同卦象象征萬物的狀態(tài)與趨勢,不同密碼子則對應精確的生化指令(編碼氨基酸)。易有太極,是生兩儀,兩儀生四象,四象生八卦,八卦定吉兇,吉兇生大業(yè)。</p> <p class="ql-block">人體含有23對(46條)染色體,每條染色體的核心成分是DNA?;蚴荄NA上具有遺傳效應的堿基序列片段,不僅包含能轉錄為mRNA密碼子的編碼區(qū)(由三聯(lián)體序列組成),還包括啟動子、終止子、內含子等非編碼序列(非編碼區(qū))。這些非編碼序列雖不直接編碼蛋白質,但對基因表達至關重要——負責調控基因何時、何地開始表達,既存在于基因內部編碼區(qū)之間(內含子),也存在于基因之間。人類DNA的編碼區(qū)僅占堿基總數的1%~2%,而非編碼區(qū)占絕大多數。</p> <p class="ql-block">DNA的雙螺旋結構和堿基互補配對原則是1953年由美國的沃森和英國的克里克提出的,明確了堿基序列是遺傳信息的載體。1954年,美籍俄裔物理學家伽莫夫推測密碼子由三聯(lián)堿基組成,為遺傳密碼的破譯提供了方向。1961-1967年,美國人尼倫伯格、科拉納等破譯了全部64種遺傳密碼,證實了三聯(lián)堿基編碼氨基酸的機制。20世紀中后期,隨著分子生物學發(fā)展,明確了基因編碼區(qū)的功能是為蛋白質合成提供模板,決定氨基酸序列。隨著2003年人類基因組計劃完成對人類基因組約30億個堿基的測序,基因組學研究進入了新階段。</p> <p class="ql-block">如今,基因檢測技術已成熟并廣泛應用,但仍有大量蛋白質結構未明確,還有大量非編碼區(qū)的未知功能待探索。下次我們將聊聊AI技術在蛋白質結構預測和非編碼區(qū)功能解析上的最新突破,我們可能會覺得生命的一切好像都是代碼和數字。</p>