??rainbow rainbow rainbow
bring a more beautiful smile??
tea tea tea??
sweet beauty of the world??
tree tree tree??
growing up on the road??
---^^Bonjour. Fr?hlichen Sonntagnachmittags Tee??
休息休息??(《Send to you.》):“大家關注下鼠疫。”“好?!薄班?,蔓姐,這是歷史上各大洲曾出現(xiàn)的鼠疫資料……”“哇,你動作快嘛!”“感覺蔓姐會問,哈哈哈,現(xiàn)在有一種答題答對了的快樂感?!薄虝旱木W(wǎng)絡視頻會議結(jié)束后,司徒景蔓看了幾份資料,便起身進了廚房?!鞍⒛?,這個世界上最能裝東西的硬盤是什么?”“emmm?最能裝的硬盤,其實是我們的遺傳物質(zhì)?!薄鞍??”司徒景蔓被蘇幕的回答笑著瞪大了眼睛?!坝植皇恰抖呃?A 夢》里的記憶面包,第一步,把信息存儲到面包上;第二步,吃下面包,讓信息進入人體。第三步,消化信息?!薄斑€真有哦,簡單看步驟的話,現(xiàn)在的科技就能做到前兩步了,DNA 存儲技術已經(jīng)能大規(guī)模寫入數(shù)據(jù)了。美國科技公司 Catalog 已能將 16 GB的維基百科英文版全部文本保存到了一條人工合成的 DNA 中。”“所以?”“所以DNA 存儲最直接的優(yōu)點是存儲量大。我給你畫個東西,你看那塊黃黃的液體重 3克,但其中 DNA 重量微乎其微。根據(jù)紐約基因組中心的數(shù)據(jù),一克 DNA 可存儲 215 PB 數(shù)據(jù)。把這些數(shù)據(jù)存到 1T 容量7毫米規(guī)格的硬盤里,硬盤堆在一起,有 1505 米高。世界最高建筑,迪拜塔也只有 828 米。DNA 存儲不僅存儲量大,壽命還長。正常硬盤使用壽命在 5到10年,遇到斷電沖擊等情況還會更短。常溫下 DNA 的可讀性能保持很久。保存得當,簡直一克永流傳,甚至萬年前的 DNA 都被還原了。以目前水平, DNA 可以存一些政府文件,歷史材料。估計以后也沒什么歷史、文化遺產(chǎn)之爭了。隨著技術發(fā)展, DNA 存儲可以取代數(shù)據(jù)中心。”“我親愛的personal computer,那電子數(shù)據(jù)是怎么存進 DNA 里的呢?”“記得生物課上講過, DNA 脫氧核糖核酸是一種雙螺旋結(jié)doublehelix的生物大分子,由堿基組成。DNA 鏈條上的長條就是堿基,DNA 中通常有四種堿基,大家直接理解成 A,T,C,G 就可以。堿基的排列順序決定了長相、智力,不同病癥的發(fā)病風險等。舉個例子, ACA 的排列讓人眼神不好,按 CAC 排能讓人長高。其實就是遺傳信息?!薄澳蔷褪荄NA 鏈條能儲存遺傳信息也能儲存數(shù)字信息?!薄皩?,但這么簡單的邏輯,當時卻根本沒人細想,大家都在忙著破解基因密碼。只要找出堿基排列的規(guī)律和意義,就像擁有了人類修改器,改長相改素質(zhì)改壽命,變白變美變高變長壽。于是人類基因組計劃開始了一項工程。這項工程花費 30 億美元和十幾年時間,測出完整的人類基因序列。如果把破解堿基排列比作翻譯一本書,此時相當于終于把書拿到手里?!薄澳沁M展呢?”“雖說沒有立竿見影的成果,但這工程推動了 DNA 測序技術的發(fā)展。巨大需求量的刺激,讓 DNA 測序進入自動化時代。破解不了堿基序列,人們就變實際了。畢竟都要吃飯的嘛,看不懂沒關系,排成咱看得懂的樣子,好歹當個 U 盤,于是 DNA 存儲技術就這樣出現(xiàn)。”“咋說?”“如果把堿基看成 A , T , C , G 四個字母,堿基序列實際上就是一串英文。而數(shù)據(jù)實際上就是一串數(shù)字。把數(shù)字和堿基字母對應起來,重新排列,就能表達內(nèi)容。知道轉(zhuǎn)換規(guī)則,就能從排列中讀取信息。DNA 存儲就是通過把堿基看成固定數(shù)字,將數(shù)字化的數(shù)據(jù)轉(zhuǎn)換成堿基序列的方式。把 A,G 視為 0 ,C,T 視為 1 ,排列后合成。這就是最早的 DNA 存儲。為了存儲更多數(shù)據(jù),人們嘗試了把 A ,T ,C,G 看成 0 ,1,2,3 的四進制。雖然四進制能縮短數(shù)據(jù)長度,但同一堿基連續(xù)出現(xiàn),會讓序列不穩(wěn)定,影響數(shù)據(jù)的準確。更高的進制,四種堿基又不夠用,為了解決這個問題,人們用了一種三進制的方案。這種方案里從第二位開始編碼,以前一位堿基來決定后一位。前一位堿基是 A ,下一位就把 A 排除,用 C,G,T 來代表 0,1,2 ?!薄按髱?,我的腦子繞暈了”,司徒景蔓一屁股坐在木板上,蘇幕看得莞爾一笑,也隨地而坐?!昂冒?,要不今兒講到這?”“不,我要聽,繼續(xù)!”“好,那我們可以試一試。剛才的數(shù)字用三進制表達是 211101 。假設堿基序列第一位是 A ,轉(zhuǎn)換結(jié)果就是 ATCTCGA。第一個字母是 A 時,按照表格,代表 2 的字母是 T,T 后面代表 1 的字母是 C,C 后面代表 1 的是 T,依此類推。解決了編碼問題,大家玩嗨了,動圖、音頻、電影先后被存入 DNA 。2017 年,紐約基因組中心將電影火車進站存入 DNA 。存入數(shù)據(jù)大小的記錄也快速刷新著, 2012 年哈佛 650KB 的記錄很快被 MB 級碾壓。2016 年記錄到了百兆級,微軟存了 200M 電子書,大概等同 789 本高中語文必修一。今年微軟做了個 DNA 自動存儲系統(tǒng),但是hello 這 5 個字母的存儲和讀取花了 21 個小時。emmmm,這就是 DNA 存儲的缺點了。但有關 DNA 存儲的科技在不停進步。2001 年至今,DNA 測序從上億美元降到了不到一千美元。今年 Catalog 的寫入速度已經(jīng)到了 4M 每秒。成本降到十萬分之一,寫入速度快了千萬倍。這種進步幅度,足以對 DNA 存儲技術保持期待。在不久的將來,也許電腦里的硬盤就換成瓶裝 DNA 了”,蘇幕笑著舉起手中的畫。“噗嗤,太逗啦!”“所以的所以,記憶面包不需要,多想想我,就對啦!”“yes!”……四季有夢,天涯相隨;春夏秋冬,海角相伴。你說,我是你體內(nèi)的力量;我說,你是我腦中的硬盤。我們約好,一起白頭。^~^(2019.11.17點滴隨筆)