生物信息學的定義匯總十篇

時間：2024-04-04 10:28:05

序論：好文章的創作是一個不斷探索和完善的過程，我們為您推薦十篇生物信息學的定義范例，希望它們能助您一臂之力，提升您的閱讀品質，帶來更深刻的閱讀感受。

生物信息學的定義

篇（1）

一、引言

隨著后基因組時代的來臨，高通量生物技術的發展，生物醫學的實驗手段和研究方法均發生了巨大的變革，生命科學研究中不斷涌現出海量的生物數據，包括基因組數據、蛋白質組數據、功能基因組數據等。這些生命組學的數據使得生物醫學研究者以系統生物學的角度來研究生命現象[1-6]，同時它們的迅速增長，帶來了數據的存儲與傳輸、數據處理、數據獲取及數據的理解與應用等等一系列的問題，這些問題促進了生物信息學的產生和快速發展[7-13]，也吸引了來自數學、生物學、化學、藥學、信息學等各個領域的研究人員廣泛關注并取得了大量成果[43-49]。生物信息學定義為應用信息科學技術來理解、組織及管理生物分子數據，旨在為生物研究人員提供一些工具及資源，方便他們獲取生物數據，分析數據，從而發現生物世界的新知識[14]。它是一門新興前沿交叉學科，吸引著各種有影響力國際組織的重大的關注，ORACLE、MICROSOFT、Google等公司也先后加大力度投入生物信息學領域的開發和研究[15-17]。由于這一領域有著極大的潛力，美國國家標準技術協會（NIST）和美國國防部高級研究計劃局（DARPA）及美國計算機協會也相繼投入這一領域的研究。為了強應這一潮流，搶占學科發展的制高點，同時培養生物信息學人才，很多學校新增設了生物信息學這門課程。接下來我們將結合實際中的教學談幾點體會及相應的一些嘗試探索。

二、生物信息學的特點

生物信息學在我國是一門新興前沿學科，它是信息學、生物學、數理統計等多學科的交叉、結合的產物。它需要多個領域的專家通力合作。傳統的生物學研究實質是一門實驗科學，需要對實驗數據進行處理與分析，從而新現象、新的生物學規律，從而分析、歸納和總結，提煉出新的生物學知識。然而隨著生物科學與信息技術的高速發展，生物數據的積累速度不斷加快，特別是人類基因組計劃順利實施，使得生物分子數據量以超過摩爾定律的速度迅速發展。利用這些豐富數據，通過分析、處理揭示數據背后的生物學意義，是生物學家、數學家和信息處理人員面臨的一個嚴峻的挑戰。生物信息學就是為迎接這一挑戰而發展起來的一門新交叉學科。下面結合幾方面談談生物信息學的特點。

生物信息學研究對象

生物體是一個復雜的系統，同時也可看作是一個信息系統控制著生物的遺傳、生長、和發育。生物分子是生信信息的載體，對于生物信息學而言，主要研究兩種載體，即DNA分子和蛋白質分子。攜帶著三種信息，遺傳信息、結構信息及進化信息。

DNA分子作為遺傳信息的載體，它的核苷酸序列上存儲著蛋白質的氨基酸序列編碼信息，存儲著基因表達調控信息，攜帶著遺傳信息，主要存儲在DNA四種字符組成的堿基序列中，控制生物體性狀的基因是一系列DN段。這些遺傳信息的傳遞與表達促使生物體不斷生長與發育。DNA通過自我復制，不斷傳遞著遺傳信息使生物體得以繁衍，基因通過轉錄和翻譯，使得遺傳信息得以在生物體中表達，從而后代表現出與親代相似的生物性狀。基因表達中，遺傳信息從DNA傳到RNA，這一過程稱之為轉錄，然后從RNA傳遞到蛋白質，這一過程稱之為翻譯，在表達中，基因控制著蛋白質的合成。

蛋白質是機體各種生理活動的物質基礎，蛋白質分子是大分子化合物，其基本單位是小分子的氨基酸，組成蛋白質的氨基酸有20種， DNA序列中三個連續的堿基為一個蛋白質的氨基酸編碼。堿基字符序列與氨基酸字符序列組成了基本的生物信息，分析這些生物信息有助于認識生命活動的規律及生命本質。

總而言之，生物分子信息具體表現為DNA序列數據、蛋白質序列數據、生物分子結構數據、生物分子功勇數據，生物信息學則綜合利用信息科學、生物學與數理科學的研究方法來收集、存儲、處理、分析與解釋海量生物信息。生物信息學把基因組DNA序列信息分析作為源頭，破譯遺傳語言，認識遺傳信息的組織規律，識別隱藏在DNA序列中的基因，掌握基因的調控與表達功能，獲得蛋白質的編碼信息后進行蛋白質空間結構模擬和預測。

生物信息學研究的主要內容

生物分子信息的收集與管理。生物分子數據量巨大，如核酸序列的數據以千兆計。因而有組織搜集和管理這些數據是各項工作的前提，便于一些研究人員共享這些數據，及時得到最新的實驗結果，需要把這些數據整理成生物信息數據庫，同時要不斷更新與管理這些收集的信息從而使這些數據的一致性、可靠性和完整性得以保證。

數據庫搜索及序列比對。搜索同源序列在某種程度上就是通過序列比較尋找相似序列，這可使研究人員通過搜索序列數據庫找到與新序列同源的已知序列，并根據同源性推測該新序列的生物功能。而序列比對則是為了判斷兩個序列之間是否具有足夠的相似性。從而判定二者之間是否具有同源性。

基因表達數據的分析與處理。基因表達數據反映基因轉錄產物在細胞中的豐度，通過這些數據可以用來分析哪些基因的表達發生了改變，基因之間有何相關性，基因的活動的受限，基因的功能，提供疾病發病機理等等，是生物信息學研究中的熱點與重點。

篇（2）

生物醫學信息學的定義

根據美國醫藥信息學會（American Medical Informatics Association, AMIA）的定義：Biomedical Informatics (BMI) is the interdisciplinary, scientific field that studies and pursues the effective uses of biomedical data, information, and knowledge for scientific inquiry, problem solving and decision making, motivated by efforts to improve human health.

生物醫學信息學（BMI）是一門研究如何有效利用生物醫學數據、信息和知識的跨學科科學，以滿足科學查詢、解決問題和制定決策的需求，并通過不斷的努力，推動和提高人們的健康。

生物醫學信息學的關鍵屬性

生物醫學信息學主要從事生物醫學數據、信息、知識的產生、存儲、獲取、使用及共享的理論、方法和過程的研究、開發和應用。

生物醫學信息學建立在計算機技術、通訊技術以及信息科學的基礎上，是IT技術在生物醫學領域上的應用。

生物醫學信息學在方法學上可以支持從分子水平到大眾水平的研究、推論、建模、模擬、實驗和轉化。覆蓋從基礎醫學、臨床科研，到臨床診療、公共衛生等多種生物醫學領域的研究和應用。

生物醫學信息學認為生物醫學信息的最終使用者是人。因此，社會科學和行為科學對于技術性解決方案的設計和評價，以及對于復雜經濟、倫理、社會、教育和組織架構的演進，起到了非常重要的影響作用。

BMI各應用領域的相互關系和區別

在生物醫學信息學領域有很多看似非常相近的術語和名詞，很容易被混淆和亂用，例如：信息學、醫學信息學、生物信息學、衛生信息學、生物醫學信息學、公共衛生信息學等等。如何理解這些術語？它們之間的區別和聯系又是怎樣的呢？

Shortliffe教授解釋說：生物醫學信息學是一門基礎性生物醫學科學，是一門應用潛力非常廣泛的科學。生物醫學信息學研究和發展的推動力，是生物學和醫學領域的臨床、科研和實踐中所遇到的各種問題。生物醫學信息學將生物醫學的理論和方法與計算機、信息和通訊技術相結合，以創新和發展新的方法和理論為目標。這些核心理論和方法包括數學建模、數據庫理論、認知科學、統計學、數據挖掘，自然語言處理等等，反過來又促進生物醫學科學和健康科學的研究、應用和創新。

生物醫學信息學理論、方法和技術首先被應用到臨床醫療、診斷和護理等臨床醫學領域，同時也被應用在牙科和獸醫學領域。這些領域關注的是患者個體，是以患者為中心實現臨床相關信息的采集、集成、共享和應用，因此被稱為臨床信息學。

與臨床信息學緊密聯系在一起的是公共衛生信息學，它的應用不是針對單一的患者個體，而是關注整個人群，以大眾健康和管理為目標。臨床信息學和公共衛生信息學共享了很多相同的方法和技術，這兩個方面結合在一起就是我們通常所說的醫學信息學。因此，生物醫學信息學不能等同于醫學信息學。

生物醫學信息學在生物學領域的應用，特別是在細胞生物學和分子生物學上的應用，主要關注的是細胞和分子水平的過程，這部分被稱為生物信息學。

生物醫學信息學在放射影像、圖像成像和分析、以及影像管理方面的應用被稱作影像信息學。影像信息學以組織和器官為主要對象，包括：放射影像、病理影像、超聲影像、皮膚病學、以及分子可視化等等應用領域。

據Shortliffe教授介紹，其實這些應用領域的邊際是非常模糊的，例如生物信息學和影像信息學相結合就產生了分子生物成像學；生物信息學和臨床信息學的結合形成了藥物基因組學，而臨床信息學和公共衛生信息學相結合則形成了大眾消費健康學。

BMI和HIT的關系

生物醫學信息學與計算機科學（軟件和硬件）、臨床科學、基礎生物醫學科學、流行病學、統計學、生物工程學、管理科學及認知科學與決策密切相關。

生物醫學信息學（BMI）與醫學信息技術（Healthcare Information Technology, HIT）有著密切的關系，但相互各有側重。BMI更偏重于BMI理論的研究、方法的建立、教學、以及這些理論和方法在生物醫學研究領域應用。其主要參與者是學術研究人員、科研機構及相關實驗室。而HIT則更偏重于應用，主要是把BMI的方法、理念以及研究成果與醫療臨床實踐相結合，并通過廠商開發成相應的醫療信息系統產品，供醫院和衛生行政機構使用。其主要參與者是醫療IT廠商、醫療臨床機構及衛生行政機構等。在美國，生物醫學信息學領域的學術組織是美國醫藥信息學會（AMIA），而醫學信息技術領域的學術組織是美國醫療信息管理和系統協會（HIMSS）。

加強生物醫學信息學教育和培訓

生物醫學信息學對于生物醫學研究、企業應用系統的研發、圖書館情報學和知識管理、公共衛生統計、生物技術和制藥、臨床實踐和管理、以及政府決策研究，都將發揮重要的作用。

但是，目前要真正把信息技術應用到生物醫學領域以及臨床診療中，還存在一個非常大的障礙，就是缺乏同時具備信息技術知識和生物醫學領域知識的復合型人才。因此，作為交叉科學的生物醫學信息學，要肩負起自己的使命，要為復合型人才的培養做出貢獻。各醫學院校和研究機構，在開展常規的生物醫學信息學學位教育之外，還應該積極開設信息學相關的培訓，為醫學生和護理學生提供雙學位課程。另外，要加強對醫藥衛生專業人員的信息學繼續教育，并積極為臨床醫護人員所進行生物信息學研究提供必要的支持和協作。

篇（3）

下一代測序技術的應用產生了大量的測序數據，這對生物學特別是生物信息學在數據的存儲、管理和搜索等方面帶來了新的挑戰。一直以來計算機存儲和處理數據能力的增長速度都快于生物數據的增長速度，但2003年后，由于測序技術的發展使得測序成本大幅度下降，產生了大量的生物數據，計算機的存儲和計算能力逐漸無法滿足大數據的需求。這促進了云計算的運用和發展，它使得用戶可以根據需求租用硬件設備和軟件，避免了對硬件設備的大量資金投入和管理投入。

1 云計算定義

“云”是一個通過虛擬技術把云端計算機或是服務器連接在一起的服務網絡。存儲和分析數據都由“云”端的服務器或是計算機完成。中國云計算專家劉鵬給出如下定義：“云計算是一種商業計算模型，它將計算任務分布在大量計算機構成的資源池上，使用戶能夠按需獲取計算力、存儲空間和信息服務。”

按照資源的共享水平，云計算的服務模式分為三種，基礎架構即服務（Infrastructure as a service），平臺即服務（Platform as a service）和軟件即服務（Software as a service）。

IaaS（Infrastructure as a service） Service：基礎架構即服務。它整合了基礎設施如虛擬主機、存儲設備、網絡設備等資源成為一個服務平臺提供給用戶使用。IaaS位于網絡的底層，向用戶提供按需分配、按需付費的計算設備和存儲設備。

PaaS（Platform as a service）提供服務平臺，用戶掌控運作應用程序的環境，可以在平臺上應用，測試和開發軟件。

SaaS（Software as a service）即在服務平臺上提供軟件供用戶使用，用戶只使用軟件，不掌握操作系統、硬件等網絡基礎架構。用戶不必自己安裝軟件，只需要瀏覽器連接到公共的服務平臺即可。供應商會按照用戶的要求安裝所需的軟件，并負責軟件的升級和維護。

云計算的主要優點：

（1）把用戶從安裝和測試軟件的工作中解脫出來。云計算平臺可以按照用戶的需求提供軟件及硬件的服務。用戶不需要考慮網絡下面復雜的硬件架構，僅僅需要關注計算和分析就可以。

（2）按需租用計算資源可以讓用戶支付更少的費用。在云計算平臺上，用戶在最初時可以租用少量的機器，以后隨著需求的增加或減少相應的增加或減少租用的機器。用戶所付的費用就是實際租用機器的費用。

（3）云計算方便研究人員之間的數據共享和分析。不同研究者在本地服務器上安裝的軟件版本可能不同，所以共享數據和軟件很困難。云計算可以使登錄同一個平臺的用戶共享操作系統和所有的軟件數據，保證了軟件的版本同步更新。

2 云計算在生物信息中的應用

我們把云計算在生物信息學中的應用按IaaS， PaaS和SaaS三個方面分別介紹。

2.1 IaaS

用戶租用云計算上的虛擬主機可以自己控制計算、存儲等硬件設備，建立需要的計算環境。并且大量的生物信息學工具可以打包為虛擬鏡像用于租用的云計算的虛擬主機上，可以很方便的進行多種數據分析。如CloVR提供的一個包含預配置和自動的生物信息學流程的虛擬主機，可以運行在本地的計算機上也可以運行在云計算平臺上。這個虛擬機以Ubuntu和BioLinux為基礎，安裝了Grid Engine和Hadoop作為作業調度，Ergatis作為工作流系統，還有很多開源的生物信息學軟件，如BLAST、16S rRNA等。用戶也可以開發自己的軟件運行在虛擬機上。Bioconductor是一個開源的關于R語言的生物信息學庫，提供了一系列的軟件包用于微陣列數據分析。用戶可以下載Bioconductor提供的鏡像安裝到租用的云計算平臺上。

2.2 PaaS

Galaxy Cloudman和Eoulsan可以看做PaaS。Galaxy整合了一系列的簡單易用的工具，提供一個簡易的網頁用來分析數據。Galaxy Cloudman把Galaxy的軟件工具打包成一個鏡像，可以在AWS（Amazon Web Service）上應用。用戶可以將其他安裝在Galaxy平臺上的軟件安裝到自己的云計算平臺上，甚至可以在Galaxy Cloudman上定義插件。通過添加額外的工具，可以擴展默認函數并測試和使用。從這個意義上說，Galaxy Cloudman可以看做PaaS。

Eoulsan整合了很多下一代基因數據分析工具，如BWA，Bowtie，SOAP2，GSNAP，edgeR，和DEdeq于一個框架內，同時，它也支持用戶自己開發的插件用于數據分析。

2.3 SaaS

很多傳統的生物信息學工具如BLAST、UCSC Genome Browser僅僅用一個瀏覽器就可以登錄到服務器使用相應的服務，它們也可以稱為SaaS。這些服務一般由軟件工具的開發者提供，伸縮性很差。我們主要介紹應用于云計算平臺上可以伸縮的生物信息學工具。

短序列（讀段）匹配是指將測序得到短序列匹配到參考基因組上，這是許多測序數據分析的第一步，如SNP識別和基因表達譜分析。CloudBurst，CloudAligner，SEAL和Crossbow都是應用于云計算基于MapReduce的軟件，可以匹配數以百萬計的序列。Schatz用”seed-and-extend”算法開發的CloudBurst可以確定錯誤匹配的數目。CloudBurst模仿了RMAP的算法，但速度提高了30倍。但是CloudBurst不支持fastq文件，并且不能處理重亞硫酸鹽測序和（雙）末端測序產生的數據。CloudAligner彌補了這個缺點，并且比CloudBurst快35%到80%。SEAL整合了BWA，在序列匹配時可以去除重復的序列，這對SNP識別和以后分析很有用。應用MapReduce的Crossbow整合了Bowtie和SOAPsnp，可以在幾個小時內匹配數以十億計的序列。

差異表達分析可以用來尋找不同樣本中表達有明顯差別的基因，而RNA測序（RNA-seq）用來量化樣本中的基因表達水平。Myrna是一個云計算平臺上計算大規模RNA測序的軟件。它整合了序列匹配、歸一化、聚類分析和統計模型，直接輸出不同樣本的基因表達水平和不同表達水平的基因。然而，Myrna 最大的缺陷是不能正確地將短序列匹配到外顯子拼接位點上。但FX彌補了這個缺點。FX用改進的匹配函數分析RNA數據，以RPKM或是BPKM的格式輸出不同基因的表達水平。

3 云計算面臨的問題

云計算提供了強大的計算能力，但云計算自身的特點也使它的發展面臨了一些困難和制約。云計算在生物信息學上的應用尚處于初期階段，盡管已經出現了一定數量的生物信息學工具，但仍有很多的分析無法完成，很多的工具還需升級或者開發。云計算上數據的隱私性和安全性也是用戶需要考慮的方面。特別是一些生物數據涉及到病人的隱私，但很多國家還沒有保護這種數據隱私的法律。云計算服務提供商需要制定一些規則來保護用戶的數據。

4 對應用云計算的建議

對于將要使用云計算的用戶，需要考慮以下三個方面：數據規模、安全隱私和費用。

數據規模及安全隱私：首先要考慮你的數據規模是否超過了本地計算機的處理能力。現在本地的個人電腦可以處理數千兆的數據，服務器一次可以處理數百G的數據。如果用戶熟悉并行計算的技術，可以處理數TB的數據。但如果你的數據更大并且不精通并行計算，本地計算機和服務器就很難處理了，就可以考慮云計算。用戶如果要向云計算平臺上傳輸數據，需要考慮數據的安全性和隱私性。比如涉及病人的隱私是否會泄露，云計算服務提供商是否可以保證數據的安全等。

費用：云計算的費用一般是按照使用的計算資源的多少和使用時間的長短計算的。使用云計算前應該評估其使用費用。用戶應該考慮所有階段的費用，如數據傳輸、保存、分析等。

目前，云計算和生物信息學都處在快速發展當中，云計算在生物信息學中的應用也越來越廣泛和深入。特別是生物數據的大規模增漲，生物學家必須從大量的數據當中分辨出有用的信息。這就需要強大的存儲能力和計算分析能力，云計算可以很好的解決這個問題。云計算和生物信息學的結合將極大的促進生物學的發展。

參考文獻

[1]劉鵬主編.云計算（第二版）[M].北京：電子工業出版社，2011（05）.

[2]Schatz MC，CloudBurst：Highly sensitive read mapping with MapReduce，Bioinformatics

25（11）：1363-1369，2009.

[3]Nguyen T，ShiW，Ruden D，CloudAligner：A fast and full-featured mapreduce based tool.for sequence mapping， BMC Res Notes 4：171，2011.

[4]Hong D，Rhie A，Park SS，Lee J，Ju YS，Kim S，Yu SB，Bleazard T，Park HS，Rhee H，Chong H，Yang KS，Lee YS，Kim IH，Lee JS，Kim JI，Seo JS，FX：An RNA-seq analysis tool on the cloud， Bioinformatics 28（5）：721-723，2012.

作者簡介

篇（4）

作為整個信息鏈的起點，事實就是事物在人類視野(感觀/邏輯)中的原始映像［1］。事實是事情的真實情況，包括事物、事件、事態，即客觀存在的一切物體與現象、社會上發生的不平常事情和局勢及情況的變異態勢［2］。事實也是人類知識的起源，人類全部知識的最初信息基礎就是事實。

1．2數據(Data)

通常認為，數據是對事物純粹的、客觀的記錄，是原始的未經解讀的數字、文字、圖像、符號、聲音、計算機代碼等［3］。而數據本身缺乏關聯和目的性，但當數據結合一定的背景、規則、意義之后，就會形成信息。

1．3信息(Information)

作為整個信息鏈中的中心鏈環的信息，它的下游是面向物理屬性的，上游是面向認知屬性的。“信息”既有物理屬性也有認知屬性，因此成為“信息鏈”的代表稱謂。

1．4知識(Knowledge)

知識來自于信息，信息只有同接收者的個人經驗、信息與知識準備結合，也就是同接收者的個人背景融合才能轉化為知識，它比數據或信息更接近行動。知識必須經過學習或研究以及從信息中經過去粗取精、去偽存真等加工才能夠獲得［4］。

1．5情報(Intelligence)

情報是為實現主體某種特定目的，有意識地對有關的事實、數據、信息、知識等要素進行加工后得到的產物。情報既包含有信息的成分，也包含有知識的成分。從信息層面看，情報所包含的信息是與人類社會有關的;從知識層面看，情報是與知識的利用價值緊緊聯系在一起的。從一定程度上來說，情報是知識的子集。1．6智慧(Wisdom)智慧是能迅速、靈活、正確地理解和解決事物的能力。這種能力來源于人類基于已有的知識，是針對物質世界運動過程中產生的問題，根據獲得的信息進行分析、對比、演繹，找出解決方案的能力。從嚴格意義上來講，智慧是屬于知識層面的，是人類大腦運用知識活動的產物———即運作和應用知識的知識。有知識不一定有智慧，但有智慧一定有知識。知識只有轉化為智慧，才能顯示出其真正的價值。

1．7事實、數據、信息、知識、情報、智慧之間的關系

數據是客觀事實的記錄，信息是有意義的事實和數據，知識是系統化的信息，情報是進入人類社會交流系統的運動著的知識，智慧是運用信息和知識解決問題的能力。這樣由事實(Facts)數據(Data)信息(In-formation)知識(Knowledge)情報(Intelligence)智慧(Wisdom)層層遞進，構成了一條完整的信息鏈，見圖1［5］。

2醫學信息學的相關概念

2．1國外醫學信息學定義的三種導向

2．1．1以信息技術為導向定義側重于技術和工具，即通常強調以計算機為基礎的技術。“臨床計算”、“醫學中的計算機”、“醫學計算機科學”、“計算機在醫學中的應用”等認識比較常見［6］。

2．1．2以角色、任務或面向領域為導向定義側重于組織內部信息人員的角色。例如，護理信息學、牙醫信息學等通過醫學信息學分支學科來定義。

2．1．3以概念為導向定義側重于如數據、信息和知識這些概念在醫學領域中的特定內涵。從總體上來看，國外醫學信息學的定義是朝著形成基于數據、信息、知識的醫學信息學定義方向發展的。

2．2中國醫學信息學定義的兩種傾向

2．2．1基于字面拆分后的概念解析

第一種拆分是將“醫學信息學”拆分為“醫學”+“信息學”(medicalinformatics)———偏重于方法論層面。把“醫學信息學”定義為信息學在醫學領域中的應用，同時確定醫學信息學的范圍是“醫學”和“信息學”之交叉。前者指其應用領域，后者指其方法學。第二種拆分是將“醫學信息學”拆分為“醫學信息”+“學”(medicalinformationscience)———側重于學科體系層面(即理論與技術方法統一的學科體系)。把醫學信息學定義為研究“醫學信息”的一門科學，即研究醫學領域中的信息現象和信息規律的一門科學。

2．2．3基于國外醫學信息學定義的翻譯與重組

此類定義大多為將國外醫學信息學的定義翻譯成不同形式的漢語語言并且進行重組，與國外對醫學信息學的定義無太大區別。

3醫學信息學研究中的信息鏈

3．1“數據信息”鏈

這一環節的重點在于對醫療大數據的應用。當下全球大量的公共衛生信息、電子病歷信息、用藥信息、住院信息、圖像信息、管理信息、基因信息、醫學知識庫信息以及實驗室數據等構成了醫療衛生大數據［7］。隨著信息技術與衛生及生物醫學日益緊密的結合，大數據對衛生及生物醫學的研究與應用也將產生深刻影響。因此，如何更好地利用大數據便成為信息技術與衛生及生物醫學領域共同面對的挑戰。大數據在醫療行業可應用于臨床、研發、公共衛生和創新商業模式等領域，在健康領域的終極應用是疾病診斷和預測性治療。雖然醫療大數據的研究和應用如火如荼，但在應用過程中也面臨著諸多問題，如數據的存儲、數據的整合、數據的挖掘利用和保護等方面都面臨著一些問題。這也就需要我們在利用醫療大數據的同時，變革數據管理方式、建立完善的區域衛生信息化標準體系、積極探索利用數據挖掘技術等等各種措施，利用創新的方法和模式，發揮大數據在醫院行政管理、健康教育與管理、衛生信息服務和疾病的控制預防中的作用和價值。

3．2“信息知識”鏈

這一環節主要關注醫學知識庫的建立。數據庫是計算機應用系統中的一種專門管理數據資源的系統，它有文字、符號、圖形、圖像、數字及聲音等多種形式。而知識庫是知識工程中結構化、易操作、易利用、有組織的知識集群，是針對某一(或某些)領域問題求解的需要，采用某種(或若干)知識表示方式在計算機存儲器中存儲、組織、管理和使用的互相聯系的知識集合區別與聯系［8］。知識庫的概念來自兩個不同的領域，一個是人工智能及其分支———知識工程領域，另一個是傳統的數據庫領域。人工智能和數據庫兩項計算機技術的有機結合，促成了知識庫系統的產生和發展。建立醫學知識庫，需要一支多學科人才的專業隊伍，并且要能夠適應數字化醫療向智慧化醫療的轉變需要，構建大型的一站式通用智能醫學知識庫。建立知識庫，要以本體為建設思路和方法，不僅要構建西醫學科的知識庫，更要構建中醫學科知識庫，且重視與“大數據”醫療的整合，更好地利用臨床信息，將有用的信息知識化。

3．3“知識智慧”鏈

這一環節的著重點在于智慧醫療的實現。2008年，IBM首先提出了“智慧醫療”的概念。早期的智慧醫療強調物聯網的作用，設想把物聯網技術充分應用到醫療領域中，以實現醫療的信息互聯、共享協作、臨床創新、科學診斷以及公共衛生預防。而未來的智慧醫療將是以衛生信息化和信息共享為基礎，以患者為中心，以個性化、智能化醫療服務為核心的醫療服務體系［9］。智慧醫療包括了智慧醫院、區域醫療、家庭自助健康監護等多種服務方式，它將成為未來醫療衛生信息化發展的主要潮流。智慧醫療可以創建一個更加合理的醫療產業鏈，并且使用戶體會到更加智能化和協調化的醫療服務［10］。

4醫學信息學的未來發展方向

4．1學科體系的協同融合，加速了生物醫學信息學的形成與發展

醫學信息學(MedicalInformatics，MI)和生物信息學(Bioinformatics，BI)雖然產生背景不同，但是進入后基因組時代之后，生物信息學和醫學信息學的邊界趨于模糊，互相滲透和結合的趨勢明顯。其目的就是要提供新的生物醫學知識的開發和共享框架。正是兩者的協同融合加速產生了一門新的學科———生物醫學信息學(BiomedicalInformatics，BMI)。可以預見的是，基于相同的學科理論基礎和彼此交叉融合的研究內容，生物醫學信息學一定是醫學信息學和生物信息學未來的發展方向。

4．2學科研究向促進“轉化研究”的方向發展

首先，在信息鏈的研究視角下，醫學信息學的發展會更加注重信息鏈中的要素從低層次到高層次的鏈環轉化;其次，在醫療領域，醫學信息學面臨的最大的挑戰是如何將生物醫學研究領域的成果快速、可靠地轉化為現實可用的臨床解決方案。同時，醫學信息學出現了新的分支學科，即轉化醫學信息學。轉化醫學信息學通常被認為是以轉化醫學中的相關信息問題為研究對象，結合信息科學、理論基礎和應用技術，服務于轉化醫學的研究，其目的是促進基礎醫學研究成果順利向臨床應用轉化［11］。轉化醫學信息學的研究內容包括醫學信息的標準化和醫學數據的組織與存儲等。它可以利用信息技術有效地加快基礎研究變為臨床應用，有力地促進轉化醫學的發展。

4．3學科的社會服務功能不斷提升

4．3．1個性化

個性化意味著衛生信息管理和衛生信息服務以用戶為中心，圍繞每個用戶的狀態、需求乃至興趣愛好來采集信息或提供信息服務。可以設想，在未來每個患者都將擁有自己的個人健康中心。

4．3．2智能化

智能化意味著通過對既有信息的分析，挖掘其中的規律，利用獲得的規律來處理新的信息，并給用戶提供科學合理的建議。

4．4新技術支撐和引領著醫學信息學的未來發展

在未來發展中，許多嶄新的技術可以有效地促進醫學信息學的研究和應用的發展。遠程醫療(Telemedicine):計算機技術、多媒體技術、通信技術與醫療技術結合。移動醫療(MobileHealth):通過移動通信技術來提供醫療服務。健康物聯網(TheInternetofthings):利用物聯網進行健康和疾病的管理。健康云(Healthcloud):以SaaS的方式向醫院和醫療機構提供醫院管理和居民健康檔案管理方面的服務。醫療大數據(Medicalbigdata):大數據技術與醫療行業結合，充分開發利用醫療數據蘊含的信息與價值。轉化醫學(TranslationalMedicine):建立基礎研究與臨床醫療間更為直接便捷的聯系。智慧醫療(Wisemedical):使用物聯網技術打造健康檔案和醫療信息平臺，實現患者與醫護人員、醫療機構和醫療設備的互動。

4．5我國醫學信息學學科發展亟待解決的問題

我國醫學信息學最近幾年發展很快，但學科研究體系不夠完善和成熟、學科建設和理論研究比較薄弱、標準設置滯后、系統規劃和人才不足等問題制約了醫學信息學的健康發展。

4．5．1亟需解決學科正名和專業名稱規范化問題

醫學信息學在國內的學科地位的確很尷尬，主要表現在國內的三大學科體系(目錄)，即“中國圖書館分類法”(簡稱中圖法)、“國家標準的學科分類與代碼”(簡稱國標法)、“教育部頒布的學科專業目錄”(簡稱教育法)中均沒有“醫學信息學”的類名。因此，當務之急是要盡快確立“醫學信息學”的學科名稱及其在學科體系中的位置。醫學信息教育在國內看似很火爆，其實是亂象叢生。此前教育部只批了中南大學、南通大學、徐州醫學院的醫學信息學專業，但國內很多學校都在信息管理與信息系統等專業后面加括號注明“醫學信息學方向”，然后對外宣稱是醫學信息學專業。與此類似的還有一種叫“衛生信息管理專業”。顯然這都是不負責任的做法。因此，希望教育主管部門加大宏觀指導與調控力度，規范醫學信息學的學科建設與專業教育。首先，在學科及專業目錄上設立獨立的“醫學信息學”，既不要讓“醫學信息學”依托(附)于其他學科/專業，也不需要在別的學科/專業后面的括號內出現“醫學信息學”。根據教育部2012年9月頒布的《普通高等學校本科專業目錄》，建議將“醫學信息學”納入到“特設專業”中的“1010醫學技術類”。其次，成立全國醫學信息學教學指導委員會(教指委)，規范指導醫學信息學的專業教育。再次，協調指導“醫學信息”類的學術組織，整合醫學信息學的學術研究力量和研究隊伍，指引醫學信息學的健康發展。

4．5．2加強學科課程的設置和培養目標的確立

我國醫學信息學專業的本科課程設置比較落后，學科的課程體系不完善且專業教材缺乏，不同學校的教學內容和培養目標差別很大，體現不出學科的重要性和交叉復雜性。故要求科學合理地加強學科的課程設置，正確處理好計算機科學、醫學和信息科學之間的關系，參照國外已有的教學方案并聯系自己的教學實際情況去充實教學計劃，擴寬教學范疇，使整個醫學信息學的教育更加合理。4．5．3實現專業教育體系化，加強專業人才的培養由于沒有認識到醫學信息學教育的重要意義，醫學信息學地位不高，所以學科的科研投入、教育投入和人才培養都面臨難題，教材和師資的缺乏也導致了專業教育規范化和體系化不足。為此，要深刻認識到醫學信息學教育的意義，推動專業教育向規范化和體系化邁進。醫學信息學作為一門新興學科，其發展需要大批的高水平人才。人才的培養需要在專業教育中實現，只有通過規范科學的教育體系培養高素質的醫學信息學人才，培養醫學信息學研究的復合型人才和對在崗人員進行進修培訓，才能適應醫學信息學的快速發展。

篇（5）

【中圖分類號】TP391

【文獻標識碼】A

【文章編號】1672—5158（2012）10-0078-01

一、生物信息數據庫的現狀及問題

在生物信息學的發展過程中，逐步建立起了大量基于網絡的生物數據庫，而且開發了眾多檢索工具，從而實現了生物信息數據的智能處理和綜合分析。生物信息數據在具有增長迅猛、更新及時、種類繁多等特點的同時，更表現出高度的復雜性、多樣性和不一致性。

隨著生物信息數據量的激增以及數據處理能力的復雜程度不斷提高，現有的生物信息數據庫已經逐漸暴露出許多問題。三大核酸數據庫依靠傳統方式交換數據，無法及時反應出其他專用生物信息數據庫的變化情況以及非核酸類數據信息。網上所提供的大部分數據分析工具采用面向問題的搜索方法，搜索效率隨著問題規模的擴大而降低，并且無法智能地對數據中存在的未知知識進行發掘。為此，在后基因組時代，需要將數據倉庫思想及智能數據挖掘技術運用到生物信息學領域中。

二、基于生物信息數據倉庫的數據挖掘技術

（一）　生物信息數據庫中的算法工具

在生物信息學中，基因比對是最常用和最經典的研究手段。在核酸序列或蛋白質序列之間進行兩兩比對，比較兩個序列之間的相似區域和保守性位點，尋找二者的相似形、同源性，進而探尋可能的分子進化關系，揭示序列中蘊涵的結構、功能等信息。數據挖掘主要存在以下幾種經典分析模式：關聯模式分析、序列模式分析、分類分析、聚類分析，其中關聯模式分析應用最為廣泛。

（二）　OLAP和數據挖掘技術

傳統的針對數據庫的開發工具多為聯機事物處理模式，它主要是面向具體的查詢和統計，有著較為具體的應用目的。然而隨著越來越多數據庫的出現，數據量的迅猛增長，OLTP在數據資源的充分利用、為用戶提供有效支持和幫助等方面，則顯得力不從心。因此，基于數據倉庫的聯機分析處理以及數據挖掘引起了日益廣泛的關注和應用。OLAP是一種自上而下、不斷深入的分析工具。用戶提出問題或假設，OLAP則負責從上而下深入地提取出關于該問題的詳細信息，并以可視化的方式呈現給用戶。DM是一種決策支持過程和挖掘性工具，它主要基于人工智能、機器學習、統計學等技術，高度自動化地對原始數據進行分析，發現隱藏在數據中的模式，做出歸納性和預測性的推理。

（三）　基于生物信息數據倉庫的數據挖掘技術

實現數據挖掘的前提條件是必須具有海量數據，而這恰恰是數據倉庫的基本特點之一，二者緊密結合可以有效解決大量應用中出現的問題。在生物信息學領域，使用數據挖掘技術可以大幅提高研究人員的工作效率，改變原有的預測法；數據挖掘算法還可以結合生物信息專業領域的公式算法，根據研究人員的設想，對數據進行全面高效的分析。

基于數據挖掘等技術發展起來的智能決策技術具備了在生物信息學領域中大展身手的天賦，特別是基于海量數據的數據挖掘和開采技術更具有廣泛的需求和應用背景。另一方面，目前生物信息學的研究方法和發展情況，已經形成了較為完善的智能決策系統，成為數據倉庫和數據開采較為成功的應用案例。另外，現有各種生物信息應用分析軟件從一定程度上講，已經反映并且實現了數據倉庫及數據挖掘的思想和技術。

三、實現生物信息異地多源數據庫的綜合利用

（一）　建立基于Web的生物信息數據倉庫

基于現有的生物信息數據庫，運用數據倉庫思想，利用OLAP和數據挖掘技術，建立生物信息數據倉庫，是一種不需要大幅增加硬件設備以及物理裝置的前提下，實現基于Web平臺的生物信息集成與處理平臺的可行方案。設計一個基于Web的生物信息數據倉庫，其主要結構由五部分組成：外部數據源；基于Web的數據調度、傳輸；數據的變形整合；元數據規則、元數據管理；基于Web的綜合管理平臺。

DWBW以DDBJ／EMBI／GeneBank作為主要數據源，同時以其他主要的生物信息數據庫作為整個數據倉庫的基本數據源。通過分析數據庫結構和數據結構類型，建立DWBW的元數據規則。這樣，基于上述各種數據庫就可以建立起一個基于Web的虛擬數據倉庫，由于不存在一個物理上位于某地的存儲中心來保存這些數據，用戶面對的只是基于網絡的分布式虛擬的數據倉庫。其模型、算法的運行由專用的分析工具服務器來完成，而對于數據的調用和整理都是在源數據庫上進行的，根據不同用戶提交問題的不同，具體分析過程則由分配服務器交給服務器去完成分析，只是最終將結果返回請求分類服務器，顯示給用戶。

DWBW將通過統一的基于Web的頁面與用戶進行交互，在后臺則主要由請求分類服務器、Web服務器及專用分析工具服務器共同完成對問題的提交和分析，實現對數據倉庫元數據規則的理解，然后根據分類的結果，與相關分析工具進行匹配，將問題提交到相應的分析工具服務器進行處理。處理完成后返回給請求分類服務器，進而返回給提交問題的用戶。

（二）　DWBW的關鍵技術

生物信息學元數據的抽取。數據的整理和抽取，是開發所有數據倉庫時所遇到的最難解決也是最具挑戰性的問題之一。將不同時期生成的大量歷史數據中的數據結構、字段的定義以及對象之間的關系等一系列的描述信息整理出來，并制定一套通用可行的規范，本身就是一個工作量巨大、難度極高的問題。因此，數據倉庫元數據的抽取整理，成為建立DWBW的關鍵問題。數據抽取、清洗、轉換和裝載過程與一般數據倉庫建立過程中的數據整理不完全相同，其數據具有規范性強，存儲結構相對簡單，轉換、裝載容易等特點。

虛擬生物信息數據倉庫的建立。虛擬生物信息數據倉庫實現對生物信息平臺相關數據的組織和集成，并且將不同主題的數據對象分別存儲到各個數據集市中，同時還將建立起部分有價值數據的在線OLAP數據庫。虛擬數據倉庫采用中間件充當數據中心，提供信息的訪問接口，對存貯在不同數據源的生物信息數據進行存取操作。由于虛擬生物信息數據倉庫一般不是針對實時數據進行分析統計，所以對于時間效率的要求不如一般查詢統計那么高，這就確保了開發處于不同物理位置數據源的虛擬DWBW具有可行性。同時，對于一般性的查詢比對等基本操作，不會影響其工作效率和準確性。

篇（6）

1.引言

隨著現代信息技術的發展與廣泛應用，加快了人類信息社會的建設步伐，信息化、數字化已經逐漸進入到醫學的各領域中，成為醫學界不可或缺的重要工具與手段。信息技術的高速發展正改變著醫學的教學、研究、醫療服務等的諸多傳統方式，并隨著現代信息技術的不斷發展而不斷推陳出新。但是，我們不能否認，現代信息技術在醫學方面的應用不僅為醫學的認知帶來了新的渠道，轉變了醫學的思想觀念與工作方式，同時也為醫學界帶來了一些問題，例如：新的倫理問題等。因此，在醫學信息化建設迅速發展的今天，如何才能更好的將信息技術運用到醫學中，醫學信息化的發展前景如何？對醫學界具有十分重要的現實意義與長遠意義。

不可否認，醫學信息化的建設是長期的，只有符合醫學發展的信息化才具有生命力。在醫院中，我們隨處可見的CT、彩超等大型的數字化醫療設備、計算機網絡的各種醫療收費系統、醫療信息處理系統等，還有在醫學教學、科研領域，都逐漸開始使用現代信息技術的輔助來提升教學與科研的水平。信息技術在醫學中的應用與改造與創新，使得醫學的教學、科研、臨床、管理、藥品、醫學器械的研制等都在借助信息技術來加快自身的發展，很難想象沒有現代信息技術、計算機技術、網絡技術的醫學院校或者醫院將會使什么模樣。

2.信息時代醫學信息化所面臨的新挑戰

2.1 數據的共享問題

美國在醫學信息化數據的共享方面比較開放，美國的國立生物技術信息中心中存儲大量的數據信息，這些數據信息對科學家是無償提供研究的。但是，在我國的生物醫學研究部門或者是醫療機構中，已經積累了大量的科研與臨床數據，這些數據目前大多數仍處于獨立使用的狀態中，各機構之間缺乏數據共享數據孤島現象嚴重制約著我國生物醫學的研究與發展，同時也為我國社會醫療健康保障體系的建立帶來了困難。在實際中，這些醫療機構之間由于存在各種利益關系，一般都對自己所持有的醫學科研數據及診療數據資料保密，不愿意向同行與社會提供數據共享的服務。

2.2 數據標準化的問題

美國的著名勞倫斯伯克利國家實驗基因租的科學部主任表示，最理想的狀態就是能夠建立統一的電子醫療系統，這些醫療病歷系統應該具有統一的標準。但是，在我國的醫學現實中并非如此。各醫院存儲的各種數據標準不同，不同的系統在存儲的信息方面也不一樣，目前，醫療系統與醫療科研機構之間的信息數據標準很難實現統一。究其原因主要是由于各種醫療設備的生產廠家、醫療系統的軟件開發商之間的技術標準各不相同造成的。例如：不同的醫院對信息管理系統中的電子病例數據信息的記錄格式、標準不同，而信息中心的數據存儲設備在構架上也不相同，這就造成各醫院之間的醫療數據信息無法實現交流溝通、共享。如果同一個病人想在不同的醫院進行治療，就必須在不同的醫院分別再做一次相應的檢查，這不僅增加了病人的經濟負擔，嚴重的更影響了病人的最佳治療時期。因此，要想在醫學領域實現信息化就必須先打破各醫院之間的技術壁壘，解決信息化的標準化問題。

2.3 醫學信息化綜合應用型人才嚴重匱乏

目前，醫學信息學是建立在生物醫學、信息技術、統計學、管理學等多學科基礎上的一門交叉性的學科，在實際中，真正了解并掌握、精通信息科學知識的專業人才非常少。為了真正實現醫學信息化并促進多學科的研究與教學，于2009年美國的特拉華大學創立了生物信息學與計算機生物學中心，這一中心集中了來自美國的5個學院的60多名知名教師，并創立了負責多個生物信息學教育的研究項目。縱觀我國高校的現狀，還尚未成立專門的醫學信息專業，或者是生物醫學與信息學相交叉的學科專業。在生物醫學研究領域中的一些復合型研究人才大部分是由學生自己自學而成的，或者是由不同學科的導師共同培養而成的。這種狀況就造成我國醫療信息化應用人才的嚴重匱乏，并為我國醫療信息化人才的培養帶來了阻礙。不過我們堅信，在不久的將來，我國的醫學教育界一定會認識到這一問題。

3.信息時代醫學信息化的發展前景

3.1 醫學信息化正朝著遠程醫療與區域醫療的信息化發展

早在上世紀90年代，我國就曾經提出過實現遠程醫療的發展，很多偏遠地區的醫院與大城市中具有實力的綜合醫院之間建立了遠程醫療咨詢會與會診聯系，但是由于當時采取的是調制解調器的電話網絡或較高成本的衛星傳輸信息，在實際應用中很難得以實現，因此也就未在全國范圍內進行推廣。進入信息時代，隨著互聯網技術的發展與計算機技術的進步，網絡音頻技術、視頻會議技術等在醫學界得到廣泛的推廣，并實現了遠程醫療教育，從而推動了我國醫學影像信息的異地遠程傳輸，進一步推動了我國的遠程醫療發展。隨著醫學界對信息共享、電子病歷等問題的探討與研究，我國醫學信息化逐漸向著區域醫療衛生信息化的方向發展。

3.2 數字化醫院是醫學信息化發展的必然趨勢

目前對于數字化醫院的定義至今還尚無定論，從一般意義上來看，它與醫學信息化所寓意的實質性內容并不存在本質上的區別。目前，我國以病人為中心的HIS建設還處于初級階段，雖然已經在很多方面發揮了重大作用，但是還遠遠不能滿足病人、醫護人員、管理者實現方便、低廉、高效、安全的就診環境與模式，因此，數字化醫院的發展還需要建立信息化條件下合理的診療流程與復合業務的需求。總之，實現數字化醫院在研究、開發、應用方面還存在很大的發展空間。

總之，目前我國醫療領域信息化應用還屬于起步階段，還存在一些問題。但是我們堅信，在不遠的將來，在我國政策的推動下、在信息科學技術的不斷發展下，信息時代醫療信息化的發展將不斷深入，將在我國生物醫學領域中得到不斷地發展與進步。

參考文獻

篇（7）

張鵬，中國科學院深圳先進技術研究院轉化醫學研究與發展中心執行主任，師從我國著名骨科專家戴尅戎院士，主攻類風濕性關節炎發病機理和治療。

作為知名骨科專家秦嶺教授領導的轉化醫學中心的核心成員，張鵬博士研究團隊以骨科炎癥性疾病為研究重點，從病因、發病機理、治療以及康復等方面進行系統研發。以對發病機理的探討作為基礎研究提升水平的基石，以對該類疾病治療手段的創新以及相關產品或技術的臨床應用和產業化作為最高目標，以服務廣大骨科患者作為宗旨，正在走一條具有自身特色的骨科轉化研發之路。

“老藥新用”，攻堅類風濕

張鵬曾在導師戴尅戎院士的指導下，在國際上首次驗證了手術懸吊方式刺激迷走神經進而激活“膽堿能抗炎通路”對于RA模型早期炎癥發展的抑制作用。研究結果發表在SCI 期刊《Inflammation Research》上。隨后該論文陸續被《Nature Review Rheumatology》和《Nature Review Immunology》等高端雜志引用，截至目前該文章已被引用11次。

針對目前全球范圍內新藥研發遇到“冷冬”的大環境，張鵬課題組聯合計算機化學及生物信息學相關的專家，通過計算機輔助藥物預測結合目前骨關節炎基礎研究中的最新成果，在臨床用藥中篩選具有治療RA及骨關節炎等疾病的藥物新功效，即“老藥新用”在骨關節炎癥中的應用。

張鵬曾在《Inflammation Research》、《Therapeutic Advances in Musculoskeletal Disease》、《ScientificWorldJournal》等雜志發表文章，闡述了RA治療中的“老藥新用”策略：以膽堿能受體作為潛在的治療靶點，通過應用最新的藥物靶點檢索手段—“蛋白質折疊碼”技術，在臨床用藥中篩選新的抗風濕功效，進而通過臨床前實驗手段（體外細胞學、動物模型體內）驗證其生物學特性，從而提出了一整套基于現代生物信息學最新技術的“老藥新用”策略，并在RA治療中進行具體實施。

目前，基于神經內科用藥GTS-21（膽堿能受體激動劑）探討其治療RA的研究已經獲得國家自然科學基金的支持，進展順利。該項目是張鵬博士倡導的骨關節炎癥“老藥新用”策略的具體實施之一。

研究小組基于傳統中藥在RA治療中的特殊療效，從祖國醫學理論出發，結合現代藥理學的開發，從具有“舒筋活絡，祛風除濕”的中藥品種中提取若干有效成分，用于對RA療效的觀察。從臨床前研究的角度，采用體外細胞及動物模型為研究對象，進行了前期實驗。目前已經篩選到了若干有效的中藥活性成分，推進下一步的機理研究，最終期望將有活性的成分開發成RA治療中的療效確切的藥用品種。

本項目應用研發團隊核心成員楊家安博士具有自主知識產權的“蛋白質折疊碼”技術，可將復雜的蛋白空間三位信息轉成具有一維結構的編碼，并對藥物結合靶點特性以及藥物數據庫進行掃描比對，具有高效準確的特點。張鵬博士主導聯合楊家安博士等核心人員建立了一整套“基礎研究靶點—蛋白質折疊碼技術掃描分析—臨床用藥數據庫比對篩選—生物學有效性驗證”的“老藥新用”研發策略體系。

據張鵬介紹，該研究策略在目前原創性化學新藥研發遇到巨大挑戰的大背景下，可為新藥研發提供重要借鑒。“老藥新用”的策略可為新藥（1.6類新藥）的研發提供捷徑。由于“老藥”已經在臨床中廣泛應用，在安全性上具有保障，可避免藥物上市后因不良反應而“退市”的情況，同時可大大降低藥物研發成本及臨床用藥價格，進而惠及大眾。

除此之外，張鵬研究團隊對于膠原誘導性關節炎模型（CIA 模型）的創新性發現完善了對該疾病模型的認識。在此項研究中，張鵬發現了先前文獻中未作報道的CIA模型發病足爪關節破壞規律以及特殊的組織病理學表現，為全面了解CIA模型發病的特點和規律提供了實驗依據。通過放射學和組織學觀察，進一步完善了對其發病特點的描述，明確了該模型距下關節以及距舟關節為最早受累足爪關節的發病特點，在組織學觀察中發現了相鄰關節軟骨的“融合”現象，并在“融合”部位發現了新生血管的侵入以及新骨的生成，進而提出了“炎癥影響關節軟骨的終末分化狀態進而啟動軟骨內骨化”的科學假設，為研究RA發病中關節軟骨在骨贅生成中的作用提供了重要的實驗支持。相關成果發表在風濕病領域國際SCI期刊《Rheumatology International》上。

篇（8）

信息論的創始人申農為解決通訊技術中的信息編碼問題，提出通訊系統的一般模型，發表了《通信的數學理論》《噪聲中的通信》兩篇論文，從而奠定了信息論的理論基礎。他指出“信息論（狹義的）的基本結果，都是針對某些非常特殊的問題的，它們未必切合像心理學、經濟學以及其他一些社會科學領域。”[1]因此，信息論分為廣義信息論和狹義信息論。狹義信息論即申農早期的研究成果為主，它以編碼理論為中心，主要研究信息系統模型、信息的度量、信息容量、編碼理論及噪聲理論等。廣義信息論又稱信息科學，主要研究以計算機處理為中心的信息處理的基本理論，包括評議、文字的處理、圖像識別、學習理論及其各種應用。維納認為“信息既不是物質，也不是能量，信息就是信息，不懂得它，就不懂得唯物主義。[2]”雖然維納并沒有給出信息的確切定義，但卻第一次將信息科學映射到哲學問題上。

此后，信息科學的發展沖擊了20世紀下半葉以來的哲學思想路線，重新開啟了對哲學形而上問題的探討。雖然從物理角度來說，信息是按照一定的方式排列組合起來的信號序列，它借助于某種介質作為通道來傳遞、加工和貯存。但是隨著現代科學技術的發展，信息科學技術建構起了全新的語言環境、精神環境，“把我們從對事物的直接領悟中順順當當地推到由邏輯間隔隔開的世界中[3]”，使“知識源保持著一種抽象的控制論意義下的距離[4]”，從而消解了現實中的語言涵義。而現代人類依靠網絡空間高速傳播的思想，將世界空間縮小，人們憑借大眾傳播媒介或個人或組織給予的信息來建構起世界的“腦海圖景”，并以此來判斷世界并給予回應。正如“洞穴”隱喻一般，真實移動的“實體”不再真實，而意識、信息構筑的世界更“實際”，真實的世界成為“符號的宇宙”。哲學家海姆認為虛擬現實表現為七大特征：模擬性、交互作用、人工性、沉浸性、遙在、全身沉浸和網絡通信。正統哲學都是基于客觀實在現實性范疇框架內的哲學，客體是意識的容器，在主體和客體之間具有明顯界限，而信息科學技術的發展，“電子化”的語言方式可快捷地掃描人的思想，意識的力量在某種程度上得以強化。由此，使我們不得不重新思考信息科學是否揭示并決定著我們對世界的認知和發問方式。

哲學本以人本意識為主，是自覺之自我的最高意識成就，它依賴于社會的發展而發展。在康德建立了系統完善的形而上學之后，尼采宣布了“上帝已死”，海德格爾對“自我”“存在”的考證也對人類自身發展做了完備的總結，維特根斯坦認為“哲學僅余下的任務是語言分析！”，似乎哲學沒落到只囿于語言這一狹小領域，但信息科學技術的發展為自我、本體等哲學概念提出了重新思考的空間。信息科學在自身運動、發展的進程中，呈現出自身歷史的反映、自身性質的規定、自身發展的種種可能性這三種自在、自為、再生的基本形態，這三種關于事物歷史、現狀、未來的間接存在凝結在一個具有特定結構和狀態的直接存在物中，這種直接存在的結構和狀態被凝結著它的間接存在所規定。也即是說，自我、本體等概念被信息科學尤指信息技術、互聯網這一間接存在所規定。方東美先生認為：“希臘人把時間的體系化成空間的體系，然后再就時間來看，表面上是有過去、現在、未來的實踐連續性，而這個過去、現在、未來，都可以化成現在的影像。換句話說，是把真實現在變成空間化的現在，這樣就便于把過去的影像納入了現在，把未來的影像也以前瞻的方式把它收到現實當中，然后以一個空間化的現在籠罩一切過去現在和未來”[5]。這樣一種“了解時間的不重要，才是智慧之門[6]”，因此，哲學關于“我”、“本體”、“存在”等概念的思考由時間、空間的三維方向轉向一維的趨向。

此外，分析哲學家卡爾納普對語義信息的關注，將申農的信息論引向人類領域，認為由于人的選擇、接受、記憶的選擇性存在，信息本身存在著解讀的很大不確定性和可能性，因此有主觀與客觀、低級與高級、自然與社會信息等之分。生物信息學認為生物信息包括遺傳信息、神經――激素信息、代謝信息和人腦信息等多方面。物理學家T.Stonier在《信息物理學》提出的“信息子”認為“有組織就必然有結構，有結構就必然有信息”。在信息N論中，信息不是具有“粒子性”的能夠構成世界的“本原”，而是具有演繹性的能夠生成世界的“生元”，信息的“生成”特性使世界本體成為一種過程本體，也就成了一個信息集合體。這些在信息論基礎上發展起來眾多交叉學科，如量子信息學、生物信息學、物理信息學等等，他們都試圖從信息主義解釋萬物緣由的本體論論調，暫且不論對錯，但其提供的視角也是一種哲學嘗試。雖然信息科學技術在某種程度上剝離了對生命的人文關懷，使其變得些許冰冷，但對一些哲學概念的分析給飄散在浩浩蕩蕩信息長流中的理論派別提供了一種更深層次、更基礎的思維范式，從而推及對人類、宇宙的認識。

（作者單位：四川省社會科學院研究生院）

參考文獻：

[1]鐘義信.信息科學原理[M].福建人民出版社，1988，26.

篇（9）

宏基因組（Metagenome）是1998年由Handelsman等人正式提出，定義為特定生物環境中全部微生物遺傳物質的總和。宏基因組學通過直接從環境樣品中提取全部微生物的遺傳物質DNA，利用第二代測序技術，得到高通量宏基因組數據，并結合微生物基因組學的研究成果，分析環境樣品所包含的全部微生物的群落組成及其結構功能。高通量宏基因組數據在基礎微生物學、水體、土壤、農業、醫學研究等領域都顯示出了重要價值[1]。

1宏基因組學研究方法

宏基因組學的研究方法主要有：環境樣本的采集、宏基因組DNA的提取，高通量測序、所得序列的比對檢索分析，以及進一步進行微生物物種結構和功能分析。其中，提取DNA要盡可能地提取出樣品中所以微生物的基因且保持基因片段的完整，目前的提取方法主要有直接裂解法和細胞提取法。隨著第二代測序技術的發展，宏基因組數據呈現出序列短小、通量巨大的特點，一方面蘊含更為豐富的環境微生物遺傳物質信息，極大拓展了微生物學研究與應用領域，另一方面也為分析處理帶來前所未有的挑戰。

2宏基因組學的應用

在短短幾年內，高通量宏基因組數據研究已滲透到各個領域，包括基礎微生物學、海洋學、土壤學、醫學等，并在醫藥、替代能源、環境修復、生物技術、農業、生物防御及倫理學等各方面顯示了重要的價值[2]。

2.1基礎微生物學研究

宏基因組為基礎微生物學研究打開了新局面，得以快速準確地探測新基因、發現新物種（如未知病原體等）以及準確認識微生物群落的物種構成及其功能結構。由于自然界中大多數微生物物種及其生物量是未知的，其中大量微生物采樣困難、培養效率低下，這極大限制了傳統微生物學的研究與發展，而高通量宏基因組數據的產生則突破了這一束縛。通過分析高通量宏基因組數據，包括序列比對、De Novo組裝、GO分析等等技術，無需經過提純培養，就能探測新基因、新物種，為微生物環境工程、疾病診斷治療奠定基礎。

2.2海洋學和土壤學研究

海洋和土壤中包含大量微生物，它們與生態環境關系密切。目前通過采用土壤、海水等環境樣品，獲取高通量宏基因組數據，探測其中微生物的組成及功能分布，能夠對導致生態環境變化的因素有更深入的認識。如利用來自海洋石油污染區的微生物高通量宏基因組數據，分析其微生物相對豐度，可以有效探測石油降解細菌及其生態關系網，為污染治理提供新思路。利用來自豆類植物附近土壤測取的宏基因組數據，分析其中固氮菌含量及其關聯因素，有助于設計提高豆類產量種植模式。高通量宏基因組數據為認識復雜的微生物群落構成及其功能提供了可能，且必將在研究生物多樣性和微生物環境工程中發揮重要作用[3]。

2.3醫學研究領域

高通量宏基因組數據在現代醫藥學中扮演著極其重要的角色，一方面通過疾病樣本的宏基因組分析，可以確定病原體或致病基因及其與其他因素之間的關聯，為疾病治療提供可能；另一方面利用宏基因組數據篩選在醫藥業中具有重要應用價值的基因及其產物，促進醫藥發展。如利用取自不同牙周炎病況病人口腔高通量宏基因組數據，分析處理得到各樣本微生物相對豐度數據，比較不同牙周炎病況下的微生物整體分布情況，揭示出牙周炎與口腔微生物群落的生物多樣性和關聯網絡之間有顯著聯系。

3結語

隨著高通量測序技術的迅猛發展，宏基因組分析已經成為探索自然環境中微生物物種和功能組成的重要手段之一，是研究微生物群落的利器。宏基因組分析手段無需經過復雜嚴苛的實驗室培養過程，直接利用第二代高通量測序技術，快速產生成千上萬的自然微生物DNA序列的短讀片。但是高通量宏基因組數據也給研究帶來挑戰。它呈現出序列短小、通量巨大的特點。此外，高通量測序技術的準確率低于傳統測序技術，亟需完善的概率統計模型和有效的算法實現[4]。

在應用前景方面，隨著組合生物合成技術和納米技術迅速發展，可以考慮將宏基因組學技術與之結合，利用納米技術人工合成由宏基因組學的方法探測所得新興基因，促進天然活性產物的開發及挖掘，進一步促進微生物工程的發展。

參考文獻：

[1]許忠能著.生物信息學[M].北京：清華大學出版社，2009.

篇（10）

其實媒體中廣為使用的“首次合成人工生命”之說,并不準確。文特爾的成功之處,在于用化學試劑合成了人工染色體,并在另一微生物中顯示出生物功能。DNA是決定生物性狀的遺傳密碼,卻不是生命的唯一組成部分。從這個意義上講,文特爾只不過創造了部分生命。這項研究成果最為直接的意義,是人造的支原體可以利用化學合成的染色體生存繁殖,并導致山羊的乳腺炎。“首次創造生命”之說言之過甚。

事實上,文特爾本人在《科學》雜志上發表的文章題目“首次合成由化學合成基因組控制的細菌”更為客觀、嚴謹。《科學》雜志的相關評論指出,這項研究成果其實并不是首次創造新的生命形式,科學的定義應該是“生命再創造”或“篡改生命”。因為“辛西婭”除了染色組是人工合成外,生命體的其他組分均是來自于已有生命形式。但是無論如何,這項耗資4000萬美元的科技成果,畢竟是人類生命科學發展的一大進步。英國《經濟學人》將此成果與上個世紀原子彈的誕生相提并論,其意圖顯然著眼于科技成果對人類的傷害以及對自然界的破壞。

合成生物學是后基因組時代生命科學研究的新興領域。早在本世紀初,它就已經成為現代生命科學的研究熱點,然而真正進入大眾視野,還是源于“世界首個人造生命”的新聞事件。

借助合成生物學的研究成果,文特爾僅僅使用四瓶化學試劑就合成了人工生命“辛西婭”,一時間給人以合成生物學便是“造物術”的感覺。科學家認為,合成生物學可以通過合成生物原件組裝生物系統,創造新的生命形式。有人就此評論,隨著合成生物學的發展,人類可以像組裝電路一樣組裝生命,從此將代替自然扮演“上帝”的角色。

“像組裝電路一樣組裝生命”,只是合成生物學研究思路的形象比喻。合成生物學是建立在基因組學、生物信息學、系統生物學等學科基礎之上的現代生物科學,在它的發展過程中借鑒了電子工程的研究思路。但是,實際上細胞內部基因的表達調控、代謝網絡如同蜘蛛網一樣繁雜精細,往往是牽一發而動全身。功能基因的表達遠不像電路板上晶體管開關那樣簡單,細胞代謝網絡的復雜程度也非電路板可比。正因如此,即便在生命科學高度發達的今天,文特爾將已經精簡的“最小基因組”移植到掏空遺傳物質的支原體體內,實驗進展也不是一帆風順。這也正是人類基因組破譯十年后,其研究成果還不能直接應用于醫療的原因。

從科學的意義上說,人工生命的誕生,標志著合成生物學已經可以簡單地改造生命,人類從讀取基因序列躍升至編碼基因的階段。但合成生物學遠沒有發展到可以任意創造生命的程度。合成生物學的進一步應用還有賴于系統生物學的長足發展。“任意創造生命”既不是目前合成生物學發展程度所能企及的,也不是發展該學科的最終意義。科學家真正關心的是如何利用改造的生命體為人類服務。

早在上世紀70年代,生物學家就可以利用“DNA重組技術”將長鏈DNA切割成有功能的基因片段,并把它在模式菌株中表達。如今,無論是原核生物還是真核生物都可以高效地表達異源蛋白,并開始產業化應用。如利用大腸桿菌生產胰島素,利用動物細胞生產疫苗抗體,利用轉基因動物充當生物乳腺反應器。本世紀初,“細胞工廠”的理念逐步深入人心。

免责声明以上文章内容均来源于本站老师原创或网友上传，不代表本站观点，与本站立场无关，仅供学习和参考。本站不是任何杂志的官方网站，直投稿件和出版请联系出版社。

上一篇: 國際經濟與貿易概念下一篇: 智慧物流的看法