綜合新聞
陳立宏博士等在《Nucleic Acids Research》雜志在線發(fā)表最新一版“病原菌致病因子數(shù)據(jù)庫”
病原菌致病因子數(shù)據(jù)庫(簡稱VFDB,http://www.mgc.ac.cn/VFs/)由我所陳立宏博士和楊劍研究員等于2004年建立(Chen L et al, Nucleic Acids Res. 2005)并長期維護,經(jīng)過十多年的不斷升級和更新已經(jīng)逐步發(fā)展成為國際上最大的病原細菌毒力因子資源中心,被國內(nèi)外同行廣泛使用。
近年來新一代測序技術(shù)帶來的生物大數(shù)據(jù)對病原菌毒力因子相關(guān)的數(shù)據(jù)分析提出了新的挑戰(zhàn)。為了滿足日益增長的大數(shù)據(jù)分析需求,陳立宏博士等進一步對VFDB的基礎(chǔ)數(shù)據(jù)進行了整合與優(yōu)化,一方面改進了底層的數(shù)據(jù)結(jié)構(gòu),去除了冗余數(shù)據(jù),整理生成由已知毒力因子構(gòu)成的核心數(shù)據(jù)集和包括所有潛在毒力因子的完整數(shù)據(jù)集。另一方面對核心數(shù)據(jù)集中的所有毒力相關(guān)基因的注釋信息進行了審核與精煉,提高了VFDB數(shù)據(jù)庫的數(shù)據(jù)質(zhì)量。此外,還在VFDB數(shù)據(jù)庫中新增加了不動桿菌、氣單胞菌、無形體、伯克氏菌、柯克斯氏體、立克次氏體等六個屬的信息和數(shù)據(jù),并引入了一個全新的基于JavaScript的圖形化用戶界面。
該研究工作不僅進一步優(yōu)化和完善了VFDB數(shù)據(jù)庫,為其后續(xù)的發(fā)展奠定了基礎(chǔ);而且產(chǎn)生出了適用于大數(shù)據(jù)快速分析的高質(zhì)量非冗余毒力因子數(shù)據(jù)集,為VFDB數(shù)據(jù)庫在大數(shù)據(jù)時代的廣泛應用鋪平了道路。該研究論文已收編在生物信息學領(lǐng)域國際著名期刊《Nucleic Acids Research》2016年數(shù)據(jù)庫???,并于近期在線發(fā)表。