1樓:匿名使用者
np_001044802.1是登入號;115441045是叫gi號。從你自己例子裡體現了兩者的乙個基本差別:
gi號完全是數字,登入號是字母與數字的組合,通常字母代表一定的含義。關於gi與登入號的區別可以參考下面給出的鏈結。
這裡主要討論一下登入號的樣式:
1)使用者遞交序列號,這些登入號通常不含下劃線。
首先我們討論一下locus name,它不是登入號,但在ncbi的發展中佔據一定的地位。在ncbi的genbank記錄中,locus關鍵字下包括許多資訊,其中之一就是locus name。位點名稱設計之初是用來幫助研究人員歸併相似序列。
名稱命名規則是[a-z][0-9]。首字母通常為物種名的首字母。locus概念最適合基因突變資料的收集,所以突變資料的最初都是按照locus概念設計的。
隨著genbank資料的擴大,6個資料明顯不能適應資料的增長,於是增加到8位,也就是登入號,其編碼規則[a-z][a-z][0-9]。前兩個字母是物種拉丁名首字母(不是很確定),後面是6個序號。因此登入號也就代替了locus名稱。
2)refseq序列
由於genbank開端口之初,並不控制序列質量,所以會有許多的冗餘。因此ncbi就通過利用計算機演算法把一致的序列歸併在一起,這些人工生成的序列都是用類似np_***xx的格式編碼,嚴格的編碼規則是[anxyz][cpgmprtwzs]_([a-z])?[0-9]。
下面的登入號樣例就是用這個正規表示式提取的,供參考。
最後補充一點的是序列後的「點數字」代表不同的版本,詳參參考鏈結。
ncbi database nr 什麼意思
2樓:
nr是以下這些數
據庫的並集:
all non-redundant genbank cds translations+pdb+swissprot+pir+prf excluding environmental samples from wgs projects
怎麼在ncbi中查詢關於代謝症候群的基因表達譜
佳學基因,人類基因資訊解讀和應用專家。有各種代謝症候群基因解碼基因檢測,檢測是在基因解碼研究中心進行的。請略解釋下數字表達譜 dge 相比於基因表達譜晶元的區別?優勢?最大的區別是 晶元上的探針都是固定已知的。只是用不同樣本的rna雜交然後比較差異的表達譜,晶元跟測序是兩個概念,原理就是雜交。dge...
生物學中mmhg是什麼意思,營養學中gl什麼意思
即公釐水銀柱的縮寫,又稱為公釐汞柱,簡稱公釐 mm 是直接用水銀柱高度的公釐數表示壓強 壓力值的單位,公釐與毫巴間可以進行換算。其原理是以汞柱所產生的靜壓力來平衡大氣壓力p,因而汞柱的高度就可以度量大氣壓力的大小 公釐汞柱。測量壓強的一種常用單位。乙個大氣壓是76mmhg 營養學中gl什麼意思 gl...
690g l 分別代表什麼意思?
這個代表的是690克每公尺,也就是他的乙個計量單位。這個主要就是代表他每毫公升或者是每公升裡面含有多少克的含量而已,非常容易進行理解的。這位朋友你好,首先這個呢這是乙個單位內有體現售690克。這個呢當然是乙個單位之內售出的乙個重量。對於這組數字意思就是表示乙個飲料或者是一瓶液體,它的質量容積是690...