還在為不知如何上傳GEO數據庫而發(fā)愁嗎?還在為不愿意看繁瑣的英文幫助而不知所措嗎?一篇帖子教你如何上傳GEO數據庫,建議收藏,再也不用愁“書(shū)到用時(shí)方恨少”了。
一、創(chuàng )建賬號
如果要上傳GEO數據庫,首先要創(chuàng )建NCBI帳號, 網(wǎng)址:
https://www.ncbi.nlm.nih.gov/geo/submitter/
登錄成功后,回到GEO的主頁(yè),點(diǎn)擊 ?Submission Guidelines

二、數據準備
GEO數據庫支持上傳芯片數據、高通量數據以及RT-PCR數據等,首先選擇需要上傳數據的類(lèi)型,接下來(lái)以high-throughput sequence submisssions (高通量測序)為例進(jìn)行詳解。
點(diǎn)擊進(jìn)去如下圖:
可以看見(jiàn)我們上傳數據需要準備三個(gè)文件,分別為:Metadata spreadsheet、Processed data files、Raw data files。下面分別介紹每個(gè)文件如何填寫(xiě)以及準備。
?? ? ?? 點(diǎn)擊下方鏈接下載該表格
該表格一共包括7個(gè)部分,以下將分別介紹如何填寫(xiě):






???? 基因表達量文件 ,如果沒(méi)有預測的新基因,文件只需要提供gene ID 和表達量如下:
如果表達量文件包含新預測的基因,還需要補充新基因(已知基因可選填)的Chromosome(染色體號)、Strand(正負鏈信息)、start(起始位置)、end(終止位置)、length(長(cháng)度)。

這里需要準備clean 數據的fq文件,通常情況下fq文件很大,因此GEO數據庫要求fq文件必須壓縮。
三、數據上傳
到這里準備工作就全部做完了,下面開(kāi)始上傳數據
上傳數據有以上兩種途徑,小編比較推薦第一種,利用FileZilla軟件,下載地址點(diǎn)擊圖片的鏈接,打開(kāi)FileZilla軟件,開(kāi)始上傳數據,主機(H) 框填寫(xiě)上圖中host對應的內容ftp-private.ncbi.nlm.nih.gov,用戶(hù)名(U)填寫(xiě)geo,密碼填寫(xiě) 33%9uyj_fCh?M16H,端口號可不填,全部填好后,點(diǎn)擊快速連接按鈕
連接成功后,在遠程站點(diǎn)下的文件名展示中創(chuàng )建自己的文件,在fasp目錄下面創(chuàng )建自己的目錄(當然也可以與fasp目錄同級下創(chuàng )建),例如ABC,創(chuàng )建方法為點(diǎn)擊鼠標右鍵,會(huì )出現下圖中的創(chuàng )建空文件夾對話(huà)框,輸入自己文件夾的命名,之后點(diǎn)擊確認,這樣你的文件夾就創(chuàng )建成功了。
最后在本地站點(diǎn)中找到您要上傳的文件,雙擊就可以將文件上傳到您在GEO創(chuàng )建的路徑下了,數據上傳一般會(huì )比較慢。數據全部上傳后,需要給GEO發(fā)郵件,點(diǎn)擊下方的鏈接。
郵件內容可以參考下方:
We had finished the raw data uploading .Please check according to the following? information :
GEO account username:? GEO帳號
Names of the directory and files deposited: ABC(存放數據的路徑)
Public release date :數據釋放日期
Our raw files were named as follows:
XXX.fq.gz
Our Processed data files were named as follows:
XXX.txt
and Metadata spreadsheet were named as follows: Metadata_spreadsheet.xlsThank you again for your time!