生物科學(xué)研究測序數據呈指數級別增長(cháng),如何從大量數據中挖掘其所包含的生物學(xué)意義?通常我們從公司拿到的測序數據或者項目報告,由于序列文件或表格文件比較龐大,在windows電腦Excel打開(kāi)比較耗時(shí),甚至無(wú)法顯示完全。linux命令可以幫助大家來(lái)解決這類(lèi)的問(wèn)題,windows電腦也可以安裝“git”來(lái)進(jìn)入命令行操作界面,打開(kāi)目錄和查看文件。
在實(shí)際運用過(guò)程中,我們通常根據需要,通過(guò)管道符“|”同時(shí)使用好幾種生物信息學(xué)Linux命令,避免花費大量時(shí)間找軟件、寫(xiě)代碼,有些情況下可以代替Excel等辦公軟件。如下就是一些linux命令的高級使用實(shí)例。如下是一個(gè)宏基因組的NR注釋結果示例文件:




文件和目錄管理
1.1管理目錄
語(yǔ)法:cd <dirname>
實(shí)例:cd /path/dirname #切換到指定的/path/dirname目錄
cd ~ #切換到家目錄
cd ../ #切換到上一層目錄
cd / #切換到根目錄
命令說(shuō)明:ls和ll都可以列出目錄下的文件、子目錄。ls只列出文件名或目錄名。而ll是ls -l的別名,會(huì )列出該目錄下的文件或目錄的詳細信息。
語(yǔ)法:ls [-alrtAFR] <dirname/filename>
常用參數:-l 除文件名外,列出文件類(lèi)型、權限、所有者、大小等詳細信息。
-h 文件大小的單位由字節Byte,變換為“K”、“M”、“G”、“T”(需要與-l同時(shí)使用)。
-a 顯示“.”開(kāi)頭的隱藏文件。
-t 文件按照時(shí)間順序,越新的越前面。
命令說(shuō)明:創(chuàng )建文件夾(目錄)。
語(yǔ)法:mkdir [-p] <dirname>
常用參數:-p 如果需要創(chuàng )建目錄的父目錄(上層目錄)不存在,就一并創(chuàng )建父目錄。
實(shí)例:mkdir -p /new_dirname/test_dir #創(chuàng )建目錄/new_dirname/test_dir(當new_dirname不存在的時(shí)候,一并創(chuàng )建)。
命令說(shuō)明:顯示當前工作目錄的絕對路徑。含有“.”、“..”和“~”等的路徑為相對路徑,只由目錄名稱(chēng)和“/”組成的為絕對路徑。
語(yǔ)法:pwd
1.2處理文件
創(chuàng )建文件
1.?touch
2.?vi
文件的復制、移動(dòng)、鏈接、刪除
1.?cp
命令說(shuō)明:復制文件或目錄,相當于Windows系統下的copy。
語(yǔ)法:cp?<source?dirname/filename>?<target?dirname/filename>?[-r]
常用參數:-r?將源目錄及其子目錄下的所有文件,復制到目標目錄下(復制目錄的時(shí)候,必須使用)。
實(shí)例:cp?file_a?dir_name?#將文件file_a拷貝到目錄dir_name下。
cp?file_a?file?_b?#將文件file_a復制并重新命名為file_b。
cp?-r?dir_a?dir_b?#將目錄dir_a及其子目錄下的所有文件,拷貝到目錄dir_b下。
2.?mv
命令說(shuō)明:用于將文件移動(dòng)到目標目錄下;重命名文件或目錄;移動(dòng)目錄到目標目錄下。
語(yǔ)法:mv?<source?diename/filename>?<target?dirname/filename>
實(shí)例:mv?file_a?file_b?#將目錄file_a重命名為file_b。
mv?dir_a?dir_b?#如果目錄dir_b不存在,則將dir_a重命名為dir_b;如果目錄dir_b存在,則將dir_a移動(dòng)到dir_b下。
mv?file1?file2?dirname1?test_dirname?#將文件file1和file2、目錄dirname1,移動(dòng)到test_dirname下。
3.?ln
4.?rm
文件內容查看
1.?cat
命令說(shuō)明:將文件內容顯示到標準輸出(或使用管道命令“|”傳遞作為下一個(gè)命令的標準輸入,或使用“>”重定向到其他文件)。
語(yǔ)法:cat?[-n]?<file1?file2?…>?[>?new_file]
常用參數:-n?在每行內容之前,加上行號顯示。
實(shí)例:cat?-n?file?#將file的內容加行號,顯示在屏幕上。
cat?file1?file2?>?new_file?#將file1和file2的內容,重定向到new_file中。(file1的內容在前,file2的內容在后。)
cat?file1?file2?>>?new_file?#將file1和file2的內容,依次追加到new_file后。
cat?file?|?wc?-l?#使用cat查看file內容,再傳遞到wc?-l計算文件的行數。
2.?less
命令說(shuō)明:查看文件的內容。
語(yǔ)法:less?[-SN]?<file>
常用參數:-S?當每行長(cháng)度長(cháng)于屏幕寬度的時(shí)候,默認顯示在下一行,使用-S則不顯示在下一行。
-N?顯示行號。
實(shí)例:less?-SN?#使用less打開(kāi)文件后,可以使用“Page?Up”向上翻頁(yè),使用“Page?Down”向下翻頁(yè),使用“/pattern”向下匹配。
3.?head
命令說(shuō)明:顯示文件開(kāi)頭部分的內容。
語(yǔ)法:head?[-n]?<file>
常用參數:-n?<number>?顯示文件前number行的內容(默認顯示前10行)。
實(shí)例:head?-n?20?file?#顯示文件前20行的內容。
4.?tail
命令說(shuō)明:顯示文件末尾部分的內容。
語(yǔ)法:tail?[-n]?<file>
常用參數:-n?<number>?顯示文件末尾number行的內容(默認顯示末尾10行)。
實(shí)例:tail?-n?20?file?#顯示文件末尾20行的內容。
5.?cut
命令說(shuō)明:顯示文件的每一行指定范圍內的字符。
語(yǔ)法:cut?[-cdf]?<file>
常用參數:-c?以字符為單位進(jìn)行分割。-c?num1-num2意為顯示文件的每一行的第num1到num2的字符。
-d?自定義域分割符,默認tab鍵“\t”。
-f?num1-num2?顯示域分割符分割后,每行第num1到num2的域。
實(shí)例:cut?-c?1-5?file?#顯示文件的每一行的前5個(gè)字符。
cut?-d?“?”?-f?1-5?file?#顯示以空格分割后的,文件的前5列。
文件壓縮
1.?gzip
命令說(shuō)明:壓縮文件或目錄,生成以“.gz”結尾的壓縮文件。
語(yǔ)法:gzip [-r][-1…9] <filename/dirname>
常用參數:-r 對目錄下的文件進(jìn)行壓縮,但目錄本身不壓縮。
-1…9 數值越大,壓縮效率越高(默認6),壓縮速度越慢,生成的壓縮文件越小。
實(shí)例:gzip file1 #對源文件file1進(jìn)行壓縮,生成file1.gz,并刪除源文件file1。
解壓命令:使用gunzip或gzip -d,例如gunzip file1.gz。
2.?zip
命令說(shuō)明:壓縮文件或目錄,生成“.zip”結尾的壓縮文件。
語(yǔ)法:zip [-r][-1…9] <filename/dirname>
常用參數:-r 對目錄下的所有子目錄、文件一起壓縮。
-1…9 數值越大,壓縮效率越高(默認6),壓縮速度越慢,生成的壓縮文件越小。
實(shí)例:zip -r new.zip dirname1 #將目錄dirname1壓縮到new.zip壓縮文件內。
解壓命令:unzip,例如unzip new.zip。
3. tar
命令說(shuō)明:Linux下最常用的打包程序,生成的包通常稱(chēng)為tar包(以“.tar”結尾)??梢栽趖ar包的基礎上,使用壓縮命令,進(jìn)一步壓縮處理。
語(yǔ)法:tar [-cxzvf] <tar_file>
常用參數:-f 指定tar文件,后面需要立即接tar文件名,不能再接參數。
-c 創(chuàng )建一個(gè)tar文件。
-x 從tar文件中,獲取源目錄和源文件,相當于打開(kāi)tar包。
-z 和-c同用,調用gzip來(lái)壓縮tar文件;和-x同用,調用gunzip來(lái)解壓縮tar文件。
-v 顯示命令執行的過(guò)程。
實(shí)例:tar -cf test.tar file1 dir1 #將文件file1、目錄dir1打包到test.tar中。
tar -xf test.tar #提取test.tar中的文件。
tar -czvf test.tar file1 dir1 #將文件file1、目錄dir1打包并壓縮為test.tar.gz,顯示詳細過(guò)程。
tar -xzvf test.tar file1 dir1 #將test.tar.gz解壓縮,提取其中文件。

鑒于篇幅較長(cháng),未完全展示,我們已將全文打包, 掃碼即可下載全文文檔