CircSplice軟件可變剪切實(shí)現原理
(1) 通過(guò)STAR比對至參考基因組序列,得到chimeric reads;
(2) 保留那些比對上同一染色體和鏈的chimeric reads,通過(guò)CIGAR值判斷reads的坐標;
(3) 識別BSJ,去除另一端落在供體和受體位點(diǎn)之外的reads,以確保另一端也來(lái)自circRNA;
(4) 通過(guò)剪切位點(diǎn)GT-AG或者CT-AC對BSJ進(jìn)行過(guò)濾和識別;
(5) 對BSJ進(jìn)行基因注釋?zhuān)?/p>
(6) 將BSJ和其另一端reads比對到基因的外顯子或內含子,結合基因注釋進(jìn)行4種剪切類(lèi)型的判斷。允許2bp容錯。另外要求代表剪切的read的junction一端坐標與注釋外顯子的一端坐標一致,以減少假陽(yáng)性預測;
(7) 通過(guò)GT-AG或CT-AC原則對可變剪切事件進(jìn)行過(guò)濾;
(8) 計算可變剪接事件的reads數,并進(jìn)行標準化(支持可變剪切的reads數*106/總chimeric reads數);
(9) 根據坐標融合不同樣本的剪切事件,比較樣本間的環(huán)狀RNA剪切事件;允許2bp容錯;