본문 바로가기
Bioinformatics/Tip

[Linux] multi FASTA 파일 개별적인 파일로 추출하기

by 임은천 2015. 12. 14.

가령 multi FASTA 파일에 긴 contigs나 complete genome sequence가 있을 때, 다음과 같이 하여 개별 라인과 id 별로 파일을 생성할 수 있다.


csplit -z [입력 파일 이름] -n=[숫자 갯수] --prefix=[시작 파일 이름] '/^>/' '{*}'

또는

csplit -z [입력 파일 이름] --prefix=[시작 파일 이름] -b "_%03d.fa" '/^>/' '{*}'


댓글