본문 바로가기
Bioinformatics/Tip

[Linux] 현재 폴더 내 전체 FASTA 파일들을 두번째 줄까지 추출하되 길이 제한하기

by 임은천 2015. 7. 30.

생명정보학을 파일 형태 중에 FASTA라는 단순한 파일이 있다. 간혹 우리는 현재 폴더 내에 있는 모든 Fasta 파일에 대해서 첫 두줄만 추출하고 싶을 때가 있다. 다만, 염기 서열의 길이가 너무 긴 경우에 조금만 잘라서 추출하고자 한다.


find . -type f | xargs -i -n1 awk 'NR=1{print $0;};NR=2{print substr{$0, 1, 100}' {} > all.fa


댓글