본문 바로가기

Bioinformatics/Technology23

[Linux]wget 여러 파일 다운로드 간혹 wget으로 여러 파일을 받으려고할 때가 있다. 그럴 때 wget을 이용해서 다음과 같이 파일을 다운로드 받을 수 있다. wget -nd http://xxx.com/경로/파일명{반복 리스트}.확장자 가령, 예를 들어서 인간 참조 지놈의 모든 염색체 서열을 NCBI로 부터 다운로드 받는다고 하자. 그럴 때 다음과 같이 할 수 있다. wget -nd ftp://ftp.ncbi.nlm.nih.gov/genomes/H_sapiens/Assembled_chromosomes/seq/hs_alt_HuRef_chr{ 1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,X,Y }.fa.gz wget ftp://ftp.ncbi.nlm.nih.gov/genomes/H_.. 2013. 5. 8.
Unbuntu Unity 재설정 우분투 사용 중에 런처가 사라지거나 메뉴에서 Unity 3D 옵션이 사라지는 경우가 있다. 그 경우 사용하는 명령이다. sudo apt-get clean sudo apt-get install --reinstall ubuntu-desktop 이제 재부팅을 하면 초기 데스크탑 환경으로 돌아온다. 2013. 4. 13.
SAM 파일 구조 SAM 파일은 염기 서열 파일들의 각 read에 대해서 필터링(filtering), 쳐내기(trimming), 묶기(grouping) 한 후에 참조 서열에 대해 해당 파일을 정렬(alignment)한 후에 생성되는 내용을 담은 파일이다. SAM 파일의 가장 윗 부분에는 헤더가 있다. 대략 다음과 같이 생겼다. @HDVN:1.3SO:coordinate@SQSN:refLN:45@SQSN:ref2LN:40 여기에서 HD(header)는 헤더, VN(version number)은 버전 번호, SO는 정렬 순서(sorting order), SN(sequence name)은 서열 이름, LN(length)은 길이를 나타낸다. 여기에서는 좌표를 기준으로 정렬이 되었고, 서열의 이름은 ref와 ref2로 각각 45, .. 2013. 4. 3.
프레드 품질 점수(Phred quality score) 본 내용은 http://www.somewhereville.com/?tag=phred-quality-score의 데이터를 보인다. 프레드 품질 점수는 에러가 발생할 확률을 계산하기 위해서 사용된다. FASTAQ나 QSEQ 파일 등을 살펴 보면 아스키 표현 형태로 되어 있고, 이 값은 각각 사용된 퀄리티 값에 따라서 각각의 염기가 에러일 확률로 나타난다. 프레드 품질 점수(Q), 오류 염기 확률, 생어, 일루미나 1.3+ 아스키 형태 프레드 Q 오류 염기 확률 생어 (Q+33) 값 생어 아스키 일루미나 1.3+ (Q+64) 값 일루미나 1.3+ 아스키 001.0000000000033!064@010.7943282347034“065A020.6309573445035#066B030.5011872336036$067C.. 2013. 4. 3.