본문 바로가기

Bioinformatics61

Unbuntu Unity 재설정 우분투 사용 중에 런처가 사라지거나 메뉴에서 Unity 3D 옵션이 사라지는 경우가 있다. 그 경우 사용하는 명령이다. sudo apt-get clean sudo apt-get install --reinstall ubuntu-desktop 이제 재부팅을 하면 초기 데스크탑 환경으로 돌아온다. 2013. 4. 13.
SAM 파일 구조 SAM 파일은 염기 서열 파일들의 각 read에 대해서 필터링(filtering), 쳐내기(trimming), 묶기(grouping) 한 후에 참조 서열에 대해 해당 파일을 정렬(alignment)한 후에 생성되는 내용을 담은 파일이다. SAM 파일의 가장 윗 부분에는 헤더가 있다. 대략 다음과 같이 생겼다. @HDVN:1.3SO:coordinate@SQSN:refLN:45@SQSN:ref2LN:40 여기에서 HD(header)는 헤더, VN(version number)은 버전 번호, SO는 정렬 순서(sorting order), SN(sequence name)은 서열 이름, LN(length)은 길이를 나타낸다. 여기에서는 좌표를 기준으로 정렬이 되었고, 서열의 이름은 ref와 ref2로 각각 45, .. 2013. 4. 3.
프레드 품질 점수(Phred quality score) 본 내용은 http://www.somewhereville.com/?tag=phred-quality-score의 데이터를 보인다. 프레드 품질 점수는 에러가 발생할 확률을 계산하기 위해서 사용된다. FASTAQ나 QSEQ 파일 등을 살펴 보면 아스키 표현 형태로 되어 있고, 이 값은 각각 사용된 퀄리티 값에 따라서 각각의 염기가 에러일 확률로 나타난다. 프레드 품질 점수(Q), 오류 염기 확률, 생어, 일루미나 1.3+ 아스키 형태 프레드 Q 오류 염기 확률 생어 (Q+33) 값 생어 아스키 일루미나 1.3+ (Q+64) 값 일루미나 1.3+ 아스키 001.0000000000033!064@010.7943282347034“065A020.6309573445035#066B030.5011872336036$067C.. 2013. 4. 3.
[간략]은닉 마르코프 모델(Hidden Markov Model)과 비터비(Viterbi) 알고리즘의 생물학 이용 최근에 여러 가지 자료 구조와 알고리즘을 보다가 은닉 마르코프 모델과 비터비 알고리즘을 보게 되었다. 이런 알고리즘을 왜 사용하는 걸까? 라는 고민에 이것 저것 찾아 보다가 정리를 할 수 있게 되어 간략하게 적게 되었다. 가령 생물 정보학에서 자주 다루게 되는 DNA 염기서열이 다음과 생성(output)이 되었다고 하자. s = "ATCGATCGTTTCATTAGTATTCATGCT" 이 서열에는 총 4가지 문자가 사용되었다. 그렇다면, 이런 서열을 생성하는 동안 각 순간에 염기 변이 확률 같은 것이 있지 않을까? 확률로써 염기의 전이들을 표현하고 싶다면, 그에 합당한 모델이 있어야 한다. 이 때 우리는 은닉 마르코프 모델(HMM)을 사용할 수 있다. 예를 들어, 우리는 다음과 같이 은닉 마르코프 모델을 정.. 2013. 4. 3.