본문 바로가기

Bioinformatics/Algorithms34

[simulation]fast sequential markov coalescent simulation of genomic data under complex evolutionary models 나중에 참고할 때가 있을 지도.. https://github.com/biopython/biopython_docker/blob/master/templates/Biopython-Basichttp://cmpg.unibe.ch/software/fastsimcoal2/ 2015. 7. 22.
[bwt] 정리 one of intervals => suffix array indexA suffix array contains suffix array elementssuffix array[suffix array index] => a suffix array elementA suffix array element contains string id (or read id) and the positions To check if the k-mers came from the same read, we need to update the interval by using the current string 2015. 4. 11.
[bwt] suffix array 관련 정리 1. BWT and SAGiven a string S, a sorted suffix array SA,BWT[i] = S[SA[i] - 1] 2. Backward search 2-1. Rank Functionrank() sometimes is named with occurrence()rank() counts the number of an alphabet up to a certain position.In practice, we uses sampled cumulative alphabet counters.Given a pattern P, a global alphabet counter C, a low suffix array index l, a high suffix array index h,for (i = len(.. 2015. 3. 27.
BWT의 복원성 본 내용은 http://www.homolog.us/Tutorials/index.php?p=2.8&s=6을 번역한 것이다. BWT의 복원성 우리는 BWT가 복원 가능함을 언급했었다. 우리는 어떻게 다음 서열로 부터 'homolg.us$'를 복원할 것인가? 우리는 위의 서열이 BWT를 생성하기 위해서 행렬의 마지막 열에서부터 생성된 서열임을 알아야 한다. 그러나 우리는 또한 다른 열인 첫번째 열을 안다. 첫번째 열은 사전순으로 정렬된 마지막 열에 있는 모든 문자들을 가지고 있다. 이 밖에 우리는 어떤 것을 알고 있나? 우리는, 원래 서열에서, 첫번째 열에 있던 문자들이 마지막 열의 다음에 나오는 문자들임을 알고 있다. 그러므로, 우리는 원래의 서열에서 '$'는 's' 다음에 나오고, '.'은 'g' 다음에 .. 2014. 9. 17.