본문 바로가기

Bioinformatics61

bacteria fungi 다운로드 받기 다운로드는 다음 경로를 통해서 받을 수 있다. ftp://ftp.ensemblgenomes.org/pub/current/ 가장 최근의 release에 접근할 수 있다.다음과 같이 파일 리스트를 먼저 만든다. 박테리아의 경우 파일이 많기 때문에 약간 다른 명령을 이용한다. lftp -c "open ftp.ensemblgenomes.org:/pub/current/bacteria/fasta && ls -Rl | grep dna | grep -v cdna && exit" > bacteria_fileswget -A "*.gz" -r --spider ftp://ftp.ensemblgenomes.org/pub/current/fungi/fasta/ > fungi_lists 2>&1wget -A "*.gz" -r --s.. 2015. 5. 21.
[C/C++] 전체 표준 스트림에 대해서 버퍼링 제거하기 간혹 특정 프로그램의 로그를 즉시 즉시 출력해야할 필요가 있다. 우리는 이 때 stream.flush() 라던지 fflush(stdout) 류의 명령을 사용하고는 한다. 하지만, 여러번 이런 메서드를 호출하는 것은 상당히 번거롭다. 전역적으로 모든 표준 출력을 버퍼링하지 않도록 하려면 다음과 같이 하면 된다. setbuf(stdout, NULL); 이 후에 모든 표준 출력은 버퍼링 없이 즉시 즉시 출력된다. 2015. 5. 15.
[bwt] 정리 one of intervals => suffix array indexA suffix array contains suffix array elementssuffix array[suffix array index] => a suffix array elementA suffix array element contains string id (or read id) and the positions To check if the k-mers came from the same read, we need to update the interval by using the current string 2015. 4. 11.
[bwt] suffix array 관련 정리 1. BWT and SAGiven a string S, a sorted suffix array SA,BWT[i] = S[SA[i] - 1] 2. Backward search 2-1. Rank Functionrank() sometimes is named with occurrence()rank() counts the number of an alphabet up to a certain position.In practice, we uses sampled cumulative alphabet counters.Given a pattern P, a global alphabet counter C, a low suffix array index l, a high suffix array index h,for (i = len(.. 2015. 3. 27.