본문 바로가기

Wisdoms131

What is the expected number of occurrences of a k-mer in N sequences, each of length M? 각 길이가 N인 M개의 서열에서 k-mer의 개수를 구하라. K-mer에서 ACGT가 선택되는 확률이 .25로 동일하다고 가정하면 다음과 같이 풀수 있다.전체 길이는 N에서 (k의 길이 - 1)만큼 뺀 값에 M을 곱하면 검색되는 공간이 나온다. 그 후에 총 가능한 k-mer의 조합을 계산하면 되는데, 4^k 의 조합이 생기게 된다. 물론 이느 확률이 같으므로 단순히 ACTG 4가지를 단순히 k번 곱한 형태가 되는데, 확률이 있다면, A, C, G, T 개별 확률이 곱해진 것을 k번씩 곱하면 되겠다. 예), 1000의 길이를 가진, 500개 서열에서 9-mer의 예상되는 개수를 구하라.(1000 - (9 - 1))*500 이 검색 공간262144개의 9-mer 조합검색 공간을 9-mer 조합으로 나누면, .. 2013. 11. 20.
[Linux] 하위 폴더에서 파일명 한꺼번에 변경하기 파일명을 한꺼번에 변경하려면 다음과 같이 실행한다. find . -type f | grep -E "filename.txt" | xargs rename 's/filename\.txt$/changedname\.txt/' 이렇게 하면, 현재 경로 하위에 있는 모든 파일 중에 파일명이 "filename.txt"인 파일이 changedname.txt로 변경된다. 2013. 11. 15.
Eclipse CDT 선언문 명령줄에서 추가하기(공백 포함) 컴파일러 명령줄에서 선언문을 추가할 때 우리는 D 옵션을 이용한다. 다만, 문자열을 추가할 때, 공백이 있으면 문제가 된다. Eclipse CDT에서 동일한 일을 하려면, Project 이름에서 Properties -> C/C++ Build -> Settings -> Cross GCC Compiler -> Symbols또는 G++ Compiler -> Preprocessor로 가서 -D라고 되어 있는 곳에 다음과 같이 추가한다. 선언명='"내용"' 작은 따옴표로 큰 따옴표로 내용을 묶어서 shell에서 정상적으로 evaluation 되도록 하였다. 2013. 11. 12.
서로소(Pairwise Disjoint Set) 와 파티션(Partition) 서로소(pairwise disjoint set)은 두 집합이 공유하는 요소가 없는 집합의 모음이다 (예를 들어, 그들의 교집합이 공집합인 경우). 가령, 다음의 집합의 모음들은 서로소들이다:{ }, {1, 2, 5}, {3, 6}, {4, 9} 여기에 서로소가 아닌 집합 모음이 있다:{2, 6, 7}, {6, 7, 9}, {3} 이 집합들은 서로소가 아닌데, 첫째와 둘째 집합의 교집합이 공집합이 아니기 때문이다({6, 7}). (원문이 조금 이상해서 수정함) 서로소의 합집합이 원래 집합이되는 부분집합들의 집합을 파티션이라고 부른다. 예를 들어, 다음은 집합 {1, 2, 3, 4, 5}의 파티션이다:{{1, 2}, {3}, {4, 5}} A pairwise disjoint collection (set) o.. 2013. 11. 12.