What is the expected number of occurrences of a k-mer in N sequences, each of length M?
각 길이가 N인 M개의 서열에서 k-mer의 개수를 구하라. K-mer에서 ACGT가 선택되는 확률이 .25로 동일하다고 가정하면 다음과 같이 풀수 있다.전체 길이는 N에서 (k의 길이 - 1)만큼 뺀 값에 M을 곱하면 검색되는 공간이 나온다. 그 후에 총 가능한 k-mer의 조합을 계산하면 되는데, 4^k 의 조합이 생기게 된다. 물론 이느 확률이 같으므로 단순히 ACTG 4가지를 단순히 k번 곱한 형태가 되는데, 확률이 있다면, A, C, G, T 개별 확률이 곱해진 것을 k번씩 곱하면 되겠다. 예), 1000의 길이를 가진, 500개 서열에서 9-mer의 예상되는 개수를 구하라.(1000 - (9 - 1))*500 이 검색 공간262144개의 9-mer 조합검색 공간을 9-mer 조합으로 나누면, ..
2013. 11. 20.
서로소(Pairwise Disjoint Set) 와 파티션(Partition)
서로소(pairwise disjoint set)은 두 집합이 공유하는 요소가 없는 집합의 모음이다 (예를 들어, 그들의 교집합이 공집합인 경우). 가령, 다음의 집합의 모음들은 서로소들이다:{ }, {1, 2, 5}, {3, 6}, {4, 9} 여기에 서로소가 아닌 집합 모음이 있다:{2, 6, 7}, {6, 7, 9}, {3} 이 집합들은 서로소가 아닌데, 첫째와 둘째 집합의 교집합이 공집합이 아니기 때문이다({6, 7}). (원문이 조금 이상해서 수정함) 서로소의 합집합이 원래 집합이되는 부분집합들의 집합을 파티션이라고 부른다. 예를 들어, 다음은 집합 {1, 2, 3, 4, 5}의 파티션이다:{{1, 2}, {3}, {4, 5}} A pairwise disjoint collection (set) o..
2013. 11. 12.