본문 바로가기

Biology/Questions3

Sequence similarity cannot reveal all functional identity? 출처: proteinstructures.com Since large variations in the sequence may result in the same structure, we say that the structure has a higher degree of conservation than the sequence. This is reflected in the fact that the determination of the protein 3D structure may often help revealing its function. An interesting example was provided by the anaerobic cobaltochelatase, an enzyme active in vitamin.. 2015. 2. 3.
다음 motif들의 entropy를 구하라. 다음은 stepic에 있는 예제 문제이다. Motifs T C G G G G g T T T t t c C G G t G A c T T a C a C G G G G A T T T t C T t G G G G A c T T t t a a G G G G A c T T C C T t G G G G A c T T C C T C G G G G A T T c a t T C G G G G A T T c C t T a G G G G A a c T a C T C G G G t A T a a C C Score 3 + 4 + 0 + 0 + 1 + 1 + 1 + 5 + 2 + 3 + 6 + 4 = 30 Count A: 2 2 0 0 0 0 9 1 1 1 3 0 C: 1 6 0 0 0 0 0 4 1 2 4 6 G: 0 0 10 .. 2013. 11. 21.
What is the expected number of occurrences of a k-mer in N sequences, each of length M? 각 길이가 N인 M개의 서열에서 k-mer의 개수를 구하라. K-mer에서 ACGT가 선택되는 확률이 .25로 동일하다고 가정하면 다음과 같이 풀수 있다.전체 길이는 N에서 (k의 길이 - 1)만큼 뺀 값에 M을 곱하면 검색되는 공간이 나온다. 그 후에 총 가능한 k-mer의 조합을 계산하면 되는데, 4^k 의 조합이 생기게 된다. 물론 이느 확률이 같으므로 단순히 ACTG 4가지를 단순히 k번 곱한 형태가 되는데, 확률이 있다면, A, C, G, T 개별 확률이 곱해진 것을 k번씩 곱하면 되겠다. 예), 1000의 길이를 가진, 500개 서열에서 9-mer의 예상되는 개수를 구하라.(1000 - (9 - 1))*500 이 검색 공간262144개의 9-mer 조합검색 공간을 9-mer 조합으로 나누면, .. 2013. 11. 20.