ผลต่างระหว่างรุ่นของ "วัชรพัฐ เมตตานันท"

จาก Theory Wiki
ไปยังการนำทาง ไปยังการค้นหา
แถว 70: แถว 70:
  
 
====บันทึกเพิ่มเติม====
 
====บันทึกเพิ่มเติม====
 +
 +
*heuristic จาก paper ข้างต้นให้ approx-factor เป็น O(n)

รุ่นแก้ไขเมื่อ 13:38, 13 พฤศจิกายน 2550

My Profile

Top.jpg


Name: Top Vacharapat Mettanant

E-Mail Address: kidkus28@hotmail.com

Research Lab: Theory Research Group

Web Site: http://kidkus28.multiply.com

Research Interests: Algorithms on Computational Biology, Algorithms on Strings, Approximation Algorithms

More Interests: Classical Music, Novels, Physics


Research Topic

Recently focused

  • Maximum Asymmetric Traveling Salesman Problem
  • Shortest Superstring Problem
  • Algorithms for Genome Reconstruction
  • Approximation Algorithms for Tree Alignment

Currently focused

  • Algorithms for Haplotype Inference Problems
  • Inferring gene orders from gene maps using the breakpoint distance


Notes

Haplotype Inference Problem

Description

A haplotype is a DNA sequence that has been inherited from one parent. Each person possesses two haplotypes for most regions of the genome. The most common type of variation among haplotypes possessed by individuals in a population is the single nucleotide polymorphism (SNP), which can be represented by the vector pattern. Nowadays, one of the current priorities in human genomics is the development of a full Haplotype Map of the human genome, to be used in large-scale screens of populations. In this endeavor, a key problem is to infer haplotype pairs or haplotype frequencies from genotype data, since collecting haplotype data is generally more difficult than collecting genotype data. This is called the Haplotype Inference (HI) problem.

In order to have a hope of finding the haplotypes that actually generated the observed genotypes, we must use some genetic model of the evolution of the underlying haplotypes. There are two major approaches for solving the problem: combinatorial methods and statistical methods. Combinatorial methods often state an explicit objective function that one tries to optimize in order to obtain a solution to the inference problem. Statistical methods are usually based on an explicit model of haplotype evolution; the inference problem is then cast as a maximum-likelihood or a Bayesian inference problem.

Major sources of information

Best introduction to the topic

  • Haplotype Inference D. Gusfield and S.H. Orzack, In CRC Handbook on Bioinformatics, 2005 (S. Aluru Editor)

Inferring gene orders from gene maps using the breakpoint distance

เกี่ยวกับปัญหา

จาก paper

  • G. Blin, E. Blais, P. Guillon, M. Blanchette and N. El-Mabrouk. Inferring Gene Orders from Gene Maps using the Breakpoint Distance. Fourth RECOMB Comparative Genomics Satellite Workshop. LNCS/LNBI 4205, pp. 99-112, 2006. (pdf)

โมเดลปัญหา Given: partial order 'P' (เป็น DAG) และ total order 'O' (เป็น sequence) บนเซตของ genes {1,2,...,n} (โดยปรกติจะให้ O เป็น 123...n ไปเลย) Find: Order O' (เป็น sequence) ที่ไม่ขัดแย้งกับ P และใกล้เคียงกับ O มากที่สุด นั่นคือ มี breakpoint น้อยที่สุด

ผลจาก paper ข้างต้น

  • ปัญหา MBL (Mimimum-Breakpoint Linearization) เป็น NP-complete โดยทำ reduction จาก Independent Set
  • dynamic programming algorithms ที่ใช้เวลาเป็น expo
  • an efficient heuristic ที่ทำงานในเวลาพหุนาม และมีผลการทดลองดี 90% ขึ้น

บันทึกเพิ่มเติม

  • heuristic จาก paper ข้างต้นให้ approx-factor เป็น O(n)