10 Ocak 2013 Perşembe

Biyoinformatiğe nasıl başladım 1

Bir kavramı anlatmak üzerine yola çıkmaya karar verdiğinizde, nereden başlayacağınızı şaşırıyorsunuz. Yaklaşık 45 dakikadır bilgisayarın başındayım ve sürekli yazıp siliyorum. Artık bir şekilde başlamam gerek dedim ve kendi hikayemle başlıyorum.

İlk gerçek biyoinformatik problemiyle lisans 2. sınıfta karşılaştım; amacım, ATG dışındaki başlangıç kodonlarıyla (evet, var!) başlayan genleri tespit etmekti. Tespit ettikten sonra ne yapacağımla ilgili en ufak bir fikrim yoktu ancak bunu başarabilmek beni çok mutlu etmişti :) Bugünkü bilgim olsa, bu genlerin ortak özelliklerini tespit etmek adına GO (Gene Ontology) ve yolak analizleriyle bir dizi çalışma gerçekleştirir ve herhangi bir şey bulup bulamayacağıma bakardım. Neyse, işin içine girdikçe mutlaka derinleşmem gereken iki temel konu olduğunu farkettim: programlama  algoritma) ve moleküler biyoloji. İstatistiğin henüz farkında değildim.


Sözün özü: 
Biyoinformatik, yaşam bilimlerinde (ve özellikle de moleküler biyoloji ve genetikte) çözmeye çalıştığımız ve büyük miktarlarda veri içeren problemleri çözebilmek amacıyla bilgisayar ve istatistik bilimlerinden/araçlarından faydalanan disiplinlerarası bir alandır.



Proje (programlama bilgisi gerektiriyor): 
Amacımız, fare genomunda ATG ile başlamayan genleri tespit etmek. [Çözümü kolaylaştırmak adına, DNA yerine protein dizilimi üzerinden analizi gerçekleştirebilirsiniz. ATG Metionin aminoasitini kodlar ve bu aminoasit M harfi ile gösterilir. Bu durumda M ile başlamayan proteinleri tespit etmeliyiz. Dosyayı şu adresten indirebilirsiniz: ftp://ftp.ncbi.nih.gov/refseq/M_musculus/mRNA_Prot/mouse.1.protein.faa.gz] 

Meraklısına: 
Problemi Vi editörü ile şu şekilde çözebilirsiniz: />.\+\n[^M]/