21 Şubat 2013 Perşembe

Biyoinformatik ve Veri Analizi

Bu yazı değerli çalışma arkadaşım Deniz'in bakış açısıyla ortaya çıktı, katkısından ötürü çok teşekkür ediyorum.


Ahmet Bey'e blogunda ki bu değerli alanı ayırdığı için teşekkürlerimi sunarak başlamak istiyorum. 

Biyoinformatik, dünyada önemli bir araştırma konusu olan ve ülkemizde de yeni yeni tanınmaya, adından söz ettirmeye başlayan ve  kendine yer edinen disiplinler arası bir alandır. Ayrıca temelini moleküler biyoloji oluşturup, bilgisayar ve istatistik alanlarından yararlanarak problemlerine cevap arayan bir disiplindir.

Özellikle insan genom projesinin tamamlanması ve teknolojinin ilerlemesi genetik çalışmaları hızlandırmış, genlerin ve proteinlerin arka sokaklarında gizlenenlerin keşfine zemin hazırlamıştır. Bu keşifler sırasında oldukça büyük boyutlu veriler elde edilmektedir. Elde edilen bu verilerin saklanması için veritabanı  oluşturulması ve bu büyüklükteki verilerinin analizi için yeni tekniklerin geliştirilmesine önem verilmiştir.

Gen çiplerinin gelişmesiyle beraber yüzlerce genin aynı anda incelenmesi kolaylaşmıştır. Bu çipler genlere ve proteinlere ait işlevlerin arasındaki ilişkinin bulunmasında önemli rol oynamaktadır. Bu da bahsettiğimiz büyük boyutlu verilerin analizini gerektirmektedir. 

Verilerin analizi için var olan istatistiksel analiz yöntemlerinin yanında veri madenciliği(data mining) ve makine öğrenmesi (machine learning) teknikleri kullanılmaktadır. Biyoinformatikçiler için buradaki temel sorun da  doğru bir analiz için hangi yöntemlerin hangi durumlarda kullanılacağıdır. Her bir yöntemin oluşumunun kendine ait koşulları ve varsayımları vardır. Bu varsayımlar sağlanmadığında yöntemin geçerliliğinin yitirilmesi söz konusu olacağı için elde edilecek sonuçlar da yanlış olacaktır. Örneğin;  Yapılan bir veri analizinde kullandığınız yöntemin doğru seçilmemesi durumunda BRCA1 geninin göğüs kanseriyle bir ilişkisinin olmadığı sonucuna varabilirsiniz. Oysa ki çalışmalar bu genin ifade düzeyinin artması ile göğüs kanseri görülme olasılığının arttığını göstermektedir.


Sözün Özü:

Biyoinformatik bir çok tekniklerden yararlanan disiplinlerarası bir alandır. Bu sebeple problemlerin çözümünde bilimlerin koordineli ve eşzamanlı çalışmasını gerektirir.


Deniz Ağırdan