24 Şubat 2013 Pazar

Biyoinformatik ve Veri Analizi - 2


İstatistik dersi grip aşısından daha sevimli
 değildir ama en az onun kadar yararlıdır.
Paul Newbold

Bir önceki yazımda biyoinformatiğin bir çok bilimden yararlanan disiplinler arası bir alan olduğunu söylemiştim. Bunlardan biri de istatistiktir. Sayıların arkasındakini anlamak, resmin bütününü görmek, göstermek istediğimizde istatistik, bize gerekli alet edevatı sunar.

İstatistik kısa bir tanımla, belirli bir amaç için veri toplama, toplanan verileri düzenleme (kullanılabilir hale getirme), özet çıkarma, genelleme (model kurma, çıkarsama) yapma ve yorumlama yöntem ve teknikleri bilimidir. Verinin ve değişkenliğin olduğu yerde istatistik de vardır.

 Veri = Gerçeklik + rassallık (hatalar)

Veri, deney sonucu (ölçüm, gözlem vs.) elde ettiğimiz bilgidir. İçinde gerçeklik de vardır, gerek ölçümden kaynaklanan gerek değişkenliğe bağlı olan hatalar, bozulmalar da vardır. Amacımız olabildiğince veri içindeki ilişkileri, örüntüleri bularak gerçekliğe ulaşmaktır. Hatalar gerçekliğe ulaşmamıza engel olan tümsekler ve çukurlardır. Bu yüzden olabildiğince az çukurların, tümseklerin olması kaza yapma ihtimalini düşürür.

Veri analizi bir süreçtir ve araştırmacı ile istatiskçinin ortaklaşa çalışmasını gerektirir. Özellikle araştırmanın amacına yönelik doğru ve güvenilir veri toplanmasında çok önemlidir. Çünkü istatistik veri üzerinden öğrenerek bilgi çıkartır. Verinin yanlış olması araştırma sonucunu da etkiler. Aynı zamanda ihtiyaç duyulan doğru istatistiksel analizlerin belirlenebilmesi için de araştırmacı ile işbirliği gerektirir.


Sözün Özü:
Bir çok bilimde olduğu gibi biyoinformatik için de veri analizi çok önemlidir. Verinin içinde saklanan örüntüleri bulmak, bilgi çıkartmak için istatistiksel yöntemlerden çoğunlukla yararlanılır. Doğru sonuçların elde edilebilmesi için araştırmacının yeterli istatistik bilgisine sahip olması ya da uzman bir istatistikçiyle iş birliği yapması araştırmanın sağlığı açısından gereklidir.