30 Haziran 2013 Pazar

Biyoinformatik Projeleri Rapor Biçimi

Neden Raporlama?

Bir projeyi profesyonel bir şekilde yürütürken, elde ettiğiniz bulguları, kullandığınız verilerin kaynaklarını, bu verilere erişme zamanlarını, bu süreçte takip ettiğiniz adımları ve bu adımları neden takip ettiğiniz gibi, 3 ay sonrasında unutulabilecek veya bir başkasıyla paylaşılabilecek bilgileri yazılı hale getirmeye ihtiyaç duyarız. Amacımız yazı yazmak için yazı yazmak değil; yaptığımız işi en güzel şekliyle sunacak ve uzun bir süre sonra geri döndüğümüzde deneyimlerimizi bize hatırlatacak kısa, öz ve şık bir döküman oluşturmak.

Genetik Odaklı Proje - 1. Bölüm

Projenin ilk bölümünde, Kistik Fibrozis ve bu hastalığa neden olan gen hakkında temel bilgiler derleyeceğiz.

Programlama Odaklı Proje - 1. Bölüm

Projenin ilk bölümünde, programlamaya ilişkin temel bir anlayış geliştireceğiz ve bunu çok zevkli fakat ilerledikçe zorlaşan bir oyunla yapacağız.

Programlama Odaklı Biyoinformatik Projesi

Bu sayfaya ilk kez geliyorsanız, Proje Bölümlerine göz atmadan önce lütfen  Proje Konusu ve Genel Bilgiler kısımlarına bir göz atın.

Proje Bölümleri:

Proje Konusu:

Bu projedeki amacımız, bir gen grubundaki DNA dizilimlerini incelemek ve ortak motifleri keşfetmek olacak. Proje süresince, DNA dizilimlerini Python programlama dilini kullanarak inceleyecek ve farklı dizilimlerde yer alan ortak kısa DNA dizilimlerini (motifleri) tespit etmeye çalışacağız. Geliştirdiğimiz kodları ve bulgularımızı proje sonunda küçük bir kitapçık haline getireceğiz.

Genetik Odaklı Biyoinformatik Projesi

Bu sayfaya ilk kez geliyorsanız, Proje Bölümlerine göz atmadan önce lütfen Proje Konusu ve Genel Bilgiler kısımlarına bir göz atın.

Proje Bölümleri:

Proje Konusu:

Bu projedeki amacımız, bazı mutasyonları Kistik Fibroz hastalığına neden olan CFTR genini keşfetmek olacak. Proje süresince bu geni ve özelliklerini çeşitli web araçları kullanarak araştıracak ve bulgularımızı proje sonunda küçük bir kitapçık haline getireceğiz.

Biyoinformatik Yaz Projeleri

Hem biraz dinlenmek, hem de ilgi alanınıza giren konularda kendinizi geliştirmek için yaz çok büyük bir fırsat, tabii ki öğrenciler için. Çalışma hayatına girdiyseniz mevsimler bir anda  farklılıklarını yitiriyor ve tatil kavramı bir mevsimden birkaç haftaya indirgeniyor.

Yaz stajı da aynı şekilde birşeyler öğrenmek için büyük bir fırsat ancak ülkemizdeki biyoinformatik odaklı şirketlerin veya kuruluşların sayısı çok az, bu nedenle de alana ilgisi olanlar her zaman istedikleri tarzda bir staj programına erişemiyorlar. Bu döngüyü kırmak adına genetik ve programlama odaklı iki farklı biyoinformatik sanal staj programı oluşturmayı düşünüyordum uzun süredir, kısmet bugüneymiş. 

Genetik odaklı projede programlama dili bilmeye gerek olmaksızın web tabanlı biyoinformatik araçlarını kullanmayı, düzenli raporlar hazırlamayı ve Excel yeteneklerini geliştirmeyi hedefleyen bir yaklaşım benimseyeceğim.

Programlama odaklı projede ise işin biraz daha bilgisayar yanını ağırlıklı tutup bir yandan programlama dili öğrenmeyi teşvik edip, diğer yandan da biyolojik bir problemi tanımlayıp çözmeye odaklanacağım.

28 Haziran 2013 Cuma

ANOVA (Analysis of Variance)

Uzun bir aradan sonra tekrar merhaba. Bugün ki yazımda t-testinin genelleştirilmiş hali olan F-testi ANOVA’dan bahsetmek istiyorum. ANOVA ikiden fazla grup ortalamalarının karşılaştırılmasında kullanılan parametrik bir yöntemdir. T-testi F-testinin özel durumu olarak düşünebiliriz. T-testinde sadece iki grup karşılaştırılması yapılmaktadır. Parametrik yöntem olması gereği bazı varsayımlar gerektirmektedir. En önemli varsayımı grupların varyanslarının eşit olduğu varsayımıdır. Bu varsayım bozulduğunda sonuçların önemli derecede etkileneceği literatürde geçmektedir. Diğer varsayımlar ise, normal dağılım şartı ve gözlemlerin birbirinden bağımsız olmasıdır. Normallik şartı göz ardı edilebilmesine rağmen varyansların homojenliği varsayımı katı bir koşuldur.

Veri Analizinde Uygulanan Adımlar - 5 (İdeal Verilerin Belirlenmesi)

Bir veri analizi çalışmasının en zor aşamalarından birinin sorunun doğru sorulması olduğu söylenebilir. Eğer sorular doğru sorulmuş ve cevaplar da uygun bir şekilde verilmişse, hangi yolda ve hangi sınırlar içerisinde ilerleyeceğimiz bellidir. Bu, bizim analizimizin her aşamasında yararlanacağımız bir referans veya kılavuzdur.

Bir sonraki aşama, bu sorunun cevaplanmasında hangi verilerin kullanılacağı veya kullanılabileceğidir. Genelde ülkemizde iki temel yanlış algılama var: 1) ben bir deney yapayım veya veri toplayayım, sonrasında bu veriden ne çıkarsa onunla ilerleriz. Ya da: 2) elimdeki veri sorduğum soruya uygun değil ancak verinin sağıyla soluyla oynayarak aslında ortaya çıkması mümkün olmayacak bir sonuca bir şekilde varmaya çalışayım. Bu iki yaklaşım da çok tehlikelidir ve en iyi ihtimalle bir sonuca varamazsınız, en kötü ihtimalle ise tamamen yanlış ve aldatıcı bir sonuç elde edersiniz. Olması gereken şudur: soru önce gelir, veri sonra.

Primer Tasarımı - 1 (PCR)

Primer tasarımı çok enterasan bir konu esasen. İşin bir boyutu, 1) genomik tekniklerin neredeyse tamamının dayandığı hibridizasyon (A-T ve G-C bazlarının karşılıklı olarak fiziksel kuvvetlerle bir arada kalması) kavramının çok iyi anlaşılmasına dayanıyor. İşin diğer yanı, 2) termodinamik denklemlerdeki parametrelerin yerli yerince belirlenmesiyle doğrudan alakalı. Bir diğer boyut ise, 3) her türlü hesaplama sonucu tasarlanan birçok alternatif primerin genomda doğru bir yere konumlandırılmasını temel alıyor. Her ne kadar karışık ve karmaşık bir süreç olsa da, artık çevrimiçi [online] araçlarla bu iş neredeyse çocuk oyuncağı. Tam olarak değil. Yine de, işinizi gayet kolaylaştıracak bir çevrimiçi aracı da bir yandan anlatarak süreci mümkün olduğunca acısız geçirmeniz için elimden geleni yapacağım.

Bu tür konularda arka planda yer alan bilgilere hakim olmak sandığınızdan çok daha hayati olabilir. Geçmişte eski bir ortağımla gerçekleştirdiğimiz ve altı haneli bütçesi olan bir Ar-Ge çalışması, eski ortağımın deneyleri ve primerleri hatalı tasarlamasından ve isimlendirmesinden ötürü büyük oranda başarısızlıkla sonuçlanmıştı. Kendisi gayet iyi bir üniversitede doktora yapmış, tez sürecinde yoğun bir şekilde primer tasarlamış ve birçok PCR deneyi yapmış olmasına rağmen, konu standart primer tasarımının dışına birazcık çıktığı anda hatalar ardarda gelmişti. Projeyi yarıda bırakıp Ankara'daki bir üniversitede Yard. Doç. kadrosu aldığında ise hatalı tasarımların, karıştırılmış primerlerin ve çalışması zaten imkansız olan deneylerin farkına varmış ve çok geç kalmıştık. Hayatım boyunca laboratuvardan hep uzak kalmaya çalışmışken, kendimi bir anda RT-PCR deneylerinin ortasında buldum. Uykusuz geceler, haftalar süren sıkıcı pipetlemeler ve stresli birkaç ay sonunda farklı bir yaklaşımla projeyi kıl payı kurtarır gibi olduk ancak projenin başında planladığımız sonuçlardan çok uzaktaydık. Harcanan proje bütçesi ve on iki aylık bir zaman dilimi bir yana, iki büyük yatırımcı şirketin güvenini kaybetmek ve gayet açık olan o kapıların tamamen kapanması, ödenen en büyük bedeldi.

21 Haziran 2013 Cuma

Veri Analizinde Uygulanan Adımlar - 4 (Analiz Hedeflerinin Belirlenmesi)

Geçen yazımda sorulan sorunun ne kadar önemli olduğundan bahsetmiş ve örneklerle konuyu açıklamaya çalışmıştım. Sorduğumuz soru, açık denizde yol alırken izlediğimiz rota gibidir; ne kadar iyi sorulmuşsa izlediğimiz yolda o denli sabit ve odaklı kalabiliriz.

Burada kısıt ekonomisi denilen kavrama girmek istiyorum, gözünüzü korkutmasın gayet anlaşılır bir konu. Örneğin, bir laboratuvar çalışması yürütüyorsunuz ve belirli bir bütçeniz var. İşte bu bütçe, sizin kısıtınız, yani sınırlarınız. Sınırlarınız olduğu sürece, bazı deneyleri diğerlerine tercih ederek veriminizi arttırmak istersiniz (veya ideal olan budur). Yani, sorduğunuz soru her ne kadar sizi belirli bir rotada odaklanmış bir şekilde tutacaksa da, o rota üzerinde hangi adalara uğramanız gerektiği veya karadan en fazla ne kadar uzak kalabileceğiniz sizin hareketinizi sınırlayan temel faktörlerdir. Her ne kadar sanki ölmeyecekmiş gibi yaşasak da, en basitinden ömrümüz bizim en temel kısıtlayıcı etkenimizdir ve tam da bu nedenle hayatımızı verimli geçirebilmek adına bazı fırsatları diğer bazılarına tercih ederiz. Bu duruma kapsam adını verebiliriz.

Yani kapsam, analiz sürecinde, sorduğumuz soruyu cevaplarken hangi analizleri diğerlerine tercih edeceğimiz ve nerede duracağımızın ifadesidir. Sınırsız bütçe yoktur, sınırsız insan kaynağı yoktur, sınırsız sarf malzemesi yoktur, sınırsız bilgisayar gücü yoktur. 

19 Haziran 2013 Çarşamba

Yeni Nesil Sekanslama Biyoinformatik Analizi ve 1111 BLAST

Çok uzun bir aradan sonra tekrar merhaba. Bu blogu hazırlamaya başlarken beni en çok tedirgin eden şeylerden biri, yarım kalmasıydı. Elbette ki her şeyin bir ömrü var, ancak yine de biyoinformatik hakkında yeterince kapsamlı bir Türkçe kaynak oluşana kadar bu blogu devam ettirmek istiyorum; en azından bu niyetle yola çıktım.

İki hafta önce, Yeni Nesil Sekanslama (YNS) biyoinformatik analizleri hakkında bir sunum yapmak üzere Erciyes Üniversitesi Genom ve Kök Hücre Merkezi'nden (GenKök) nazik bir davet aldım. İşin güzel tarafı, yine geçen ay gerçekleştirdiğim birçok analizin içinde benim için çok ilgi çekici olan bir YNS çalışmasının tamamlanmasına denk geldi bu davet.  Genel amaçlı sunumlarda teknik detaylara girmekten pek hoşlanmıyorum; fazlasıyla sıkıcı hale gelebiliyor ve her kısım herkesin ilgisini çekemeyebiliyor, özellikle dinleyiciler doktorlar ve biyologlar olduğu zaman. Ancak bu yazıda, o günkü sunumda bahsettiğim başlıkların bir kısmının arka planında yer alan detaylardan bahsedeceğim. 

Gizlilik nedeniyle çalışmanın deneysel detaylarına giremeyeceğim maalesef, ancak özetle, farklı ortamlardan alınmış örneklerde hangi tür mikroorganizmaların olduğunu tespit etmek amaçlanıyordu. 16S ve 18S bölgeleri hedeflenerek gerçekleştirilen bir Sanger sekanslama (dizilimleme) yaklaşımı ile yapılan tipik bir tür tayini araştırmasının milyonlarca DNA dizilimini içeren versiyonu olarak düşünebilirsiniz gerçekleştirilen analizi. Temel birkaç farkla.