Merhabalar
Protein dinamiği ile ilgili yazımda Protein Data Bank'ın (PDB), protein yapısı ile ilgili biyoinformatik çalışmalarda kullanılan en önemli veri tabanlarından olduğunu söylemiştim. Bu yazımda sizlere PDB'nin neler içerdiği, bir PDB dosyasının yapısının nasıl olduğu gibi konularda bilgi vereceğim.
Öncelikle veritabanını açıklayarak temelden girelim. Veritabanları, teknolojinin gelişmesiyle orantılı olarak
artan bilginin depolanması ihtiyacına karşılık geliştirilen, birbiriyle alakalı
verilerin kullanılabilecek şekilde depolandığı sistemlerdir. Biyolojik
veritabanları ise veritabanlarının bilimsel deneylerden, literatürden, yüksek
çıktılı teknolojiden ve hesapsal analizlerden elde edilen verilerin depolandığı
özelleşmiş kısmıdır. Biyolojik veri tabanları genomik, proteomik, metabolomik ve
mikrodizi gen ifadesi gibi araştırma alanlarından bilgiler içerir.
PDB (Protein Data Bank) 1971 yılında kurulan bir
biyolojik veri tabanıdır. 1960’tan önce kimyacılar veya hesapsal biyologlar,
kristallografiden elde edilen sonuçları görüntülemek ve analiz etmek için
oldukça ilgililerdi ve internet olmadan önce sonuç içeren kağıt dolu kutular
veya manyetik teypler kullanılarak analize gönderilebiliyordu. 1971’de
düzenlenen bir sempozyumda proteinlerin üç boyutlu yapısı ve fonksiyonu konu
edilmişken, Walter Hamilton ve Edgar Meyer yapıların bilgisayar kütüphanesini
yapmakta olduklarını açıkladılar ve Ulusal Brookheaven Laboratuvarına PDB’yi
önerdiler. Sempozyumdan hemen sonra Cambridge’e gidip, Cambridge
Kristallografik Veri Merkezi’nin başı olan Olga Kennard ile ortaklık kurdular
ve Nature dergisinde yayınladıkları makale ile PDB’yi duyurdular. 1999 yılında
ise PDB kurucu üyeleri Research Collaboratory for Structural Bioinformatics’e
(RCSB) transfer edildi.
PDB protein ve nükleik asit gibi biyolojik moleküllerinin
X-ray kristallografilerinden veya NMR spektroskopilerinden elde edilen atomik
koordinatlarını içeren dosyalar bulundurur (X-ray kristallografisini, kristalize edilmiş proteine X-ray ışınları gönderilerek film bir tabakada şeklinin çıkarılması gibi düşünebilirsiniz). Bu dosyalarda her bir atomun koordinatı
bulunur ve bu koordinatlar yapının üç boyutlu lokalizasyonunu temsil eder.
Koordinat dosyaları PDB, mmCIF veya XML gibi çeşitli formatlarda olabilir.
PDB’ye konulan her yapının 4 haneli harf ve rakamlardan oluşan kodu vardır ve
sitenin sağ üst kısmındaki arama kutusuna yazılarak yapının dosyalarına
ulaşılabilir. Her yapının çalışmasını anlatan makale hakkında bilgiye, deneysel
metoda, yapının çözelti bilgilerine ve sekansına da bu dosyayla birlikte
ulaşılabilir.
PDB dosyaları metin editöründen incelenebileceği gibi, bu
dosyaları görüntülemek için bazı yazılımlardan da yararlanılabilir. Athena,
PyMol, RasMol, Jmol ve Molden gibi yazılımlar PDB dosyalarını görüntülemek için
kullanılırlar. Ayrıca bu yazılımlarda proteinleri değişik modlarda
görüntülemek, renklendirmek, sekanslarını karşılaştırmak için bir çok araç
bulunur. Koordinat dosyalarıyla çalışmak için bu dosyalar hakkında
bilgi sahibi olmak oldukça önemlidir. Dosya içerisinde istenilen yapı dışında
bir çok iyonun, su molekülünün veya başka moleküllerin de atom koordinatları
bulunabilir. İstenilen veya istenmeyen yapılara zincir isimlerinden (chain ID)
ulaşılabilir. Örnek bir atomik koordinat dosyasını aşağıda görebilirsiniz.
Protein Data Bank’ın içerdiği yapı sayısı her geçen gün
artmakta ve yapısal biyoloji, biyoinformatik, moleküler modelleme çalışmalarına
son derece faydalı bir kaynak oluşturmakta olup, 2014 yılından itibaren içerdiği
yapı sayısı yüz bini geçmiştir. PDB hakkında söyleyeceklerim bu kadar. Umarım faydalı olmuştur.
Hoşçakalın!
Merhaba ben bir şey merak ettim de, acaba bütün bu aminoasitlerin sonsuz veya çok yüksek olasılıklarda proteinler olarak tasarlanıp (otomatik olarak) bu proteinlerin atomik ve structural olarak sınıflanmasını sağlayan programlar mevcut mu? Ve PDB böyle bir şey kullanıyor mu?
YanıtlaSilEvet, sekanstan proteinin katlanmış halinin tahminlenmesi mümkün. Ancak doğruluk yüzdesi düşük hala. Öte yandan bulunan tüm protein yapıları sürekli olarak sınıflandırılıyor. Örneğin SCOP (Structural Classification of Proteins) veritabanı. PDB veritabanında her girinin SCOP'ta hangi sınıfa girdiği bilgisi bulunur.
YanıtlaSil