3 Ağustos 2015 Pazartesi

Protein Data Bank (PDB)

Merhabalar

Protein dinamiği ile ilgili yazımda Protein Data Bank'ın (PDB), protein yapısı ile ilgili biyoinformatik çalışmalarda kullanılan en önemli veri tabanlarından olduğunu söylemiştim. Bu yazımda sizlere PDB'nin neler içerdiği, bir PDB dosyasının yapısının nasıl olduğu gibi konularda bilgi vereceğim. 

Öncelikle veritabanını açıklayarak temelden girelim. Veritabanları, teknolojinin gelişmesiyle orantılı olarak artan bilginin depolanması ihtiyacına karşılık geliştirilen, birbiriyle alakalı verilerin kullanılabilecek şekilde depolandığı sistemlerdir. Biyolojik veritabanları ise veritabanlarının bilimsel deneylerden, literatürden, yüksek çıktılı teknolojiden ve hesapsal analizlerden elde edilen verilerin depolandığı özelleşmiş kısmıdır. Biyolojik veri tabanları genomik, proteomik, metabolomik ve mikrodizi gen ifadesi gibi araştırma alanlarından bilgiler içerir.

PDB (Protein Data Bank) 1971 yılında kurulan bir biyolojik veri tabanıdır. 1960’tan önce kimyacılar veya hesapsal biyologlar, kristallografiden elde edilen sonuçları görüntülemek ve analiz etmek için oldukça ilgililerdi ve internet olmadan önce sonuç içeren kağıt dolu kutular veya manyetik teypler kullanılarak analize gönderilebiliyordu. 1971’de düzenlenen bir sempozyumda proteinlerin üç boyutlu yapısı ve fonksiyonu konu edilmişken, Walter Hamilton ve Edgar Meyer yapıların bilgisayar kütüphanesini yapmakta olduklarını açıkladılar ve Ulusal Brookheaven Laboratuvarına PDB’yi önerdiler. Sempozyumdan hemen sonra Cambridge’e gidip, Cambridge Kristallografik Veri Merkezi’nin başı olan Olga Kennard ile ortaklık kurdular ve Nature dergisinde yayınladıkları makale ile PDB’yi duyurdular. 1999 yılında ise PDB kurucu üyeleri Research Collaboratory for Structural Bioinformatics’e (RCSB) transfer edildi.

PDB protein ve nükleik asit gibi biyolojik moleküllerinin X-ray kristallografilerinden veya NMR spektroskopilerinden elde edilen atomik koordinatlarını içeren dosyalar bulundurur (X-ray kristallografisini, kristalize edilmiş proteine X-ray ışınları gönderilerek film bir tabakada şeklinin çıkarılması gibi düşünebilirsiniz). Bu dosyalarda her bir atomun koordinatı bulunur ve bu koordinatlar yapının üç boyutlu lokalizasyonunu temsil eder. Koordinat dosyaları PDB, mmCIF veya XML gibi çeşitli formatlarda olabilir. PDB’ye konulan her yapının 4 haneli harf ve rakamlardan oluşan kodu vardır ve sitenin sağ üst kısmındaki arama kutusuna yazılarak yapının dosyalarına ulaşılabilir. Her yapının çalışmasını anlatan makale hakkında bilgiye, deneysel metoda, yapının çözelti bilgilerine ve sekansına da bu dosyayla birlikte ulaşılabilir.

PDB dosyaları metin editöründen incelenebileceği gibi, bu dosyaları görüntülemek için bazı yazılımlardan da yararlanılabilir. Athena, PyMol, RasMol, Jmol ve Molden gibi yazılımlar PDB dosyalarını görüntülemek için kullanılırlar. Ayrıca bu yazılımlarda proteinleri değişik modlarda görüntülemek, renklendirmek, sekanslarını karşılaştırmak için bir çok araç bulunur. Koordinat dosyalarıyla çalışmak için bu dosyalar hakkında bilgi sahibi olmak oldukça önemlidir. Dosya içerisinde istenilen yapı dışında bir çok iyonun, su molekülünün veya başka moleküllerin de atom koordinatları bulunabilir. İstenilen veya istenmeyen yapılara zincir isimlerinden (chain ID) ulaşılabilir. Örnek bir atomik koordinat dosyasını aşağıda görebilirsiniz.


Protein Data Bank’ın içerdiği yapı sayısı her geçen gün artmakta ve yapısal biyoloji, biyoinformatik, moleküler modelleme çalışmalarına son derece faydalı bir kaynak oluşturmakta olup, 2014 yılından itibaren içerdiği yapı sayısı yüz bini geçmiştir. PDB hakkında söyleyeceklerim bu kadar. Umarım faydalı olmuştur.

Hoşçakalın!

2 yorum:

  1. Merhaba ben bir şey merak ettim de, acaba bütün bu aminoasitlerin sonsuz veya çok yüksek olasılıklarda proteinler olarak tasarlanıp (otomatik olarak) bu proteinlerin atomik ve structural olarak sınıflanmasını sağlayan programlar mevcut mu? Ve PDB böyle bir şey kullanıyor mu?

    YanıtlaSil
  2. Evet, sekanstan proteinin katlanmış halinin tahminlenmesi mümkün. Ancak doğruluk yüzdesi düşük hala. Öte yandan bulunan tüm protein yapıları sürekli olarak sınıflandırılıyor. Örneğin SCOP (Structural Classification of Proteins) veritabanı. PDB veritabanında her girinin SCOP'ta hangi sınıfa girdiği bilgisi bulunur.

    YanıtlaSil