SIMAP
Similarity Matrix of Proteins nebo častěji SIMAP je BOINC projekt, který slouží k výzkumu funkcí proteinů. Aplikace simap hledá pomocí FASTA heuristiky (jejíž výsledky jsou zpřesněny pomocí Smith-Watermanova algoritmu[1][2]) podobnosti v primární struktuře proteinů, aplikace hmmer využívající skryté Markovovy modely (Hidden Markov Models) lokalizuje v proteinu jednotlivé domény.[3] Zdroje dat pro SIMAP@home představují veřejně přístupné vědecké databáze jako UniProt, RCSB PDB, GenBank nebo RefSeq shromažďující informace o struktuře a funkci dosud objevených proteinů. Pro odhad proteinových domén se využívá informací o známých doménách a sekvenčních vzorech z databáze InterPro.[4] Výsledky výpočtů se ukládají do veřejně přístupné vědecké databáze.
Význam projektu
Studium proteinů je základem pro pochopení biologických procesů v živých organismech. Má uplatnění v medicíně a farmaceutickém průmyslu, molekulární biologii, biochemii, genetice, bioinženýrství, nanotechnologiích, atd.[5] Počet každoročně objevených proteinů velmi rychle roste, avšak jen u zlomku z nich je známo jejich působení v organismu.[6] Experimentální ověřování funkcí proteinů je zdlouhavé a velmi nákladné. Velké množství proteinů má však podobné funkce.[7] SIMAP@home vytváří databázi, v které jsou uloženy informace o vzájemné podobnosti známých i nově objevených proteinů. Tato databáze pak slouží jako základ k dalšímu výzkumu.
Proteiny
Obecná charakteristika
Proteiny (bílkoviny) jsou základní stavební jednotkou organismu. Jsou tvořeny řetězci aminokyselin (tj. molekul obsahující funkční skupiny -NH2 a -COOH) spojených navzájem peptidickou vazbou. V organismu plní důležité funkce[8], mimo jiné:
- transportní (např. hemoglobin v červených krvinkách váže kyslík)
- regulační (např. insulin - snižuje koncentraci glukózy v krvi)
- strukturní (např. kolagen v pojivových tkáních),
- katalytickou (např. enzym DNA polymeráza při replikaci DNA)
- ochranné (různé protilátky)
- skladovací (např. ferritin skladující železo)
Struktura proteinů
Primární struktura
proteinů je tvořena pořadím aminokyselin, které protein tvoří. Pořadí aminokyselin je zakódováno v DNA. SIMAP@home se snaží pomocí shody v pořadí aminokyselin (=sekvenční shoda) u proteinů najít tzv.homologní proteiny. Sekvence jsou homologní, jestliže jsou odvozeny od stejné původní sekvence. Například pokud se nějaká linie živočichů v průběhu evoluce rozdělí na dvě vývojové větve, bude každá vývojová větev zprvu obsahovat podobné geny kódující podobné proteiny s podobnou nebo stejnou funkcí.[11] Pokud je sekvenční shoda dvou proteinů vyšší než 45 %[12], lze předpokládat, že proteiny budou mít podobnou i prostorovou strukturu a funkci.
Sekundární struktura
Sekundární struktura proteinů vzniká lokálním "sbalením" částí proteinů v důsledku vytváření vodíkových můstků mezi karbonylovými a imidovými skupinami v proteinu. Je určena typickým tvarem částí proteinů, nejčastěji:
- Alfa-helix: α-helix[nedostupný zdroj], 310-helix nebo π-helix (vypadají jak šroubovice)
- Beta-skládaný list: β-struktura[nedostupný zdroj] neboli struktura skládaného listu (vypadá jak harmonika, zpřekládaný list papíru)
- ohyby (vypadají jak šňůrka), které mění směr aminokyselinového řetězce
Terciární struktura
Terciární strukturu proteinů v SIMAP@home počítá aplikace hmmer. Rozlišují se supersekundární struktura a proteinové domény.
- supersekundární struktura (sekvenční motivy) - prostorové uspořádání po sobě jdoucích elementů sekundární struktury. Např.: alfa-alfa motiv (dva protiběžné alfa helixy spojené smyčkou, která mění směr polypeptidového řetězce o 180 stupňů), beta-beta motiv (dvě protiběžná beta vlákna spojená smyčkou), beta-alfa-beta motiv (dvě rovnoběžná beta vlákna oddělená alfa helixem, který je vůči nim kolmý), atd.
- proteinové domény (proteinové sbalení) - opakovaně se vyskytující kombinace supersekundární struktury. Domény tvoří navzájem propojené a více či méně strukturně a funkčně nezávislé části proteinu. Na rozdíl od kvartérní struktury je zatím vše v rámci jednoho aminokyselinového (polypeptidického) řetězce.
Kvartérní struktura
vzniká když je protein tvořen dvěma nebo více polypeptidickými řetězci, které jsou spojeny nekovalentními vazbami. Příkladem může být hemoglobin, který je tvořen čtyřmi vlákny (viz obrázek - otevře se po kliknutí na odkaz u hemoglobinu).
Databáze SIMAP
Databáze obsahovala v roce 2007 více než 17 milionů proteinů. Databáze SIMAP je aktualizována každý měsíc, a proto jsou nové jednotky pro SIMAP@home připraveny obvykle vždy k začátku nového měsíce. V současnosti má projekt dostatečnou počítačovou kapacitu, avšak potřeba výpočetního času (především pro aplikaci hmmer) se postupně stále zvyšuje.
Software
Aplikace SIMAP@home běží pod systémy Windows, Macintosh a Linux.
Reference
- ↑ Roland Arnold, Thomas Rattei, Patrick Tischler, Minh-Duc Truong, Volker Stümpflen and Werner Mewes: SIMAP—The similarity matrix of proteins, Bioinformatics 2005 21(Suppl 2):ii42-ii46; doi:10.1093/bioinformatics/bti1107
- ↑ C. Miccio, T. Ratter: Global statistical analysis of the protein homology network, arXiv:q-bio/0703053v1
- ↑ Similarity Matrix of Proteins: Frequently asked questions about the BOINCSIMAP project. boinc.bio.wzw.tum.de [online]. [cit. 2008-07-19]. Dostupné v archivu pořízeném dne 2008-06-19.
- ↑ Thomas Rattei, Patrick Tischler, Roland Arnold, Franz Hamberger, Jörg Krebs, Jan Krumsiek, Benedikt Wachinger, Volker Stümpflen and Werner Mewes: SIMAP—structuring the network of protein similarities, Nucleic Acids Res., 36, D289–D292.
- ↑ NordProt: Importance of protein science. www.nordprot.org [online]. [cit. 2008-07-16]. Dostupné v archivu pořízeném dne 2009-04-21.
- ↑ Antonín Pavelka: Funkční anotace proteinových segmentů, Masarykova Univerzita, bakalářská práce
- ↑ Similarity Matrix of Proteins: About SIMAP. boinc.bio.wzw.tum.de [online]. [cit. 2008-07-19]. Dostupné v archivu pořízeném dne 2008-07-19.
- ↑ Bílkoviny=proteiny, ÚSTAV BIOCHEMIE A MIKROBIOLOGIE, Vysoká škola chemicko-technologická v Praze[nedostupný zdroj]
- ↑ RNDr. Tomáš Obšil, PhD.: Struktura proteinů a funkce enzymů, Katedra fyzikální a makromulekulární chemie, Přírodovědecká fakulta UK v Praze[nedostupný zdroj]
- ↑ Vladimír Kopecký Jr.: Úvod do struktury proteinů I, Fyzikální ústav Matematicko-fyzikální fakulty UK. biomolecules.mff.cuni.cz [online]. [cit. 2007-08-18]. Dostupné v archivu pořízeném dne 2007-08-18.
- ↑ Similarity Matrix of Proteins: Glossary. webclu.bio.wzw.tum.de [online]. [cit. 2008-07-19]. Dostupné v archivu pořízeném z originálu dne 2008-06-02.
- ↑ Bioinformatika a funkční studie, Fakulta vojenského zdravotnictví UO v Hradci Králové[nedostupný zdroj]