Przewodnik po metodach i oprogramowaniu do przewidywania struktury białek

Aby pełnić swoje funkcje biologiczne, białka składają się w jedną lub więcej specyficznych konformacji, podyktowane złożonymi i odwracalnymi niekowalencyjnymi interakcjami. Określenie struktury białka można osiągnąć za pomocą czasochłonnych i stosunkowo drogich technik, takich jak krystalografia, spektroskopia jądrowego rezonansu magnetycznego i interferometria z podwójną polaryzacją. Opracowano oprogramowanie bioinformatyczne do obliczania i przewidywania struktur białkowych na podstawie ich sekwencji aminokwasowych.

Podsumowanie struktury białka

Jako alternatywa dla technik eksperymentalnych narzędzia do analizy struktury i prognozowania pomagają przewidywać strukturę białka zgodnie z ich sekwencjami aminokwasowymi. Rozwiązanie struktury danego białka jest bardzo ważne w medycynie (na przykład w projektowaniu leków) i biotechnologii (na przykład w projektowaniu nowych enzymów). Dziedzina prognozowania białek obliczeniowych stale się zatem rozwija, w następstwie wzrostu mocy obliczeniowej maszyn i rozwoju inteligentnych algorytmów.

Istnieją cztery poziomy struktury białka (ryc. 1). W przewidywaniu struktury białka struktura pierwotna służy do przewidywania struktur drugorzędowych i trzeciorzędowych.

Wtórne struktury białek są zlokalizowane fałdowanie w łańcuchu polipeptydowym, który jest stabilizowany przez wiązania wodorowe. Najczęstszymi wtórnymi strukturami białkowymi są helisy alfa i arkusze beta.

Struktura trzeciorzędowa jest ostateczną formą białka po tym, jak różne struktury drugorzędne zwiną się w strukturę 3D. Ten ostateczny kształt tworzy się i jest utrzymywany razem poprzez oddziaływanie jonowe, mostki dwusiarczkowe i siły van de Waalsa.

Cztery poziomy struktury białka. Zdjęcie z Khanacademy.org.

Metody i oprogramowanie do prognozowania struktury białek

Opracowano wiele programów do przewidywania struktur dla dedykowanych cech i szczególności białek, takich jak przewidywanie zaburzeń, przewidywanie dynamiki, przewidywanie zachowania struktury itp. Podejścia obejmują modelowanie homologii, gwintowanie białek, metody ab initio, przewidywanie struktury wtórnej i helisę przezbłonową i prognozowanie peptydu sygnałowego.

Wybór właściwej metody zawsze zaczyna się od zastosowania podstawowej sekwencji nieznanego białka i przeszukania bazy danych białek w poszukiwaniu homologów (ryc. 2).

Tabela decyzyjna dla metody prognozowania struktury białek.

Oto kilka szczegółowych metod prognozowania struktury białek:

  • Narzędzia do przewidywania struktury drugorzędnej

Narzędzia te przewidują lokalne struktury drugorzędne na podstawie tylko sekwencji aminokwasowej białka. Przewidywane struktury są następnie porównywane z wynikiem DSSP, który jest obliczany na podstawie struktury krystalograficznej białka (więcej na temat oceny DSSP tutaj).

Metody prognozowania struktury wtórnej opierają się głównie na bazach danych znanych struktur białkowych i nowoczesnych metod uczenia maszynowego, takich jak sieci neuronowe i maszyny wektorów nośnych.

Oto kilka świetnych narzędzi do przewidywania struktury drugorzędnej.

  • Struktura trzeciorzędowa

Narzędzia do prognozowania struktury trzeciorzędowej (lub 3-D) można podzielić na dwie główne metody: Ab initio i porównawcze modelowanie białek.

Metody prognozowania struktury białek Ab initio (lub de novo) próbują przewidywać trzeciorzędowe struktury na podstawie sekwencji opartych na ogólnych zasadach rządzących energią fałdowania białek i / lub statystycznych tendencji cech konformacyjnych, które nabywają struktury natywne, bez użycia wyraźnych szablonów.

Wszystkie informacje o trzeciorzędowej strukturze białka są zakodowane w jego pierwotnej strukturze (to znaczy w sekwencji aminokwasowej). Można jednak przewidzieć ogromną ich liczbę, spośród których tylko jedna ma minimalną swobodną energię i stabilność wymaganą do prawidłowego złożenia. Przewidywanie struktury białek Ab initio wymaga zatem dużej mocy obliczeniowej i czasu na rozwiązanie natywnej konformacji białka i pozostaje jednym z głównych wyzwań dla współczesnej nauki.

Najpopularniejsze serwery to Robetta (wykorzystująca pakiet oprogramowania Rosetta), SWISS-MODEL, PEPstr, QUARK. Przejrzyj wyczerpującą listę tutaj.

Jeżeli białko o znanej strukturze trzeciorzędowej ma co najmniej 30% swojej sekwencji z potencjalnym homologiem o nieokreślonej strukturze, można zastosować metody porównawcze, które pokrywają przypuszczalną nieznaną strukturę ze znaną, aby przewidzieć prawdopodobną strukturę nieznanej. Modelowanie homologii i gwintowanie białek to dwie główne strategie, które wykorzystują wcześniejsze informacje o innym podobnym białku do zaproponowania prognozy nieznanego białka na podstawie jego sekwencji.

Oprogramowanie do modelowania homologii i tworzenia białek obejmuje RaptorX, FoldX, HHpred, I-TASSER i inne.

Bibliografia

Prognozowanie struktury białka de novo. Wikipedia.

Prognozowanie struktury białek. Wikipedia