poniedziałek, 11 stycznia 2021

Szczepionka mRNA rozkodowana

Trafiłem na tekst tak fajny, że po prostu musiałem przygotować dla Was jego syntezę. Jeśli jednak nie boicie się dłuższej lektury i języka angielskiego to możecie od razu sięgnąć do pierwotnego źródła:
Reverse Engineering the source code of the BioNTech/Pfizer SARS-CoV-2 Vaccine

W przeciwnym razie zapraszam do lektury. Będzie świetnym uzupełnieniem (albo ciągiem dalszym) dla notki Zderzenie dwóch kodów. Bert Hubert, którego tekst tak mnie zachwycił, nie jest genetykiem ani lekarzem, jest developerem i postanowił przeanalizować kod źródłowy szczepionek mRNA.

Szczepionka innego rodzaju

Wspomniany kod dostępny jest w całości na stronach WHO pod tym adresem, wraz z wdzięcznym rysunkiem który odtworzyłem na początku notki. Cały kod RNA liczy sobie 4284 liter, w tym 3824 litery stanowią instrukcję budowy kolca koronawirusa. To wypustki którymi przyczepia się on do naszych komórek, dzięki czemu następnie może zrobić nam krzywdę. To właśnie tym kolcom koronawirusy zawdzięczają swoją nazwę. Odporność przeciwko wirusowi polega na tym, że nasz organizm potrafi rozpoznać te kolce i atakuje pokryte nimi wirusy.

Przejdźmy do pierwszej ciekawej paraleli między genetyką i elektroniką. RNA można traktować jako odpowiednik pamięci RAM. Podobnie jak ulotna pamięć w komputerze, RNA jest bardzo delikatne i łatwo ulega rozpadowi (m.in. dlatego szczepionka Pfeizera/BioNTechu musi być przechowywana w tak niskiej temperaturze). DNA stanowi pamięć stałą, jest dużo bardziej trwałe, ale dostęp do kodu nie jest tak łatwy. Dlatego nasza komórkowa machina przepisuje pożądane fragmenty ukrytego w jądrze DNA na RNA, które poza jądrem komórkowym pozwala produkować odpowiednie białka.

Do tej pory szczepienia polegały na wstrzykiwaniu osłabionego lub nieaktywnego wirusa, by w bezpiecznych warunkach dać organizmowi okazję by nauczył się walczyć z wrogiem. W tym wypadku mRNA zawiera instrukcję budowy części samego wirusa (bez kapsydu i wirusowego RNA). Genialne w swojej prostocie, bo kolce są nieszkodliwe a pozwalają zbudować odporność. Co więcej produkcja szczepionki mRNA jest prostsza niż np używająca kurzych jajek i bakterii produkcja szczepionek na grypę.

Kod źródłowy

Na początku kodu znajduje się “cap” czyli “czapeczka” (jak zerkniecie w dokument WHO zobaczycie, że wręcz tak narysowano ten fragment). To raptem dwa nukleotydy (dwie literki kodu) G oraz A. Jest to symbol początkowy, konieczny by kod w ogóle mógł być wykonywany. W przypadku mRNA ten początek sygnalizuje komórce, że pochodzi on z jądra komórkowego (w tym wypadku jest to ściema).

Następnie 5’-UTR zwany końcem 5’, czyli początek (czy gdyby biolodzy nazwali to “końcówką 5 prim” byłoby mniej mylące?). To symbol początku właściwej treści kodu. Dla maszynerii komórkowej 5’-UTR znaczy “tu zacznij czytać” a znajdujący się pod koniec właściwej treści 3’-UTR (koniec 3’) oznacza “tu skończ czytać”. To “czytanie” nazywamy translacją, bo towarzyszy mu syntezowanie białka (znów po więcej mogę odesłać do notki Zderzenie dwóch kodów. Koniec 5’ to również miejsce na którym zaczepiają się rybosomy, czyli znajdujące się wewnątrz komórek “drukarki” białek.

Kolejna ciekawostka, którą można zobaczyć dopiero zerkając w sam kod jest obecność symbolu Ψ, który nie pasuje do znanych nam z RNA literek ACGU (w przypadku DNA ACGT). Ψ to pseudourydyna. Lata temu odkryto, że jeśli zastąpimy nią Uracyl w RNA, łatwiej takiemu RNA uniknąć naszego systemu immunologicznego.

Tu Bert Hubert dokonuje porównania z takim uszkodzeniem złośliwego kodu w oprogramowaniu, że zostaje on zignorowany przez firewall, ale jest wciąż dość sprawny, by wykonać swoje zadanie. Czy wirusy mogłyby również się wycwanić na tyle by używać Ψ? Nie. Raczej nie. Organizmy żywe, z tego co wiemy, nie potrafią wytwarzać pseudourydyny. Jako że wirusy używają naszych komórek by się reprodukować, nie bardzo jest możliwość by mogły jakoś umieścić pseudourydyny w swoim kodzie.

Przepis na wypustkę

Dotarliśmy do fragmentu kodu, który zawiera projekt kolców koronawirusa. Pod koniec stycznia 2020 dysponowaliśmy już całym kodem genetycznym 2019-nCoV. Znajduje się tam oczywiście projekt tego samego białka, jeśli by się mu przyjrzeć, zobaczymy że kod w szczepionce jest inny. I nie chodzi tylko o podmianę U na Ψ. W trójkach kodujących aminokwasy, gdzie tylko było to możliwe, twórcy szczepionki zamieniali Ψ/U na litery G lub C.

Istnieją 64 trzyliterowe kombinacje nukleotydów, ale jest tylko dwadzieścia aminokwasów. Wiele z nich można zakodować na kilka sposobów. Badania wykazały, że RNA w którym jest więcej literek G i C sprawniej produkują białka. Dlatego gdzie tylko się dało twórcy dokonywali takiej zmiany, aby ich szczepionka była bardziej wydajna.

To wciąż nie koniec zmian. W koronawirusie kolce są przyczepione do kapsydu. Jeśli nie są do niczego przyczepione białko zaczyna się źle składać, więc tak produkowane “swobodne” kolce powyginane nie dawałyby nam odporności na prawdziwego koronawirusa tylko na jakąś pokraczną wersję. W 2017 roku... Przy tej okazji warto przypomnieć - szczepionki mRNA nie wyskoczyły z kapelusza w 2020 roku, pracowano nad nimi od lat, ale dopiero w 2020 dostały potężny zastrzyk na badania. Wracając... W 2017 roku, badając między innymi wirusa MERS odkryto, że dodając prolinę (jeden z aminokwasów) w odpowiednim miejscu zapobiega się zapadnięciu kolca. Prolina to sztywny aminokwas więc zapewnia, że nasze komórki stworzą wierne kopie kolców 2019-nCoV.

Syntezuj. Tnij. Powtórz.

Na koniec, po końcu 3’ widzimy jeszcze fragment opisany jako poly(A). To tak zwana poliadenylacja, końcówka zawierajaca naprawdę dużo literek A. Dwadzieścia sześć potem coś i wreszcie jeszcze siedemdziesiąt. To bardzo ciekawy mechanizm. Ten ogonek koduje niejako “ilość powtórzeń” kodu. Coś jakby biologiczna pętla. mRNA może podlegać translacji wielokrotnie. Za każdym razem (po wyprodukowaniu każdego kolca) ten krzyczący ogonek zostaje przycięty i robi się coraz krótszy. Kiedy zostanie niemal całkowicie ścięty, mRNA ulega degradacji i podlega komórkowemu recyklingowi. Badania sugerują, że optymalna długość ogonka to 120 literek A, pewnie dlatego tu widzimy trzydzieści i po przerwie kolejnych siedemdziesiąt. Ta przerwa ponoć ułatwia sklejenie tak długich ogonków DNA.

Ufff… Fascynujące jak wiele wysiłku i owoców dekad nauki wydestylowano w postaci sekwencji literek, które spokojnie mieszczą się na dwóch stronach. Lepsze narzędzia, lepsze efekty. Oczywiście w powyższym tekście tylko drasnęliśmy wierzchołek góry lodowej. Nawet nie zająknąłem się o powłoczce lipidowej, która pozwala by delikatne mRNA mogło dotrzeć do naszych komórek ani o tysiącu innych rzeczy o których nie mam pojęcia.


PS. Wiem, wiem, translacja a nie synteza, ale chyba nie istnieje tryb rozkazujący czasownika od rzeczownika “translacja”.

PS2. Podcast trafił platformę Anchor.fm, pewnie będę wciąż wrzucał nagrania na Facebooka, YouTube - jeszcze do przemyślenia, bo na fanpage jednak i tak regularnie wrzucam materiały, YouTube stoi tylko i wyłącznie tymi nieregularnie powstającymi nagraniami.





5 komentarzy:

  1. Re: PS
    Może przetłumacz? Najbliższe spolszczenie ;))

    OdpowiedzUsuń
  2. Na stronie, którą podałeś też jest link do Polskiego tłumaczenie https://randomseed.pl/rna/reverse-engineering-kodu-zrodlowego-szczepionki-biontech-pfizer-covid-sars-cov-2/

    OdpowiedzUsuń
  3. Dosyć skomplikowany model. Ciężko to zrozumieć, nawet moje SQL oraz umiejętności programistyczne pozyskane na szkolenie sql katowice wymiękają.

    OdpowiedzUsuń
    Odpowiedzi
    1. Ojtam ojtam. Nagłówki standardowe od protokołu, tylko z podmienionym jednym znaczkiem żeby zmylić systemy ochronne, potem copy-paste z oryginalnego koronawirusa, z drobnymi optymalizacjami i stubem w miejscu przycięcia, znacznik końca bloku danych a potem tylko nawalone ile wlezie 'GOTO 1'.

      Usuń