Transcript
Nowoczesne systemy ekspresji genów
Ekspresja genów w organizmach żywych
GEN - pojęcia podstawowe promotor
sekwencja kodująca RNA
terminator
gen
Gen - odcinek DNA zawierający zakodowaną informację wystarczającą do wytworzenia jednego rodzaju białka (definicja jest prawdziwa w odniesieniu do większości genów komórki, ale istnieją też geny, które kodują na przykład cząsteczki rRNA i tRNA) Cistron - sekwencja kodująca RNA, której ekspresja prowadzi do powstania pojedynczego łańcucha polipeptydowego
GEN - pojęcia podstawowe
Promotor Część genu, do której przyłączają się czynniki transkrypcyjne i polimeraza RNA. Jest jedną z części regulatorowych genu. Od przyłączenia polimerazy RNA do promotora rozpoczyna się transkrypcja Terminator Odcinek genu, na którym kończy się transkrypcja
GEN - pojęcia podstawowe
Sekwencje
regulatorowe – części genu, które nie zawierają informacji genetycznej, ale kierują jej odczytywaniem wzmacniacze ekspresji (Wz) wygaszacze ekspresji (Wy) inne - niezwiązane z działaniem czynników transkrypcyjnych, np. sekwencje liderowe DNA
Ekspresja genów Ekspresja genów może zachodzić z różną wydajnością w zależności od środowiska i warunków gen a
A
A
gen b
A
A
A
A
B
Ekspresja genów w organizmach prokariotycznych i eukariotycznych Prokariota
Eukariota
Transkrypcja
Transkrypcja
Transkrypcja jest połączona z translacją Geny transkrybowane są przez jeden rodzaj polimerazy RNA Pod kontrolą jednego promotora może znajdować się więcej niż jeden cistron – taką jednostkę ekspresyjną nazywamy operonem
Transkrypcja jest rozdzielona od translacji Geny są transkrybowane przez trzy różne polimerazy RNA Pod kontrolą jednego promotora znajduje się jeden cistron
Systemy ekspresji (nadekspresji) genów
Nadekspresja białek - sens zastosowania Eksperyment – badanie represora lac 10 cząstek białka w jednej komórce
1 μmol cząsteczek potrzebny do badań biochemicznych
1 μmol = 6x1017 cząsteczek białka Czyli do eksperymentu potrzeba 6x1016 komórek
1
litr hodowli E. coli w fazie stacjonarnej zawiera ~4x1011 komórek
Czyli (zakładając 100% wydajność procesu oczyszczania)
1 μmol represora lac = 150000 litrów hodowli E. coli
Zastosowanie Badania
podstawowe: określenie struktury białek (NMR, krystalografia)
enzymologia
manipulacje genetyczne (mutageneza) badanie oddziaływań międzycząsteczkowych
Zastosowania
terapeutyczne i komercyjne:
medycyna diagnostyka przemysł chemiczny przemysł spożywczy
Schemat postępowania Klonowanie
eukariotycznego cDNA lub genu prokariotycznego (Przeklonowanie sekwencji do wektora ekspresyjnego) Przeniesienie konstruktu do komórek gospodarza/komórek Charakterystyka produktu (białka): oczyszczanie testy enzymatyczne
Przygotowanie do eksperymentu
Wybór gospodarza systemy in vivo (przykłady)
Escherichia coli Saccharomyces cerevisiae Pichia pastoris hodowla tkankowa komórek ssaczych organizmy transgeniczne
wyspecjalizowane systemy in vitro
Przygotowanie do eksperymentu Wybór
wektora wydajność sposób oczyszczania modyfikacje potranslacyjne konieczność przeprowadzenia modyfikacji genu/cDNA koszt stopień trudności
http://www.biotechnantes.com/Conferences/Business%201/Jeudi/14h00/02%20Thiry.pdf#search=%22protein%20expression%20systems%20ppt%22
http://www.biotechnantes.com/Conferences/Business%201/Jeudi/14h00/02%20Thiry.pdf#search=%22protein%20expression%20systems%20ppt%22
Przygotowanie do eksperymentu
wybór
protokołu klonowania/ekspresji rodzaj białka rozpuszczalność i stabilność białka miejsce produkcji białka (cytoplazma, pożywka) sposób oczyszczania białka
Etap I – poszukiwanie informacji
Źródła informacji gdy sekwencja genu jest znana
1. ― ―
Publikacje naukowe zawierają informacje o systemach ekspresyjnych użytych do ekspresji danego genu powinny zawierać odnośnik do sekwencji genu w postaci tzw. „Accession No.” dla wybranej bazy danych dostępnej w internecie np. NCBI (www.ncbi.nih.gov)
Źródła informacji gdy sekwencja genu jest znana 2. ―
―
Bazy sekwencji nukleotydowych NCBI: National Centre for Biotechnology Information (Rockville Pike, Bethesda) Dostęp do sekwencji genów można uzyskiwać poprzez: podanie accession no. uzyskany z publikacji (Vonakis et al. J. Biol. Chem. 272 (38), 24072-24080 (1997)) Accession No: AF000301
Jak zdobyć informacje o genie jeśli sekwencja jego nie jest znana – ale znana jest sekwencja białka lub jej fragmenty
Sekwencję białka mozna poznać dysponując jego czystym preparatem dzięki ograniczonej proteolizie i sekwencjonowaniu uzyskanych peptydów
Jak zdobyć informacje o genie jeśli jego sekwencja nie jest znana W oparciu o sekwencje białka można zaprojektować zdegenerowane startery, które użyjemy w reakcji PCR i uzyskamy:
Który prążek wybrać do sekwencjonowania???
Należy oprzeć się o przybliżenie: 1 kD białka – 333 par zasad DNA i znaną masę białka (w kD)
Jak zdobyć informacje o genie jeśli sekwencja jego nie jest znana i nie jest znana sekwencja białka ale:
Znamy właściwości fizykochemiczne białka, przede wszystkim jego Mw:
W przypadku Prokariota możemy stworzyć bibliotekę DNA genomowego w celu uzyskania sekwencji W przypadku Eukariota możemy stworzyć bibliotekę DNA genomowego w celu uzyskania sekwencji
Jak zdobyć informacje o genie jeśli nie jest znana jego sekwencja, ani sekwencja kodowanego przez niego białka
Wykorzystując dane uzyskane z bibliotek cDNA możemy uzyskać sekwencję genów interesujących nas białek
Jak zdobyć informacje o genie, jeśli znamy tylko jego źródło? Istnieje możliwość zastosowania zasady genomiki porównawczej:
Odnalezienie informacji o dostępności sekwencji analogicznych genów z najbliższych „taksonomicznie” krewnych Porównanie sekwencji nukleotydowych wybranych genów z organizmów pokrewnych do organizmu źródłowego
Programy komputerowe
Gene doc
Programy komputerowe VectorNTI (INVITROGEN)
Contig Express AlignX
AlignX MfAJ252337 McAY213657 MeAJ252330 rubrumAJ270808 Consensus
(1) (1) (1) (1) (1) (1)
(255) MfAJ252337(222) McAY213657(245) MeAJ252330(222) rubrumAJ270808(219) Consensus(255)
1
10
20
30
40
50
60
70
80
-------------------------------ATCATTAACGCGCAAGAGGTCGAAGTTGGCCCCCGAAGCTCTTCCGTCTCCCCCC --------TCCGTAGGTGAACCTGCGGAAGGATCATTAACGCGCAAGAGGTCGAAGTTGGCCCCCGAAGCTCTTCCGTCTCCCCCC -------------------------------ATCATTAACGCGCAAGAGGTCGAAGTTGGCCCCCGAAGCTCTTCCGTCTCCCCCC ACAAGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTAACGCGCNGGCCG--GAGGCTGGCCCCCCACGAT---A----------TCCGTAGGTGAACCTGCGGAAGGATCATTAACGCGCAAGAGGTCGAAGTTGGCCCCCGAAGCTCTTCCGTCTCCCCCC 255
260
270
280
290
300
310
320
CGCTCGCCGGAGGATTACTCTGGAAAACACACTCTTGAAAGAACATACCGTCTGAGCG---AGCAACGCAAAT CGCTCGCCGGAGGATTACTCTGGAAAACACACTCTTGAAAGAACATACCGTCTGAGCG---AGCAACGCAAAT CGCTCGCCGGAGGATTACTCTGGAAAACACACTCTTGAAAGAACATACCGTCTGAGCG---AGCAACGCAAAT CGCCCGCCGGAGGACAGACACCAAGAAAAAATTCTCTGAAGAGCTGTCAGTCTGAGCGTTTAGCAAGCACAAT CGCTCGCCGGAGGATTACTCTGGAAAACACACTCTTGAAAGAACATACCGTCTGAGCG AGCAACGCAAAT