Transcript
PODSTAWY BIOINFORMATYKI
2 SEKWENCJONOWANIE GENOMÓW
PROJEKTY POZNANIA INNYCH GENOMÓW Seria 1 300
250
251
254
w trakcie scalania
w trakcie realizacji
200
150
100
50 23 0 ukończone
SEKWENCJONOWANIE GENOMÓW 1. Sekwencjonowanie 2. Automatyzacja sekwencjonowania 3. Sekwencjonowanie całych genomów •
Metoda tradycyjna „BAC-to-BAC”
•
Metoda "shotgun"
•
Metoda "high throughoutput"
4. Zsekwencjonowane genomy - przykłady •
Człowiek
•
Mysz
•
Bydło
5. Zagadnienia bioinformatyczne
SEKWENCJONOWANIE
• Fred Sanger • 2 nagrody Nobla • Laboratory of Molecular Biology, Cambridge UK • 1970-te metoda sekwencjonowania • metoda zakończenia łańcucha DNA
SEKWENCJONOWANIE 1. W sekwencjonowaniu prowadzi się 4 osobne reakcje, kaŜda wykorzystuje: •
Wzorcową nić DNA
•
Primer
•
Polimerazę DNA
•
Deoksyrybonukleotydy
•
4 Dideoksyrybonukleotydy (kaŜdy w innej reakcji)
2. Denaturacja DNA na pojedyncze nici w temp. 94˚C 3. Przyłączenie primera w temp. 55˚C 4. Przyłączenie polimerazy w temp. 37˚C 5. Replikacja DNA
SEKWENCJONOWANIE 6. W przypadku przyłączenia dideoksynukleotydu następuje zakończenie replikacji - zakończenie łańcucha DNA 7. Przyłączenie dideoksynukleotydu jest losowe otrzymujemy zbiór łańcuchów DNA o róŜnej długości zakończonych np. adeniną 8. Lub innym nukleotydem (w pozostałych reakcjach) 9. Produkty reakcji są poddane elektroforezie - 4 osobne linie dla A, C, T i G 10. Droga wędrówki łańcuchów DNA przez Ŝel zaleŜy od ich długości
SEKWENCJONOWANIE 11. Wizualizacja pozycji poszczególnych fragmentów 12. Odczytywanie DNA - rozpoczynając od najkrótszych fragmentów = od dołu 13. Identyfikacja sekwencji nukleotydów 14. Typowa długość łańcucha 200-500 bp
SEKWENCJONOWANIE AUTOMATYCZNE
• Analiza całych genomów → automatyzacja procesu sekwencjonowania • Sekwenatory DNA → 384 próbki DNA, 24 analizy / doba
SEKWENCJONOWANIE AUTOMATYCZNE 1. Substraty do sekwencjonowania •
?
2. Denaturacja DNA 3. Przyłączenie primera 4. Przyłączenie polimerazy 5. Replikacja 6. Zakończenie 7. Łańcuchy DNA o róŜnych długościach 8. Sekwenator → elektroforeza 9. Sekwenator → odczytanie fluorescencji A, C, T lub G 10. Program → plik wynikowy
SEKWENCJONOWANIE CAŁYCH GENOMÓW
1. Metoda tradycyjna „BAC-to-BAC”
1980
Map based sequencing 2. Metoda „shotgun”
1997
Whole genome shotgun sequencing 3. Metoda nowej generacji Next generation sequencing
~2007
SEKWENCJONOWANIE GENOMÓW - SHOTGUN DEFRAGMENTACJA DNA
fragmenty oczyszczonego DNA 150-200 kb
losowo pocięte fragmenty DNA 2-4 kb
SEKWENCJONOWANIE GENOMÓW - SHOTGUN WPROWADZANIE DNA DO PLAZMIDU
SEKWENCJONOWANIE GENOMÓW - SHOTGUN WPROWADZANIE DNA DO GENOMU BAKTERII → REPLIKACJA → MILIARDY KOPII
SEKWENCJONOWANIE GENOMÓW - SHOTGUN SEKWENCJONOWANIE FRAGMENTÓW 1 000 bp
SEKWENCJONOWANIE GENOMÓW - SHOTGUN OSTATECZNY WYNIK - SEKWENCJA KONSENSUSOWA
SEKWENCJONOWANIE GENOMÓW - SHOTGUN PROGRAMY KOMPUTEROWE: •
Phrap → składanie zsekwencjonowanych fragmentów assembling
•
Consed → przygotowywanie ostatecznej sekwencji consensus sequence
SEKWENCJONOWANIE GENOMÓW – SHOTGUN:BAC-to-BAC
BAC-to-BAC
SHOTGUN
• Fragmentacja DNA: 150 kbp
• Fragmentacja DNA: 2 kbp
• Konstrukcja bibliotek BAC
• Konstrukcja bibliotek plazmidowych
• Konstrukcja ramowej mapy – kolejność fragmentów BAC
SEKWENCJONOWANIE GENOMÓW – SHOTGUN:BAC-to-BAC
BAC-to-BAC
SHOTGUN
• Fragmentacja BAC DNA – konstrukcja bibliotek M13
• Sekwencjonowanie bibliotek M13
• Sekwencjonowanie bibliotek plazmidowych
• Łączenie sekwencji
• Łączenie sekwencji
SEKWENCJONOWANIE GENOMÓW – NEXT GENERATION METODA NOWEJ GENERACJI •
Sekwencjonowanie bardzo krótkich fragmentów
•
100-500 bp
•
DNA unieruchomione na płytce
•
Szybkie
•
Tanie
•
Platformy: 454 technology, Solexa, SOLiD
ZSEKWENCJONOWANE GENOMY CZŁOWIEK
ZSEKWENCJONOWANE GENOMY - CZŁOWIEK ŹRÓDŁO DNA •
mieszanka DNA róŜnych dawców
•
♀/♂
•
Europa / Afryka / Ameryki (pn, centralna, pd) / Azja
•
Craig Venter
•
♂ plemniki
♀ krew
ZSEKWENCJONOWANE GENOMY - CZŁOWIEK ROZMIARY GENOMU 300
250
Mbp
200
150
100
50
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 X Y
chromosom
ZSEKWENCJONOWANE GENOMY - CZŁOWIEK ROZMIESZCZENIE GENÓW 35
30
gęstość ść genów
25
20
15
10
5
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 X Y
chromosom
ZSEKWENCJONOWANE GENOMY - CZŁOWIEK CHARAKTERYSTYKA • •
• • • • • • • •
Wielkość: 2.91 – 3.16 Gbp % par nukleotydów: A – T 54 % (ubogie w geny) G – C 38 % (bogate w geny) nieznane 9 % Elementy powtarzalne: 35-46 % genomu Liczba genów: 39 114 Chromosom najbogatszy w geny: 19 (23 geny/1Mbp) Chromosom najuboŜszy w geny: 13 (5 genów/1Mbp) Średnia długość genu: 27 000 – 40 000 bp NajdłuŜszy gen: 2 400 000 bp Gen o największej liczbie egzonów: titina (234) 1 gen koduje średnio 3 białka
ZSEKWENCJONOWANE GENOMY - CZŁOWIEK DALSZE BADANIA GENOMU •
59 % genów ma nieznaną funkcję wpływ genów na zdrowie wpływ na inne cechy człowieka współdziałanie pomiędzy genami imprinting
•
2 % genomu koduje białka poznanie funkcji pozostałej części genomu
•
Analiza mapy sprzęŜeniowej częstość crossing over u róŜnych płci rekombinacyjne hot- i coldspots
ZSEKWENCJONOWANE GENOMY - CZŁOWIEK
WYKORZYSTANIE ZDOBYTEJ WIEDZY •
medycyna rozwój metod diagnostycznych produkcja nowych (specyficznych) leków
•
antropologia badania ewolucji człowieka identyfikacja osobników: kontrola spokrewnienia, kryminalistyka
ZSEKWENCJONOWANE GENOMY MYSZ
ZSEKWENCJONOWANE GENOMY - MYSZ ZAWARTOŚĆ G+C
♦ człowiek
♦ mysz
ZSEKWENCJONOWANE GENOMY - MYSZ FUNKCJE BIAŁEK
■ człowiek ■ mysz
ZSEKWENCJONOWANE GENOMY - MYSZ
CHARAKTERYSTYKA • • • •
Wielkość: 2.5 Gbp Elementy powtarzalne: 38% genomu Liczba genów: 30 000 99% genów myszy ma homologi u człowieka
ZSEKWENCJONOWANE GENOMY BYDŁO
ZSEKWENCJONOWANE GENOMY - BYDŁO Dominette, Hereford
Norwegian red
ZSEKWENCJONOWANE GENOMY - BYDŁO QTL: 1 050 QTL, 91 cech 250
Liczba QTL
200
150
100
50
0
cecha
ZAGADNIENIA BIOINFORMATYCZNE 1. Łączenie fragmentów DNA • Błędy odczytu sekwencji • Niekompletne pokrycie genomu • Sekwencje powtarzalne • Polimorfizm • rozmiary danych • Programy: Celera Assembler, Jazz, Arachne, Phrap 2. Anotacja genomu • identyfikacja strukturalnych i funkcjonalnych elementów genomu • Programy: Basic Local Alignment Search Tool (BLAST)
1. Sekwencjonowanie 2. Automatyzacja sekwencjonowania 3. Sekwencjonowanie całych genomów •
Metoda tradycyjna „BAC-to-BAC”
•
Metoda "shotgun"
•
Metoda "high throughoutput"
4. Zsekwencjonowane genomy - przykłady •
Człowiek
•
Mysz
•
Bydło
5. Zagadnienia bioinformatyczne