Źródło życia i ewolucji
Marek Zagulski   
czwartek, 09 sierpnia 2012 14:56

Kwas deoksyrybonukleinowy (DNA) występuje we wszystkich otaczających nas organizmach oraz w nas samych (dla człowieka to 2 x 3 mld liter kodu genetycznego – informacji genetycznej, co odpowiada 1,5 terabajtom i stanowi około 0,6 kg naszego ciała). Zapis zawarty w DNA i niesiony przez komórki naszego organizmu jest biologicznym odpowiednikiem oprogramowania komputerowego, zawierającego wszystkie informacje niezbędne do jej budowy, działania czy powielania.

Cała biosfera powstała z pierwotnej komórki dzięki modyfikacjom adaptacyjnym tego oprogramowania. Modyfikacje zapisu genetycznego od pojedynczych mutacji, delecji lub amplifikacji fragmentów kodu aż do kopiowania całego zapisu (duplikowania) były i są efektem błędów przy przepisywaniu informacji genetycznej w procesach podziałów komórkowych. Czynniki środowiskowe, takie jak promieniowanie czy agresywne związki chemiczne, mogły i nadal mogą, obniżając jakość procesu kopiowania, zwiększać liczbę błędów. Liczba mutacji, które świadczą o naszej różnorodności, to 1,6 mln różnic pomiędzy każdym z nas, w tym w sekwencji kodującej geny - około 80 tys.

Ewolucja jest historią zmian DNA. Informacja o genach, dotycząca całej biosfery, jest dziedzictwem ludzkości. Genom każdego z nas jest dziedzictwem przekazanym przez przodków. „Dobre” czy „złe” geny, które dostaliśmy za pośrednictwem rodziców, decydują o naszym życiu. Cechy naszego organizmu, takie jak wygląd, zdolności, podatność na choroby, odpowiedź na leczenie czy nawet w pewnej części cechy charakteru, które uważamy za naturalne, powstały w wyniku wymieszania cech naszych przodków.

Najpotężniejsze banki genów mają obecnie postać informatyczną. Dzięki rozwojowi procesu odczytywania DNA (sekwencjonowania) już w latach 80. zeszłego wieku powstały serwery zbierające napływające od naukowców z całego świata odczytane fragmenty zapisu DNA różnych organizmów (np. GeneBank). Tempo rozwoju technik odczytywania sekwencji DNA w 2008 roku (http://medgadget.com/2011/05/dna-sequencing-beating-moores-law.html) przekroczyło tempo rozwoju wydajności procesorów. W chwili obecnej w GeneBanku jest zdeponowanych ponad 126 mld odczytanych liter informacji genetycznej.

Wraz z rozwojem technologii nauczyliśmy się odczytywać całe genomy. Rozpoczynając od genomu drożdży w 1996, poprzez genom człowieka, obecnie w bazach danych mamy prawie 10 000 genomów. Projekt sekwencjonowania genomu człowieka, który trwał w latach 2001 – 2007, był wykonywany jeszcze z wykorzystaniem starej technologii (tzw. maszyn I generacji). Odczytanie 2 x 3 mld liter kodu i ustalenie ich kolejności trwało 6 lat i kosztowało ponad 3 mld $. Pojawienie się pierwszych maszyn II generacji skróciło ten proces do 1 roku i obniżyło cenę do 1 mln $ (kwiecień 2008 – publikacja genomu Jamesa Watsona, laureata Nagrody Nobla). W chwili obecnej koszt sekwencjonowania genomu człowieka w ramach większych projektów to około 5000 $, a czas wykonania –7 dni.

Ze względu na błyskawiczne tempo rozwoju sekwencjonowania, a zwłaszcza liczbę maszyn II generacji, trudno dziś określić, ile indywidualnych genomów ludzkich zostało już odczytanych i jest analizowanych. Prawdopodobnie na dzień dzisiejszy jest to kilka tysięcy genomów, w roku przyszłym będzie ich kilkadziesiąt tysięcy.

Samo odczytanie genomu indywidualnego pacjenta niczego nie wnosi. Proces analizy odczytu poprzez rozpoznanie indywidualnych różnic, zidentyfikowanie tych, które mają wartość diagnostyczną (ok. 70 000), ustalenie ich istotności klinicznej, następnie porównanie z bazami zawierającymi informacje na temat ponad 4000 jednostek chorobowych, wreszcie przygotowanie raportu z wykonanej analizy wraz z interpretacją adekwatną do aktualnego stanu wiedzy medycznej, jest żmudny i wymaga doskonałej współpracy ekspertów z dziedziny biologii molekularnej, informatyków, diagnostów i lekarzy. O ile możemy prognozować, że już w przyszłym roku cena sekwencjonwania naszego genomu może spaść do 1 tys. dolarów, o tyle walidacja procesu przetwarzania informacji istotnej z punktu widzenia medycznego jest jeszcze w powijakach. Rozwój informatycznych zintegrowanych systemów analizy genomów, opartych na Artificial Inteligence, jest w tej chwili najważniejszym wyzwaniem wszystkich firm i ośrodków naukowych zajmujących się diagnostyczną stroną technologii genomowej.