Referencia genom - Reference genome

A humán referenciagenom első nyomatát könyvsorozatként mutatták be, a londoni Wellcome Collectionben

A referenciagenom (más néven referencia -összeállítás ) egy digitális nukleinsav -szekvencia -adatbázis, amelyet a tudósok állítottak össze reprezentatív példaként a faj egy idealizált egyedi szervezetének génkészletére . Ahogy vannak összeállítva a szekvenálása DNS származó számos egyedi donorok, hivatkozási genomok nem pontosan képviselik a génkészlet az egyetlen egyedi organizmusban. Ehelyett egy hivatkozás egy haploid mozaikot biztosít az egyes donorok különböző DNS -szekvenciáiról. Referenciagenomok vannak többféle vírus , baktérium , gomba , növény és állat számára .

Például a humán referenciagenom, a GRCh38 , a Genome Reference Consortiumból, tizenhárom névtelen önkéntesből származik.

Ahogy csökken a DNS -szekvenálás költsége , és új teljes genom -szekvenálási technológiák jelennek meg, további genomszekvenciák keletkeznek. A referenciagenomokat általában útmutatóként használják fel, amelyekre új genomokat építenek, lehetővé téve azok gyorsabb és olcsóbb összeszerelését, mint a kezdeti humán genomprojekt . A legtöbb egyén teljes genomjának szekvenálásával, például James D. Watson genomját ilyen módon állították össze. A genom nagy részében a referencia jó közelítést biztosít bármely egyed DNS -éhez. De azokban a régiókban, ahol nagy az allél diverzitás , mint például az emberben a fő hisztokompatibilitási komplex és az egerek fő vizeletfehérjéi , a referenciagenom jelentősen eltérhet más egyedektől. A referencia (36. felépítés) és Watson genomja közötti összehasonlítás 3,3 millió egyetlen nukleotid polimorfizmusbeli különbséget mutatott ki , míg DNS -ének körülbelül 1,4 százaléka egyáltalán nem volt illeszthető a referenciagenomhoz. Azoknál a régióknál, ahol ismert, hogy nagyarányú eltérések vannak, alternatív lókuszkészleteket kell összeállítani a referencia-lókusz mellett.

A referenciagenomok több helyen is elérhetők online, dedikált böngészők, például az Ensembl vagy az UCSC Genome Browser használatával .

A referenciagenomok tulajdonságai

A hosszúság mértékegységei

A genom hossza többféleképpen mérhető.

A genomhossz mérésének egyszerű módja a bázispárok számának számítása az összeállításban.

Az aranyút egy alternatív hosszúságmérő, amely kihagyja a redundáns régiókat, például a haplotípusokat és a pszeudoautoszomális régiókat . Általában úgy épül fel, hogy a szekvenálási információkat egy fizikai térképre rétegezi, hogy összeállítsa az állványinformációkat. Ez a „legjobb becslés” arra nézve, hogy a genom hogyan fog kinézni, és jellemzően hiányosságokat tartalmaz, így hosszabb, mint a tipikus bázispár.

Emlősök genomjai

A humán és egér referenciagenomokat a Genome Reference Consortium (GRC) tartja fenn és javítja , amely kevesebb mint 20 tudósból álló csoport számos genomkutató intézetből, beleértve az Európai Bioinformatikai Intézetet , a Nemzeti Biotechnológiai Információs Központot , a Sanger Intézetet és McDonnell Genome Institute at Washington University, St. Louis . A GRC tovább javítja a referenciagenomokat azáltal, hogy új igazításokat hoz létre, amelyek kevesebb rést tartalmaznak, és javítja a téves ábrázolásokat a sorozatban.

Emberi referencia genom

A GRCh38 humán referenciagenomot 2013. december 17 -én adták ki a Genome Reference Consortiumból . Ez a felépítés körülbelül 250 rést tartalmazott, míg az első verzió nagyjából 150 000 rést tartalmazott. A GRCh38 szerelvény több mint 100 rés bezárását vagy csökkentését látta. A nanopórus szekvenálás során a GRCh38 referenciaszerelvényben 12 rés záródott le ultra-hosszú leolvasások használatával.

Az emberi referenciagenom tizenhárom névtelen önkéntesből származik , New York állambeli Buffalo -ból . A donorokat a The Buffalo News 1997. március 23 -án, vasárnap megjelent hirdetése alapján toborozták . Az első tíz férfi és tíz női önkéntes meghívást kapott, hogy találkozzanak a projekt genetikai tanácsadóival, és adjanak vért, amelyből DNS -t vontak ki. A DNS -minták feldolgozásának eredményeként a referenciagenom mintegy 80 százaléka nyolc embertől származik, és egy férfi, az RP11 -nek jelölt, a teljes összeg 66 százalékát teszi ki. Az ABO vércsoport -rendszer eltér az emberek között, de a humán referenciagenom csak O allélt tartalmaz , bár a többi feliratos ).

Az emberi referenciagenomnak korlátai vannak, mivel ez "egyetlen" különálló szekvencia. Ezért kifejezetten "referenciaként" nevezték el. Ennek fő célja a genetikai jellemzők indexe vagy lokátorja. Az 1000 genom projekt létrehoz egy adatbázist, amely információt nyújt az emberi populáció genomváltozásairól.

A legújabb genom összeállítások a következők:

Kiadás neve kiadás dátuma Egyenértékű UCSC verzió
GRCh38 2013. dec hg38
GRCh37 2009. február hg19
NCBI Build 36.1 2006 márc hg18
NCBI Build 35 2004. május hg17
NCBI Build 34 2003. júl hg16

Egér referencia genom

A legújabb egérgenom -összeállítások a következők:

Kiadás neve kiadás dátuma Egyenértékű UCSC verzió
GRCm38 2011. dec mm10
NCBI Build 37 2007. júl mm9
NCBI Build 36 2006. február mm8
NCBI Build 35 2005. aug mm7
NCBI Build 34 2005 márc mm6

Hivatkozások

Külső linkek