Referencia genom - Reference genome
A referenciagenom (más néven referencia -összeállítás ) egy digitális nukleinsav -szekvencia -adatbázis, amelyet a tudósok állítottak össze reprezentatív példaként a faj egy idealizált egyedi szervezetének génkészletére . Ahogy vannak összeállítva a szekvenálása DNS származó számos egyedi donorok, hivatkozási genomok nem pontosan képviselik a génkészlet az egyetlen egyedi organizmusban. Ehelyett egy hivatkozás egy haploid mozaikot biztosít az egyes donorok különböző DNS -szekvenciáiról. Referenciagenomok vannak többféle vírus , baktérium , gomba , növény és állat számára .
Például a humán referenciagenom, a GRCh38 , a Genome Reference Consortiumból, tizenhárom névtelen önkéntesből származik.
Ahogy csökken a DNS -szekvenálás költsége , és új teljes genom -szekvenálási technológiák jelennek meg, további genomszekvenciák keletkeznek. A referenciagenomokat általában útmutatóként használják fel, amelyekre új genomokat építenek, lehetővé téve azok gyorsabb és olcsóbb összeszerelését, mint a kezdeti humán genomprojekt . A legtöbb egyén teljes genomjának szekvenálásával, például James D. Watson genomját ilyen módon állították össze. A genom nagy részében a referencia jó közelítést biztosít bármely egyed DNS -éhez. De azokban a régiókban, ahol nagy az allél diverzitás , mint például az emberben a fő hisztokompatibilitási komplex és az egerek fő vizeletfehérjéi , a referenciagenom jelentősen eltérhet más egyedektől. A referencia (36. felépítés) és Watson genomja közötti összehasonlítás 3,3 millió egyetlen nukleotid polimorfizmusbeli különbséget mutatott ki , míg DNS -ének körülbelül 1,4 százaléka egyáltalán nem volt illeszthető a referenciagenomhoz. Azoknál a régióknál, ahol ismert, hogy nagyarányú eltérések vannak, alternatív lókuszkészleteket kell összeállítani a referencia-lókusz mellett.
A referenciagenomok több helyen is elérhetők online, dedikált böngészők, például az Ensembl vagy az UCSC Genome Browser használatával .
A referenciagenomok tulajdonságai
A hosszúság mértékegységei
A genom hossza többféleképpen mérhető.
A genomhossz mérésének egyszerű módja a bázispárok számának számítása az összeállításban.
Az aranyút egy alternatív hosszúságmérő, amely kihagyja a redundáns régiókat, például a haplotípusokat és a pszeudoautoszomális régiókat . Általában úgy épül fel, hogy a szekvenálási információkat egy fizikai térképre rétegezi, hogy összeállítsa az állványinformációkat. Ez a „legjobb becslés” arra nézve, hogy a genom hogyan fog kinézni, és jellemzően hiányosságokat tartalmaz, így hosszabb, mint a tipikus bázispár.
Emlősök genomjai
A humán és egér referenciagenomokat a Genome Reference Consortium (GRC) tartja fenn és javítja , amely kevesebb mint 20 tudósból álló csoport számos genomkutató intézetből, beleértve az Európai Bioinformatikai Intézetet , a Nemzeti Biotechnológiai Információs Központot , a Sanger Intézetet és McDonnell Genome Institute at Washington University, St. Louis . A GRC tovább javítja a referenciagenomokat azáltal, hogy új igazításokat hoz létre, amelyek kevesebb rést tartalmaznak, és javítja a téves ábrázolásokat a sorozatban.
Emberi referencia genom
A GRCh38 humán referenciagenomot 2013. december 17 -én adták ki a Genome Reference Consortiumból . Ez a felépítés körülbelül 250 rést tartalmazott, míg az első verzió nagyjából 150 000 rést tartalmazott. A GRCh38 szerelvény több mint 100 rés bezárását vagy csökkentését látta. A nanopórus szekvenálás során a GRCh38 referenciaszerelvényben 12 rés záródott le ultra-hosszú leolvasások használatával.
Az emberi referenciagenom tizenhárom névtelen önkéntesből származik , New York állambeli Buffalo -ból . A donorokat a The Buffalo News 1997. március 23 -án, vasárnap megjelent hirdetése alapján toborozták . Az első tíz férfi és tíz női önkéntes meghívást kapott, hogy találkozzanak a projekt genetikai tanácsadóival, és adjanak vért, amelyből DNS -t vontak ki. A DNS -minták feldolgozásának eredményeként a referenciagenom mintegy 80 százaléka nyolc embertől származik, és egy férfi, az RP11 -nek jelölt, a teljes összeg 66 százalékát teszi ki. Az ABO vércsoport -rendszer eltér az emberek között, de a humán referenciagenom csak O allélt tartalmaz , bár a többi feliratos ).
Az emberi referenciagenomnak korlátai vannak, mivel ez "egyetlen" különálló szekvencia. Ezért kifejezetten "referenciaként" nevezték el. Ennek fő célja a genetikai jellemzők indexe vagy lokátorja. Az 1000 genom projekt létrehoz egy adatbázist, amely információt nyújt az emberi populáció genomváltozásairól.
A legújabb genom összeállítások a következők:
Kiadás neve | kiadás dátuma | Egyenértékű UCSC verzió |
---|---|---|
GRCh38 | 2013. dec | hg38 |
GRCh37 | 2009. február | hg19 |
NCBI Build 36.1 | 2006 márc | hg18 |
NCBI Build 35 | 2004. május | hg17 |
NCBI Build 34 | 2003. júl | hg16 |
Egér referencia genom
A legújabb egérgenom -összeállítások a következők:
Kiadás neve | kiadás dátuma | Egyenértékű UCSC verzió |
---|---|---|
GRCm38 | 2011. dec | mm10 |
NCBI Build 37 | 2007. júl | mm9 |
NCBI Build 36 | 2006. február | mm8 |
NCBI Build 35 | 2005. aug | mm7 |
NCBI Build 34 | 2005 márc | mm6 |