RAID - RAID

A RAID ( / r d / ; " Olcsó lemezek redundáns tömbje " vagy " Független lemezek redundáns tömbje ") egy adattároló virtualizációs technológia, amely több fizikai lemezmeghajtó összetevõjét ötvözi egy vagy több logikai egységbe az adatok redundanciája céljából , a teljesítmény javítása, vagy mindkettő. Ez ellentétben állt a rendkívül megbízható nagygépes meghajtók korábbi koncepciójával, amelyet "egyetlen nagy, drága lemeznek" (SLED) neveznek.

Az adatokat a meghajtókon többféleképpen osztják szét, RAID-szintnek nevezik, a redundancia és a teljesítmény szükséges szintjétől függően . A különböző sémákat vagy adatelosztási elrendezéseket a "RAID" szóval nevezik, amelyet egy szám követ, például RAID 0 vagy RAID 1. Minden séma vagy RAID-szint eltérő egyensúlyt biztosít a fő célok között: megbízhatóság , elérhetőség , teljesítmény és kapacitás . A RAID 0-nál nagyobb RAID-szintek védelmet nyújtanak a helyrehozhatatlan szektorolvasási hibák ellen, valamint a teljes fizikai meghajtók meghibásodása ellen.

Történelem

A „RAID” találta David Patterson , Garth A. Gibson , és Randy Katz , a University of California, Berkeley 1987-ben a június 1988 papír „A tok redundáns tömbje olcsó lemezek (RAID)”, bemutatták a SIGMOD konferencián azzal érveltek, hogy az akkori legjobban teljesítő nagygépes lemezmeghajtókat teljesítményükön felül lehetne verni az olcsó meghajtók tömbjével, amelyeket a növekvő személyi számítógéppiac számára fejlesztettek ki . Bár a meghibásodások a meghajtók számával arányosan növekednének, a redundancia beállításával a tömb megbízhatósága jóval meghaladhatja bármelyik nagy egyetlen meghajtóét.

Noha még nem használta ezt a terminológiát, a RAID 1988 júniusi cikkében megnevezett öt szintjének technológiáját a cikk megjelenése előtt különféle termékekben használták, beleértve a következőket:

  • A tükrözés (RAID 1) jól bevált az 1970-es években, beleértve például a Tandem NonStop Systems rendszert is .
  • 1977-ben Norman Ken Ouchi az IBM-nél szabadalmat nyújtott be, amelyben feltárta a később RAID 4 nevet.
  • 1983 körül a DEC HSC50 alrendszerének részeként megkezdte az alrendszer tükrös RA8X lemezmeghajtók (ma RAID 1 néven ismert) szállítását.
  • 1986-ban Clark és mtsai. az IBM-nél szabadalmat nyújtott be, amelyben feltárta a később RAID 5 nevet.
  • 1988 körül a Thinking Machines DataVault hibajavító kódokat (ma RAID 2 néven ismert) használt egy lemezmeghajtó tömbben. Hasonló megközelítést alkalmaztak az 1960-as évek elején az IBM 353-on is .

Az ipargyártók később újradefiniálták a RAID betűszavát, hogy a "Redundant Array of Independent Disks" kifejezésre utaljanak.

Áttekintés

Számos RAID-szint használ egy " paritás " nevű hibavédelmi sémát , amely az informatikában széles körben alkalmazott módszer a hibatűrés biztosítására egy adott adatsorban. A legtöbben egyszerű XOR-t használnak , de a RAID 6 két külön paritást használ az összeadás és a szorzás alapján egy adott Galois-mezőben vagy a Reed – Salamon hibajavításban .

A RAID a szilárdtestalapú meghajtókkal (SSD) is biztonságot nyújthat az all-SSD rendszer költsége nélkül. Például a gyors SSD tükrözhető mechanikus meghajtóval. Ahhoz, hogy ez a konfiguráció jelentős sebességelőnyt biztosítson, megfelelő vezérlőre van szükség, amely a gyors SSD-t használja az összes olvasási művelethez. Az Adaptec ezt "hibrid RAID" -nek hívja.

Normál szintek

Tárolószerverek 24 merevlemez-meghajtóval és beépített hardver RAID-vezérlőkkel, amelyek támogatják a különböző RAID-szinteket

Eredetileg öt standard RAID-szint volt, de sok variáció alakult ki, köztük több beágyazott szint és sok nem szabványos (többnyire saját ) szint . A RAID szinteket és a hozzájuk tartozó adatformátumokat a Storage Networking Industry Association (SNIA) szabványosítja a Common RAID Disk Drive Format (DDF) szabványban:

A RAID 0 csíkozásból áll , de nincs tükrözés vagy paritás . A lefedett térfogathoz képest a RAID 0 kötet kapacitása megegyezik; a készletben lévő meghajtók kapacitásának összege. De mivel a csíkozás elosztja az egyes fájlok tartalmát a készlet összes meghajtója között, bármely meghajtó meghibásodása a teljes RAID 0 kötet és az összes fájl elveszését okozza. Ehhez képest egy átfedett kötet megőrzi a fájlokat a nem működő meghajtókon. Az előny a RAID 0, hogy az átmenő olvasási és írási műveletek bármilyen fájlt meg kell szorozni a meghajtók számát, mert ellentétben átnyúló kötet, olvas és ír történik egyidejűleg . Ennek költsége megnövekedett sérülékenység a meghajtó meghibásodásai miatt - mivel a RAID 0 telepítésének meghibásodása esetén a teljes kötet elveszik, a kötet átlagos meghibásodási aránya a csatolt meghajtók számával együtt nő.

A RAID 1 adat tükrözésből áll, paritás és csíkozás nélkül. Az adatokat két vagy több meghajtóra azonos módon írják, így létrehozva a meghajtók "tükrözött készletét". Így bármilyen olvasási kérést a készlet bármely meghajtója képes kiszolgálni. Ha egy kérést sugároznak a készlet minden meghajtójára, akkor azt a meghajtó tudja kiszolgálni, amelyik először hozzáfér az adatokhoz (annak keresési idejétől és forgási késésétől függően ), ezzel javítva a teljesítményt. A tartós olvasási sebesség, ha a vezérlőt vagy a szoftvert arra optimalizálták, megközelíti a készlet minden meghajtójának teljesítőképességét, ugyanúgy, mint a RAID 0 esetében. A legtöbb RAID 1 megvalósítás tényleges olvasási sebessége lassabb, mint a leggyorsabb meghajtó. Az írási sebesség mindig lassabb, mert minden meghajtót frissíteni kell, és a leglassabb meghajtó korlátozza az írási teljesítményt. A tömb addig működik, amíg legalább egy meghajtó működik.

A RAID 2 bitszintű csíkozásból áll, dedikált Hamming-kód paritással. Az összes lemezorsó forgása szinkronizálva van, és az adatok sávosak, így minden egyes szekvenciális bit más meghajtón van. A Hamming-kód paritást a megfelelő bitekre számolják, és legalább egy paritásmeghajtón tárolják. Ez a szint csak történelmi jelentőségű; noha néhány korai gépen (például a Thinking Machines CM-2) használták, 2014-től egyetlen kereskedelemben kapható rendszer sem használja.

A RAID 3 bájt szintű csíkozásból áll, külön paritással. Az összes lemezorsó forgása szinkronizálva van, és az adatok sávosak, így az egyes szekvenciális bájtok különböző meghajtón vannak. A paritás kiszámítása a megfelelő bájtokon keresztül történik, és dedikált paritásmeghajtón tárolódik. Bár megvalósítások léteznek, a RAID 3-at a gyakorlatban nem szokták használni.

A RAID 4 blokkszintű csíkozásból áll, külön paritással. Ezt a szintet korábban a NetApp használta , de mára nagyrészt felváltotta a RAID 4 saját fejlesztésű megvalósítása két paritásos lemezzel, az úgynevezett RAID-DP . A RAID 4 fő előnye a RAID 2-vel és 3-mal szemben az I / O párhuzamosság: a RAID 2-ben és 3-ban egyetlen olvasási I / O művelethez az adatmeghajtók teljes csoportjának olvasása szükséges, míg a RAID 4-ben egy I / O olvasási művelet nem kell elterjednie az összes adatmeghajtón. Ennek eredményeként több I / O művelet hajtható végre párhuzamosan, javítva a kis transzferek teljesítményét.

A RAID 5 blokk szintű csíkozásból áll, elosztott paritással. A RAID 4-től eltérően a paritásinformáció a meghajtók között oszlik meg, működésükhöz csak egy meghajtó szükséges. Egyetlen meghajtó meghibásodása esetén a későbbi olvasások kiszámíthatók az elosztott paritásból úgy, hogy nem vesznek el adatok. A RAID 5 legalább három lemezt igényel. Mint minden egyparitásos koncepció, a nagy RAID 5 implementációk is hajlamosak a rendszerhibákra a tömb újjáépítési idejének tendenciái és a meghajtó meghibásodásának esélye miatt az újjáépítés során (lásd alább az " Újjáépítési idő és a meghibásodás valószínűségének növelése " részt). A tömb újjáépítéséhez meg kell olvasni az összes adatot az összes lemezről, meg kell nyitni a második meghajtó meghibásodását és a teljes tömb elvesztését.

A RAID 6 blokkszintű csíkozásból áll, kettős elosztással. A kettős paritás két hibás meghajtó hibatűrését biztosítja. Ez praktikusabbá teszi a nagyobb RAID-csoportokat, különösen a magas rendelkezésre állású rendszerek esetében, mivel a nagy kapacitású meghajtók helyreállítása hosszabb ideig tart. A RAID 6 minimum négy lemezt igényel. A RAID 5-hez hasonlóan egyetlen meghajtó meghibásodása a teljes tömb teljesítményének csökkenését eredményezi mindaddig, amíg a meghibásodott meghajtót ki nem cserélik. RAID 6 tömb alkalmazásával, több forrásból és gyártótól származó meghajtók felhasználásával, enyhíteni lehet a RAID 5 problémáinak többségét. Minél nagyobb a meghajtókapacitás és minél nagyobb a tömb mérete, annál fontosabbá válik a RAID 6 kiválasztása helyett A RAID 10 szintén minimalizálja ezeket a problémákat.

Beágyazott (hibrid) RAID

Az eredetileg hibrid RAID- nek nevezett sok tárolóvezérlő lehetővé teszi a RAID-szintek beágyazását. A RAID elemei lehetnek önálló meghajtók vagy maguk is tömbök. A tömbök ritkán vannak beágyazva egy szintnél mélyebbre.

A végső tömb felső tömb néven ismert. Ha a legfelső tömb RAID 0 (például RAID 1 + 0 és RAID 5 + 0 esetén), akkor a legtöbb gyártó kihagyja a "+" jelet ( RAID 10, illetve RAID 50 eredményez).

  • RAID 0 + 1: két csíkot hoz létre és tükrözi őket. Ha egyetlen meghajtó meghibásodik, akkor az egyik tükör meghibásodott, ezen a ponton RAID 0 néven fut redundancia nélkül. Az újjáépítés során lényegesen nagyobb kockázatot jelentenek, mint a RAID 1 + 0, mivel a fennmaradó sáv összes meghajtójának összes adatait nem csak egy meghajtóról kell olvasni, ez növeli a helyrehozhatatlan olvasási hiba (URE) esélyét és jelentősen kiterjeszti az újjáépített ablak.
  • RAID 1 + 0: (lásd: RAID 10 ) csíkos készletet hoz létre tükrözött meghajtók sorozatából. A tömb több meghajtóveszteséget képes fenntartani, amíg egyetlen tükör sem veszíti el az összes meghajtót.
  • JBOD RAID N + N: A JBOD ( csak egy csomó lemez ) használatával lehetséges összefűzni a lemezeket, de köteteket is, például a RAID készleteket. Nagyobb meghajtókapacitások mellett az írási késleltetés és az újjáépítési idő drámaian megnő (különösen, amint azt a fentiekben leírtuk, RAID 5 és RAID 6 esetén). Ha egy nagyobb RAID N készletet kisebb részhalmazokra bont és lineáris JBOD-kal összefűz, akkor az írási és újjáépítési idő csökken. Ha egy hardveres RAID-vezérlő nem képes a lineáris JBOD és a RAID N beágyazására, akkor a lineáris JBOD elérhető OS-szintű RAID szoftverrel kombinálva különálló RAID N-részhalmazokkal, amelyek egy vagy több hardveres RAID-vezérlőn belül jöttek létre. A drasztikus sebességnövekedés mellett ez egy lényeges előnyt is kínál: egy lineáris JBOD indítását egy kis lemezkészlettel és a teljes készlet bővítését különböző méretű lemezekkel, később (idővel nagyobb méretű lemezekkel). méret válik elérhetővé a piacon). Van még egy előny a katasztrófa utáni helyreállítás formájában (ha egy RAID N részhalmaz meghiúsul, akkor a többi RAID N részhalmaz adatai nem vesznek el, csökkentve ezzel a helyreállítási időt).

Nem szabványos szintek

Az alapvető számozott RAID-szinteken kívül számos konfiguráció lehetséges, és sok vállalat, szervezet és csoport létrehozta saját, nem szabványos konfigurációit, amelyeket sok esetben egy kis réscsoport speciális igényeinek kielégítésére terveztek. Az ilyen konfigurációk a következőket tartalmazzák:

  • A Linux MD RAID 10 egy általános RAID illesztőprogramot kínál, amely "közeli" elrendezésében alapértelmezés szerint egy két meghajtóval rendelkező standard RAID 1 és négy meghajtóval rendelkező standard RAID 1 + 0; azonban tetszőleges számú meghajtót tartalmazhat, beleértve a páratlan számokat is. A "távoli" elrendezésével az MD RAID 10 csíkos és tükrözött is futtatható, még csak két meghajtó f2elrendezésében is; ez csíkos olvasásokkal tükrözi a tükrözést, ami a RAID 0 olvasási teljesítményét adja. A Linux RAID által biztosított szokásos RAID 1 nem csíkozja az olvasásokat, de párhuzamosan képes olvasásokat végrehajtani.
  • A Hadoop rendelkezik egy RAID-rendszerrel, amely paritásfájlt generál úgy, hogy egyetlen HDFS-fájlba blokkcsíkot készít.
  • A BeeGFS , a párhuzamos fájlrendszer, belső csíkozási (a fájl alapú RAID0-hoz hasonlítható) és replikációs (a fájl alapú RAID10-hez hasonló) lehetőségekkel rendelkezik a több szerver átviteli sebességének és kapacitásának összesítésére, és általában az alapul szolgáló RAID tetején alapul, hogy lemezt készítsen. kudarcok átlátszó.
  • A lassú RAID az adatok kettős (vagy több) másolatát szétszórja a tárolórendszer összes lemezén (esetleg százan), miközben elegendő szabad kapacitást tart vissza ahhoz, hogy néhány lemez meghibásodhasson. A szórás olyan algoritmusokon alapszik, amelyek önkényesség látszatát keltik. Ha egy vagy több lemez meghibásodik, a hiányzó példányok erre a szabad kapacitásra épülnek, önkényesen. Mivel az újjáépítés az összes megmaradt lemezről és azokra történik, sokkal gyorsabban működik, mint a hagyományos RAID esetén, csökkentve a tárolórendszer kliensekre gyakorolt ​​általános hatását.

Végrehajtások

Az adatok több meghajtóra történő elosztása külön számítógépes hardverrel vagy szoftverrel kezelhető . A szoftveres megoldás része lehet az operációs rendszer része, a firmware és az illesztőprogramok része, amelyeket egy szokásos meghajtóvezérlővel (úgynevezett "hardveres támogatású szoftveres RAID") szállítanak, vagy teljes egészében a hardveres RAID vezérlőben található.

Hardver alapú

A hardveres RAID konfigurálása

A hardveres RAID-vezérlők a BIOS vagy az Option ROM segítségével konfigurálhatók az operációs rendszer indítása előtt, az operációs rendszer indítása után pedig saját konfigurációs segédprogramok állnak rendelkezésre az egyes vezérlők gyártói részéről. Ellentétben a hálózati interfész vezérlők számára Ethernet , amelyek általában konfigurálható és karbantartását teljes egészében a közös operációs rendszer paradigmák, mint ifconfig a Unix , nincs szükség semmilyen külső eszközök minden gyártó minden egyes RAID vezérlő általában biztosít saját fejlesztésű szoftver szerszám minden támogatottnak ítélt operációs rendszerhez, biztosítva a szállítói zárolást és hozzájárulva a megbízhatóság problémáihoz.

Például a FreeBSD -ben az Adaptec RAID vezérlők konfigurációjának eléréséhez a felhasználóknak engedélyezniük kell a Linux kompatibilitási réteget , és az Adaptec Linux eszközeit kell használniuk, ami veszélyeztetheti a beállítások stabilitását, megbízhatóságát és biztonságát, különösen a hosszú távú kilátás.

Néhány más operációs rendszer saját általános keretrendszert valósított meg a RAID-vezérlőkhöz való kapcsolódáshoz, és eszközöket biztosít a RAID-kötet állapotának figyelemmel kísérésére, valamint a meghajtó azonosításának megkönnyítésére a LED-ek villogása, riasztáskezelés és forró tartalék lemez- megjelölések révén az operációs rendszeren belül. újra kell indulnia a kártya BIOS-ra. Például ezt az eljárást követte az OpenBSD 2005-ben a bio (4) ál-eszközével és a bioctl segédprogrammal, amelyek biztosítják a hangerő állapotát, és lehetővé teszik a LED / riasztás / hotspare vezérlést, valamint az érzékelőkkel (beleértve a meghajtás érzékelőjét is) ) az egészségügyi ellenőrzés céljából; ezt a megközelítést a NetBSD később elfogadta és kiterjesztette 2007-ben is.

Szoftver alapú

A szoftveres RAID implementációkat számos modern operációs rendszer biztosítja . A szoftveres RAID a következőképpen valósítható meg:

  • A réteg, amely kivonatok több eszköz, ezáltal egyetlen virtuális eszköz (mint például Linux kernel „s MD és OpenBSD softraid)
  • Általánosabb logikai kötetkezelő (a legtöbb kiszolgálóosztályú operációs rendszerrel, például a Veritas vagy az LVM szolgáltatással )
  • A fájlrendszer egyik összetevője (például ZFS , Spectrum Scale vagy Btrfs )
  • Bármely fájlrendszer felett elhelyezkedő réteg, amely paritásvédelmet nyújt a felhasználói adatoknak (például RAID-F)

Egyes fejlett fájlrendszereket úgy terveztek, hogy közvetlenül több tárolóeszközön keresztül szervezzék az adatokat, harmadik fél logikai kötetkezelőjének segítsége nélkül:

  • A ZFS támogatja a RAID 0, RAID 1, RAID 5 (RAID-Z1) egyparitásos, RAID 6 (RAID-Z2) kettős paritás és egy háromszoros paritásos verzió (RAID-Z3) egyenértékűségét, amelyet RAID 7 néven is emlegetnek. Mivel mindig a felső szintű vdev-ek felett csíkozik, támogatja az 1 + 0, 5 + 0 és 6 + 0 beágyazott RAID-szint ekvivalenseit (valamint a csíkos hármasparitású halmazokat), de más beágyazott kombinációkat nem. A ZFS a Solaris és az illumos natív fájlrendszere , és FreeBSD és Linux rendszereken is elérhető. A nyílt forráskódú ZFS megvalósításokat az OpenZFS esernyő projektje keretében aktívan fejlesztik .
  • A Spectrum Scale , amelyet eredetileg az IBM fejlesztett ki a média streaminghez és a skálázható elemzéshez, támogatja a rejtett RAID- védelmi sémákat n + 3-ig. Egy különlegesség a dinamikus újjáépítési prioritás, amely alacsony hatással fut a háttérben, amíg egy adatrész el nem éri az n + 0 redundanciát, ebben az esetben ez a darab gyorsan átépül legalább n + 1-re. Ráadásul a Spectrum Scale támogatja a metrótávolságú RAID 1-et.
  • A Btrfs támogatja a RAID 0, RAID 1 és RAID 10 fájlokat (a RAID 5 és 6 fejlesztés alatt áll).
  • Az XFS- t eredetileg úgy tervezték, hogy integrált kötetkezelőt biztosítson, amely támogatja több fizikai tárolóeszköz összefűzését, tükrözését és csíkozását. Az XFS Linux kernelben történő megvalósításához azonban hiányzik az integrált kötetkezelő.

Számos operációs rendszer biztosítja a RAID implementációkat, beleértve a következőket:

  • A Hewlett-Packard által OpenVMS operációs rendszer támogatja a RAID 1. A tükrözött diszkek, úgynevezett »árnyék set«, lehet különböző helyeken, hogy segítse a katasztrófa utáni helyreállítás.
  • Az Apple macOS és macOS Server támogatja a RAID 0, RAID 1 és RAID 1 + 0 szolgáltatást.
  • A FreeBSD támogatja a RAID 0, RAID 1, RAID 3 és RAID 5, valamint az összes beágyazást a GEOM modulokon és a ccd- n keresztül .
  • Linux „s md támogatja a RAID 0, RAID 1, RAID 4, RAID 5, RAID 6, és minden komplikált elrendezés. Bizonyos átalakítási / átméretezési / bővítési műveletek szintén támogatottak.
  • A Microsoft Windows különféle szoftveres megvalósításokkal támogatja a RAID 0, RAID 1 és RAID 5 programokat. A Windows 2000- rel bevezetett Logical Disk Manager lehetővé teszi RAID 0, RAID 1 és RAID 5 kötetek létrehozását dinamikus lemezek használatával , de ez csak a Windows professzionális és szerver kiadásaira korlátozódott a Windows 8 megjelenéséig . A Windows XP módosítható a RAID 0, 1 és 5 támogatásának feloldásához. A Windows 8 és a Windows Server 2012 bevezette a RAID-szerű, Storage Spaces néven ismert funkciót , amely lehetővé teszi a felhasználók számára a tükrözés, a paritás vagy a redundancia megadását egy mappában -mappa alapon. Ezek az opciók hasonlóak a RAID 1-hez és a RAID 5-höz, de magasabb absztrakciós szinten valósulnak meg.
  • A NetBSD támogatja a RAID 0, 1, 4 és 5 szoftvert, RAIDframe néven.
  • Az OpenBSD támogatja a RAID 0, 1 és 5 szoftvert, softraid néven.

Ha a rendszerindító meghajtó meghibásodik, akkor a rendszernek elég kifinomultnak kell lennie ahhoz, hogy a hátralévő meghajtóról vagy meghajtókról indulhasson. Vegyünk például egy számítógépet, amelynek a lemeze RAID 1-nek van konfigurálva (tükrözött meghajtók); ha a tömbben az első meghajtó meghibásodik, akkor az első lépcsős rendszerbetöltő nem biztos, hogy elég kifinomult ahhoz, hogy tartalékként megkísérelje betölteni a második lépcsős rendszerindítót a második meghajtóról. A FreeBSD második lépcsős rendszerbetöltője képes betölteni a rendszermagot egy ilyen tömbből.

Firmware és driver alapú

A SATA 3.0 vezérlő, amely RAID funkciókat keresztül tulajdonosi firmware és illesztőprogramok

A szoftverrel megvalósított RAID nem mindig kompatibilis a rendszer indítási folyamataival, és általában nem praktikus a Windows asztali verziói esetében. A hardveres RAID-vezérlők azonban drágák és saját tulajdonúak. Ennek a hiányosságnak a pótlására olcsó "RAID-vezérlőket" vezettek be, amelyek nem tartalmaznak külön RAID-vezérlő chipet, hanem egyszerűen egy szabványos meghajtó-vezérlő chipet saját firmware-vel és illesztőprogramokkal. A korai indítás során a RAID-et a firmware hajtja végre, és miután az operációs rendszer teljesebben betöltődött, az illesztőprogramok átveszik az irányítást. Következésképpen előfordulhat, hogy az ilyen vezérlők nem működnek, ha az illesztőprogram-támogatás nem érhető el a gazdagép operációs rendszeréhez. Ilyen például az Intel Rapid Storage Technology , amelyet számos fogyasztói szintű alaplapon valósítottak meg.

Mivel némi minimális hardvertámogatásról van szó, ezt a megvalósítást "hardveres szoftveres RAID-nek", "hibrid modell" RAID-nek vagy akár "hamis RAID-nek" is nevezik. Ha a RAID 5 támogatott, a hardver XOR-gyorsítót biztosíthat. Ennek a modellnek az előnye a tiszta szoftveres RAID-hez képest, hogy - ha redundancia módot használunk -, a rendszerindító meghajtó még azelőtt, hogy az operációs rendszer illesztőprogramjai átvennék a védelmet, a rendszerindítási folyamat során védve vannak a hibától (a firmware miatt).

Sértetlenség

Az adatok súroló (a továbbiakban bizonyos környezetekben, mint járőr olvasási ) jár rendszeres leolvasás és ellenőrzés a RAID-vezérlő az összes blokkot egy tömbben, beleértve azokat is, másképp nem érhető el. Ez használat előtt észleli a hibás blokkokat. Az adatok súrolása ellenőrzi a tömbben lévő minden egyes tárolóeszköz hibás blokkjait, de a tömb redundanciáját is felhasználja a hibás blokkok helyreállítására egyetlen meghajtón, és a helyreállított adatok újbóli hozzárendeléséhez a meghajtón máshol lévő blokkokhoz.

Gyakran egy RAID-vezérlő úgy van konfigurálva, hogy "ledobja" az összetevő-meghajtót (vagyis feltételezze, hogy egy alkatrész-meghajtó meghibásodott), ha a meghajtó körülbelül nyolc másodpercig nem válaszolt; ez azt eredményezheti, hogy a tömbvezérlő eldob egy jó meghajtót, mert az a meghajtó nem kapott elegendő időt a belső hiba-helyreállítási eljárás befejezéséhez. Következésképpen a fogyasztók által forgalmazott meghajtók RAID-vel történő használata kockázatos lehet, és az úgynevezett "vállalati osztályú" meghajtók korlátozzák a hiba helyreállítási idejét a kockázat csökkentése érdekében. A Western Digital asztali meghajtói korábban sajátosan javítottak. A WDTLER.exe nevű segédprogram korlátozta a meghajtó hibajavítási idejét. A segédprogram engedélyezte a TLER (time limited error recovery) funkciót , amely hét másodpercre korlátozza a hiba helyreállítási idejét. 2009 szeptembere táján a Western Digital letiltotta ezt a funkciót asztali meghajtóiban (például a Caviar Black vonalon), így az ilyen meghajtók alkalmatlanná váltak RAID konfigurációkban történő használatra. A Western Digital vállalati osztályú meghajtókat azonban gyárilag szállítják, a TLER engedélyezésével. Hasonló technológiákat használ a Seagate, a Samsung és a Hitachi. Nem RAID használat esetén tehát egy rövid hibajavítási időtúllépéssel rendelkező, nem módosítható vállalati osztályú meghajtó kevésbé alkalmas, mint egy asztali meghajtó. 2010 végén a Smartmontools program támogatni kezdte az ATA Error Recovery Control konfigurálását, lehetővé téve az eszköz számára, hogy számos asztali osztályú merevlemezt konfiguráljon RAID-beállításokhoz való felhasználásra.

Bár a RAID védelmet nyújt a fizikai meghajtó meghibásodása ellen, az adatok továbbra is ki vannak téve az operátor, a szoftver, a hardver és a vírusok megsemmisítésének. Számos tanulmány az üzemeltető hibáját említi meghibásodás gyakori forrásaként, például egy szerver-üzemeltető helytelen meghajtót cserél le egy hibás RAID-ben, és a rendszert (akár ideiglenesen is) letiltja a folyamat során.

Egy tömböt katasztrofális hiba okozhat, amely meghaladja a helyreállítási képességét, és az egész tömböt tűz, természeti katasztrófa és emberi erő veszélyezteti, azonban a biztonsági másolatok a helyszínen kívül is tárolhatók. Egy tömb azért is sérülékeny a vezérlő meghibásodása miatt, mert nem mindig lehetséges új, eltérő vezérlőbe migrálni adatvesztés nélkül.

Gyengeségek

Összefüggő kudarcok

A gyakorlatban a hajtások gyakran azonos korúak (hasonló kopással) és ugyanazon környezetnek vannak kitéve. Mivel sok meghajtó meghibásodás mechanikai problémák miatt következik be (amelyek nagyobb valószínűséggel fordulnak elő a régebbi meghajtóknál), ez sérti a meghajtók független, azonos meghibásodási arányának feltételezéseit; a kudarcok statisztikailag összefüggenek. A gyakorlatban a második hiba esélye az első helyreállítása előtt (ami adatvesztést okoz) nagyobb, mint a véletlenszerű hibák valószínűsége. Körülbelül 100 000 meghajtó vizsgálatakor annak a valószínűsége, hogy ugyanazon klaszterben két meghajtó meghibásodik egy órán belül, négyszer nagyobb volt, mint amit az exponenciális statisztikai eloszlás megjósolt - ami jellemzi azokat a folyamatokat, amelyekben az események folyamatosan és függetlenül, állandó átlagos sebességgel fordulnak elő. Két hiba valószínűsége ugyanabban a 10 órás periódusban kétszer akkora volt, mint azt egy exponenciális eloszlás megjósolta.

Nem helyrehozható olvasási hibák az újjáépítés során

A helyrehozhatatlan olvasási hibák (URE) szektorolvasási hibákként jelennek meg, más néven látens szektorhibákként (LSE). A kapcsolódó média értékelése intézkedés, javíthatatlan bit hiba (UBE) aránya, jellemzően garantáltan kevesebb, mint egy bit 10 15 nagyvállalati meghajtók ( SCSI , FC , SAS vagy SATA), és kevesebb mint egy bit 10 14 számára asztali osztályú meghajtók (IDE / ATA / PATA vagy SATA). A növekvő meghajtókapacitások és a nagy RAID 5 példányok azt eredményezték, hogy a maximális hibaarány nem volt elegendő a sikeres helyreállítás garantálásához, mivel nagy a valószínűsége annak, hogy egy RAID-készlet újjáépítése során egy vagy több megmaradó meghajtón ilyen hiba jelentkezik. Az újjáépítéskor az olyan paritáson alapuló sémák, mint a RAID 5, különösen hajlamosak az URE hatásaira, mivel nemcsak az ágazatot érintik, ahol előfordulnak, hanem a rekonstruált blokkokat is, amelyek az adott szektort használják a paritás kiszámításához.

A kettős védelemű paritáson alapuló sémák, például a RAID 6, megkísérlik megoldani ezt a problémát redundancia biztosításával, amely lehetővé teszi a kettős meghajtó hibáit; hátrányként az ilyen sémák megemelkedett írási büntetéstől szenvednek - hányszor kell elérni a tárolóeszközt egyetlen írási művelet során. Az adatokat meghajtó-meghajtó módon másoló (tükröző) rendszerek, például a RAID 1 és a RAID 10, alacsonyabb kockázattal járnak az URE-k miatt, mint azok, amelyek paritásszámítást vagy csíkos halmazok tükrözését alkalmazzák. Az adatmosás , mint háttérfolyamat, felhasználható az URE-k felderítésére és helyreállítására, hatékonyan csökkentve annak kockázatát, hogy a RAID újjáépítése során bekövetkezik, és kettős meghajtó hibákat okozhat. Az URE-k helyreállítása magában foglalja az érintett mögöttes lemezszektorok újratervezését, a meghajtó szektorátalakító készletének felhasználásával; a háttérmosás során észlelt URE-k esetén a teljesen működőképes RAID-készlet által biztosított adatredundancia lehetővé teszi a hiányzó adatok rekonstruálását és átírását egy újratervezett szektorba.

Az újjáépítési idő és a meghibásodás valószínűségének növekedése

A meghajtókapacitás sokkal gyorsabban nőtt, mint az átviteli sebesség, és a hibaarányok csak kissé csökkentek ehhez képest. Ezért a nagyobb kapacitású meghajtók órákig tarthatnak, ha nem napokig, de az idő alatt más meghajtók meghibásodhatnak, vagy még fel nem fedezett olvasási hibák kerülhetnek felszínre. Az újjáépítési idő szintén korlátozott, ha a teljes tömb továbbra is csökkent kapacitással működik. Ha egy tömb csak egy redundáns meghajtóval rendelkezik (amely a RAID 3., 4. és 5. szintre, valamint a "klasszikus" kéthajtásos RAID 1-re vonatkozik), akkor a második meghajtó meghibásodása a tömb teljes meghibásodását okozná. Annak ellenére, hogy az egyes meghajtók átlagos meghibásodási ideje (MTBF) az idő múlásával nőtt, ez a növekedés nem tartott lépést a meghajtók megnövekedett tárolókapacitásával. A tömb újjáépítésének ideje egyetlen meghajtó meghibásodása után, valamint a második meghibásodás esélye az újjáépítés során idővel megnőtt.

Egyes kommentátorok kijelentették, hogy a RAID 6 ebben a tekintetben csak "sávsegély", mert csak kissé tovább rúgja a problémát. Berriman és munkatársai 2006-os NetApp tanulmánya szerint azonban a meghibásodás esélye mintegy 3800-szorosára csökken (a RAID 5-hez viszonyítva) a RAID 6 megfelelő megvalósításához, még áruhajtók használata esetén is. Mindazonáltal, ha a jelenleg megfigyelt technológiai trendek változatlanok maradnak, 2019-ben egy RAID 6 tömbnek ugyanolyan esélye lesz a meghibásodásra, mint annak RAID 5 társának 2010-ben.

A tükröző sémák, mint például a RAID 10, korlátozott helyreállítási idővel rendelkeznek, mivel egy meghibásodott meghajtó másolatát igénylik, összehasonlítva a paritássémákkal, például a RAID 6-szal, amelyek megkövetelik a tömbkészletben lévő meghajtók összes blokkjának másolatát. Hármas paritási sémákat vagy hármas tükrözéseket javasoltak egy megközelítésként, hogy javítsák az ellenállóképességet egy további meghajtóhiba ellen ebben a nagy átépítési idő alatt.

Atomos állapot

A rendszer összeomlása vagy az írási művelet egyéb megszakítása olyan állapotokat eredményezhet, ahol a paritás az írási folyamat nem atomossága miatt inkonzisztens az adatokkal, így a paritás nem használható fel helyreállításra egy lemez meghibásodása esetén. Ezt általában RAID 5 írási lyuknak nevezik. A RAID írási lyuk régebbi és alacsonyabb szintű RAID-ek ismert adatkorrupciós problémája, amelyet a lemezre történő írások megszakított megsemmisítése okoz. Az írási lyuk az előre írható naplózással kezelhető . Ezt mdadm- ben rögzítették egy dedikált naplózási eszköz bevezetésével (a teljesítménybüntetés elkerülése érdekében általában az SSD-ket és az NVM- eket részesítik előnyben).

Ez egy kevéssé megértett és ritkán emlegetett hibamód redundáns tároló rendszerek számára, amelyek nem használják a tranzakciós szolgáltatásokat. Az adatbázis-kutató, Jim Gray a relációs adatbázis-kereskedelem korai napjaiban írta: "A helyben történő frissítés mérgező alma".

Írási gyorsítótár megbízhatóság

Aggodalomra ad okot az írási-gyorsítótár megbízhatósága, különös tekintettel a visszaírási gyorsítótárral felszerelt eszközökre , amelyek olyan gyorsítótárazó rendszerek, amelyek az adatokat írva jelentik, amint azok a gyorsítótárba íródnak, szemben azzal, amikor azokat a nem illékony közeg. Ha a rendszer áramkimaradást vagy egyéb jelentős meghibásodást tapasztal, az adatok visszavonhatatlanul elveszhetnek a gyorsítótárból, mielőtt elérnék a nem felejtő tárolót. Ezért a jó visszaírási gyorsítótár-megvalósítások olyan mechanizmusokat tartalmaznak, mint például a redundáns akkumulátortöltet, amelyek megőrzik a gyorsítótár tartalmát a rendszerhibák (beleértve az áramkimaradásokat is) esetén, és a rendszer újraindításakor öblítik a gyorsítótárat.

Lásd még

Hivatkozások

Külső linkek