Qu’est-ce que la solution RAID (Redundant Array of Independent Disks) ?
Le concept RAID augmente la résilience de vos solutions de stockage des données. À l’origine, il a été développé pour les disques durs HDD classiques, mais il est encore utilisé de nos jours pour les environnements serveur. À quoi ressemble précisément la structure des systèmes RAID, et quelles sont leurs différences ?
- Domaine .eu ou .fr + éditeur de site gratuit pendant 6 mois
- 1 certificat SSL Wildcard par contrat
- Boîte email de 2 Go
RAID : définition et histoire
Le terme « RAID » date de 1988. Utilisé par des informaticiens de l’Université de Californie à Berkeley dans une publication, « A case for redundant arrays of cheap disks (RAID) », il symbolise la possibilité de combiner plusieurs disques durs PC bon marché avec une fonction semblable à celle d’un grand lecteur logique dans une matrice, pour trouver une alternative aux disques durs SLED (Single Large Expensive Disks) des ordinateurs centraux, alors très coûteux. Cette solution entraînant automatiquement une hausse du risque de panne, le concept prévoit un stockage redondant des données.
Le concept RAID a été standardisé et s’est développé progressivement, jusqu’à être utilisé pour des applications serveur. La question économique a perdu en importance, la matrice servant d’abord à changer de disque dur sans aucun problème. Cette fonction explicite également la décomposition de l’acronyme RAID, couramment utilisé aujourd’hui : Redundant Array of Independent Disks signifie « réseau redondant de disques indépendants ». La technologie RAID est conçue suivant les propriétés des disques durs HDD classiques. La combinaison de disques durs SSD modernes induit des conséquences négatives sur leur performance et durée de vie (manque de fonctionnalité TRIM du concept RAID).
Un concept RAID (Redundant Array of Independent Disks) désigne l’action de créer une matrice contenant un minimum de deux solutions de stockage différentes et formant un seul grand disque logique. Les systèmes RAID sont régis par un principe de base, à savoir le stockage redondant de données, qui garantit l’intégrité et la fonctionnalité de l’ensemble de la matrice en cas de panne au niveau des disques durs individuels.
Le rôle des systèmes RAID dans l’environnement serveur actuel
Les systèmes RAID sont considérés comme des éléments essentiels des environnements serveur. L’aspect le plus important est la redondance des données stockées, à ne pas assimiler à celle d’une sauvegarde classique. Dans les structures de serveurs, les systèmes RAID évitent qu’une panne au niveau d’un disque dur n’engendre des conséquences, les données étant aussi stockées à un autre emplacement de la matrice RAID. Une augmentation de la capacité de stockage et des vitesses de lecture et d’écriture au niveau de l’accès à l’espace en disque dur figurent parmi les avantages pouvant être obtenus grâce à l’utilisation d’un système RAID.
Du point de vue de l’utilisateur, une matrice RAID (toujours composé d’au moins deux solutions de stockage) ne peut pas être distinguée d’un seul support de données logique.
Il peut exister des différences manifestes, notamment dans la manière dont les solutions de stockage individuelles d’un système RAID interagissent précisément entre elles, ou encore dans la fonction devant au bout du compte être remplie par cette matrice dans le réseau de serveurs. Il existe cependant de nombreuses configurations standardisées, définies par des catégories également connues sous le nom de « niveaux RAID ». En outre, il est nécessaire de faire la distinction entre les systèmes RAID logiciels et matériels : cette différence dépend des interactions de la matrice, qui peuvent s’organiser du côté logiciel, ou plutôt du côté matériel.
Quelle est la différence entre les systèmes RAID matériels et logiciels ?
En catégorisant les systèmes RAID matériels et logiciels, vous pouvez rapidement vous méprendre sur les caractéristiques de ces deux types de matrices de disques durs. Les deux modèles ont bien besoin d’un logiciel pour fonctionner ; ici, les termes se réfèrent donc uniquement au type de mise en œuvre utilisé.
Avec le système RAID matériel, l’organisation des solutions de stockage individuelles est confiée à un matériel spécial et particulièrement performant, appelé « contrôleur RAID ». Il peut être installé dans le boîtier d’un ordinateur ou dans une Disk Array (« unité multidisque ») contenant également les disques durs. Le second modèle est privilégié dans les centres de données, où les systèmes externes sont souvent utilisés sous les noms suivants : DAS (Direct Attached Storage), SAN ou NAS. Un système RAID orienté matériel a pour avantage d’offrir d’excellentes performances qui s’expriment, entre autres, par une grande vitesse de transfert des données.
Dans un système RAID logiciel, le quota de stockage est géré par un logiciel exécuté directement sur le processeur de l’hôte ; il s’agit d’un système RAID host-based (« basé sur l’hôte »). Les principaux systèmes d’exploitation, comme Windows (à partir de la version NT) ou les distributions Linux, disposent des composants nécessaires. Un système RAID logiciel se configure plus rapidement et avantageusement qu’une version matérielle. Cependant, cette solution n’est pas multiplateforme et sollicite fortement le processeur de l’hôte. Comme l’accès au disque n’est pas régulé aussi « élégamment » qu’avec un contrôleur RAID, les performances système sont également moindres.
Logiciel RAID | Système RAID matériel | |
---|---|---|
Coût | faible | élevé |
Utilisation du processeur (hôte) | élevée | faible |
Performances | faibles | élevées |
Solution multiplateforme | non | oui |
Dépendance vis-à-vis du système d’exploitation | oui | oui |
Présentation des niveaux RAID les plus courants
Les disques durs d’un système RAID peuvent être combinés de différentes manières, en « niveaux ». Cette appellation crée toujours des malentendus, car ces configurations ne sont pas conçues de manière progressive. Les niveaux sont numérotés, mais ne sont pas liés entre eux. Ces numéros caractérisent les approches relatives à la structure et à la fonction ultérieure des systèmes RAID. Les niveaux les plus courants sont RAID 0, RAID 1, RAID 5 et RAID 6. Vous pouvez combiner deux niveaux RAID : un système RAID 10 désigne par exemple un système RAID 0 obtenu en combinant plusieurs systèmes RAID 1.
Les niveaux RAID que nous vous présentons ici caractérisent les systèmes RAID standardisés et adoptés par le Raid Advisory Board (RAB). En parallèle, il existe plusieurs configurations RAID spécifiques à leur fabricant. Celles-ci bénéficient d’appellations ou de noms individuels, que nous avons ici choisi d’ignorer.
RAID 0 : volume agrégé par bandes
Techniquement, les matrices de disques durs exécutés sous l’appellation RAID 0 ne sont pas considérées comme étant des systèmes RAID, car leur stockage n’est pas basé sur le principe de redondance. Ce modèle a pour seul objectif d’accélérer l’accès aux données en combinant au moins deux disques durs de manière à former un seul grand disque logique. Pour ce faire, les données sont organisées en blocs successifs et réparties uniformément sur les différents supports. En anglais, ces blocs portent le nom de stripes, raison pour laquelle le système RAID 0 est également associé au « striping ».
Si cette matrice offre une plus grande capacité de stockage et davantage de débit, elle a également pour effet de compromettre automatiquement la sécurité : si un disque dur tombe en panne, vous pouvez perdre l’ensemble des données. Pour en savoir plus sur cette approche relative au « striping », consultez notre très complet guide du système RAID 0.
RAID 1 : disques en miroir
Le niveau RAID 1 est également associé au « mirroring », qui se traduit en français par « mise en miroir ». Tous les disques durs intégrés à cette matrice possèdent à tout moment le même ensemble de données ; celle-ci assure ainsi une redondance complète, ce qui lui permet de garder le contrôle sans aucun problème en cas de panne de l’une des solutions de stockage individuelles. Par conséquent, la capacité totale du système RAID ne peut jamais excéder la capacité du plus petit disque dur impliqué.
Dans un système RAID 1, la vitesse d’écriture est comparable à celle obtenue avec un seul disque. Vous pouvez cependant doubler la vitesse de lecture si vous connectez les disques impliqués à leurs propres canaux (par exemple, la norme SATA). Pour en savoir plus sur cette méthode de stockage associé au « mirroring », n’hésitez pas à consulter notre article intitulé « RAID 1 ».
RAID 5 : volume agrégé par bandes à parité répartie
Le niveau RAID 5 correspond à une matrice d’au moins trois disques durs (ce nombre est généralement impair : trois, cinq, sept, etc.). Ce concept de stockage utilise la méthode de « striping » déjà utilisée par le système RAID 0 et organise les données sous forme de blocs avant de les répartir sur les différents supports. Grâce aux blocs de données, les informations de parité sont réparties uniformément sur les disques durs appartenant à la matrice. Ceux-ci peuvent ensuite être utilisés pour restaurer les données perdues si l’un des supports de stockage tombe en panne.
Le niveau RAID 5 offre ainsi une meilleure vitesse de lecture et une sécurité accrue par rapport à un seul disque. En revanche, comme il est constamment nécessaire de recalculer les blocs de parité, la vitesse d’écriture est quant à elle relativement lente. Pour en savoir plus sur ce contexte, consultez notre article spécial sur le système RAID 5.
RAID 6 : volume agrégé par bandes à double parité répartie
Pour le niveau RAID 6, l’approche adoptée est similaire au niveau RAID 5 : là aussi, les données sont organisées sous forme de blocs et distribuées uniformément aux composants de stockage de la matrice, et les informations de parité sont garantes d’une meilleure sécurité. Ici, les dernières données conservées à des fins de restauration sont générées en double. Les systèmes RAID de ce type peuvent donc résister si au maximum deux de leurs disques durs tombent simultanément en panne, tant que le système comporte au moins quatre disques. Cette matrice propose donc un haut niveau de sécurité des données, ainsi qu’un bon accès en lecture.
Cependant, le calcul des blocs de parité est encore plus chronophage dans cette configuration qu’avec le système RAID 5 ; la vitesse d’écriture est donc encore plus lente. Dans notre guide spécifique au système RAID 6, nous examinons les points forts et les faiblesses du « striping » associés à des informations de parité doublement réparties.
RAID 10 : un système RAID 0 sur plusieurs systèmes RAID 1
Le système RAID 10, ou RAID 1 + 0, combine les propriétés du niveau RAID 0 à celles du niveau RAID 1 : cela confère aux données un débit de transfert plus élevé et davantage de sécurité. Pour y parvenir, il suffit de combiner plusieurs systèmes RAID 1 dans une matrice RAID 0 ; il est cependant nécessaire d’utiliser au moins quatre disques durs. Nous détaillons les situations auxquelles une telle combinaison peut se prêter, ainsi que les inconvénients qu’elle peut comporter, dans notre article sur le niveau RAID 10.
Dans le guide intitulé « Comparaison des niveaux RAID », nous comparons concrètement les principales configurations standard et nous penchons entre autres sur leurs différences, avantages et inconvénients, ainsi que sur leurs potentielles utilisations.
À quoi faut-il faire attention lors de la configuration et de l’adaptation des systèmes RAID ?
Vous devez prendre en compte un certain nombre d’éléments pour configurer et exploiter un système RAID. Dans un premier temps, vous devez nécessairement vous poser la question du type de matrice réellement prévu. Si vous souhaitez simplement améliorer le débit de vos données, vous pouvez par exemple décider d’utiliser un SSD en plus d’un système RAID de niveau 0. Si vous cherchez plutôt à augmenter la sécurité de vos données, deux approches différentes sont également disponibles : la mise en miroir (système RAID de niveau 1) et le volume agrégé par bandes à parité répartie (système RAID de niveau 5).
Pour sélectionner vos disques durs, privilégiez des modèles identiques. Dans plusieurs configurations RAID, le volume de stockage ne peut excéder celui du plus petit disque ; vous perdriez une grande partie de votre potentiel de stockage avec des tailles différentes. Nous vous recommandons également du matériel comme les disques durs NAS, réputés pour leur durée de vie. Le volume de votre support de données est également important si vous remplacez du matériel défectueux ou agrandissez votre système RAID : les nouveaux composants doivent avoir au moins le même volume que le plus petit support de données défectueux ou précédemment utilisé.
Lorsque vous utilisez un système RAID, veillez également à ne jamais oublier ce qui suit : les interactions entre vos différents disques durs améliorent la sécurité des données stockées par l’intermédiaire de la redondance, mais un système RAID ne peut et ne doit jamais remplacer une solution de sauvegarde bien pensée.
Vous cherchez une solution de sauvegarde simple et sécurisée pour vos smartphones, PC ou infrastructures Cloud ? Avec Backup Cloud, vous profitez d’une protection complète pour toutes vos données et solutions !