Les baies redondantes de disques indépendants (RAID) ont gagné en popularité il y a plus d’un quart de siècle, formalisant le marché des systèmes de stockage d’entreprise sécurisés et fiables qui fournissent un accès partagé aux données. Les entreprises, les petites entreprises et même les particuliers les utilisent car, par rapport à l’utilisation d’un seul disque dur (HDD), un RAID peut protéger des données sensibles contre les pannes de supports de stockage, être plus rentable, améliorer les performances et augmenter la résilience.
Tout comme différentes configurations de RAID peuvent être plus ou moins adaptées à n’importe quelle application de stockage donnée, il existe différentes manières de configurer le stockage en réseau (NAS) et les configurations se comportent différemment selon les circonstances. Comprendre les différences subtiles sera instructif pour décider quelle configuration adopter.
Les RAID sont traditionnellement définis comme un ensemble d’actifs de stockage installés dans un système, mais traités logiquement comme un périphérique de stockage unique. Une caractéristique importante est la disponibilité au niveau de l’entreprise, ce qui signifie qu’un RAID reste opérationnel, performant et accessible aux utilisateurs du réseau qualifiés pendant quelques minutes chaque année. Les données sont protégées soit en les mettant en miroir, soit en utilisant un système de parité où les données perdues peuvent être récupérées en les recalculant à partir des informations encore existantes.
Il existe de nombreuses façons de configurer un RAID, et chacune porte une désignation numérique différente, de RAID0 à RAID60. Par exemple, RAID0 répartit les données (distribue des blocs de données sur plusieurs disques), mais sans mise en miroir (créant une copie complète d’un ensemble de données) ni parité (dédiant un disque à la tolérance aux pannes). En pratique, il n’y a pas de redondance dans cette configuration ; les données peuvent être perdues si une partie du système tombe en panne.
RAID1, quant à lui, n’a ni répartition ni parité, mais les blocs sont mis en miroir. Dans RAID5, les blocs sont répartis et il existe une parité distribuée. RAID10 se caractérise par des blocs répartis et mis en miroir. Là où RAID0, RAID1 peuvent être configurés avec seulement deux disques, RAID5 dépend d’au moins trois, tandis que RAID10 est généralement déployé en commençant par quatre mais en allant jusqu’à tout nombre pair supérieur.
Les systèmes NAS sont constitués d’un sous-système de stockage RAID connecté au réseau. Le NAS peut être équipé d’un nombre variable de périphériques de stockage.
Les périphériques de stockage sont généralement des disques durs (HDD), bien que des disques SSD (SSD) soient parfois utilisés. Les systèmes NAS de type bureau équipés de deux disques durs sont suffisants pour de nombreuses utilisations, mais les configurations avec quatre disques ne sont pas rares, et certaines peuvent en contenir jusqu’à huit. Les systèmes d’entreprise, souvent installés dans un format rackable, peuvent avoir 12, 16 ou même jusqu’à 24 disques durs.
Ce qui soulève la question : comment fonctionnent les différentes configurations RAID avec différentes configurations NAS ? Pour notre évaluation du niveau RAID, nous nous concentrons sur les modèles d’entrée de gamme populaires à deux et quatre baies.
Le Toshiba HDD Laboratory a testé plusieurs systèmes NAS de plusieurs fabricants, chacun étant équipé d’une carte réseau 10 GbE pour éviter les goulots d’étranglement des performances dans la connectivité réseau. Nous avons testé chaque NAS avec deux et quatre disques durs Toshiba modèle MG08ADA400E Enterprise 4 To.
Nous avons stocké 6 To de données dans le système et mesuré les performances pour 1) l’écriture séquentielle de blocs de 1 Mo, 2) la lecture séquentielle de blocs de 1 Mo et une lecture aléatoire, et 3) la charge de travail mixte de lecture et d’écriture d’un mélange de différentes tailles de blocs.
Nous avons également testé des configurations utilisant soit des contrôleurs RAID matériels, soit un contrôle RAID logiciel. Pour deux ou quatre disques, le RAID matériel est le moyen de gestion le plus courant et le plus approprié. Mais grâce à une puissance de calcul performante et rentable (CPU, DRAM, etc.), les RAID peuvent également être entièrement gérés par logiciel, avec l’avantage d’offrir des fonctionnalités de stockage supplémentaires telles que des instantanés, des sauvegardes, etc.
Les deux contrôleurs RAID matériels testés figuraient parmi les plus populaires du marché pour les systèmes comportant jusqu’à huit disques : le Broadcom MegaRAID 9560-8i et l’Adaptec® SmartRAID 3204-8i de Microchip. Pour le stockage défini par logiciel, nous avons testé le système de fichiers Zettabyte (ZFS) géré par le logiciel Open-E JovianDSS.
Les valeurs de performances séquentielles pour les NAS avec configurations RAID sont insignifiantes inférieures à celles des contrôleurs RAID matériels, tandis que les performances aléatoires sont similaires à celles du ZFS sans mise en cache.
En comparant RAID5 et RAID10, RAID5 est environ 20 % plus rapide en termes de vitesse séquentielle et RAID10 est 20 % plus rapide en termes de charges de travail aléatoires/mixtes.
La plupart des systèmes NAS sont toujours équipés d’une interface 1GbE ou 2,5GbE. Il convient donc de souligner que les valeurs de performances séquentielles de 200 Mo/s et plus nécessitent une interface 10GbE au minimum. L’utilisation d’une interface 1GbE limite la vitesse séquentielle à environ 100 Mo/s, ce qui est inférieur à celui d’un seul disque dur. L’utilisation d’un 2,5 GbE augmente la vitesse maximale à 250 Mo/s, ce qui est suffisant pour une configuration RAID1 à 2 baies. Ce n’est qu’avec le 10GbE que nous pouvons atteindre des vitesses supérieures à ce niveau.
Ainsi, tout compromis/optimisation en termes de vitesse séquentielle n’est pertinent que pour les réseaux 10GbE ou plus rapides. Pour les infrastructures réseau 1GbE et 2,5GbE, deux disques durs en RAID1 suffisent. Uniquement pour les charges de travail avec de nombreux accès aléatoires en lecture/écriture, 4 disques RAID10 peuvent apporter un avantage de vitesse d’environ 1,5x.
Les administrateurs de stockage doivent prendre en compte un certain nombre de facteurs lors de l’évaluation des configurations de stockage réseau, qu’il s’agisse d’une configuration RAID en général ou d’une configuration NAS en particulier. Ils comprennent :
De quelle capacité ai-je besoin ?
Quelle est ma charge de travail habituelle ?
Existe-t-il des limitations imposées par la connectivité hôte/réseau ?
Après les tests, notre recommandation pour les configurations RAID dans le NAS est la suivante :
RAID1 (miroir simple) de deux disques de capacité supérieure est la configuration de choix pour les systèmes NAS raisonnablement économiques dans les foyers et les petites entreprises avec une connectivité réseau à 1 GbE ou 2,5 GbE.
RAID5 (protection de parité) de quatre disques est idéal pour tous les types de solutions de système de stockage où la majorité de la charge de travail est de nature séquentielle. Il offre également la meilleure efficacité de stockage (75 %). Il convient donc aux exigences de capacité nette élevées et offre les temps de reconstruction les plus courts possibles en cas de remplacement de disques défaillants.
Raid10 (striping et miroir) de quatre disques : c’est la solution idéale pour les charges de travail aléatoires/mixtes, avec bien sûr une efficacité de stockage inférieure de seulement 50 %. RAID10 est recommandé pour les sous-systèmes de stockage de serveur local pour les charges de travail génériques utilisant des contrôleurs RAID matériels ou la technologie RAID logicielle.