• À quoi peut-on s’attendre ?

      De nombreuses variables influent sur le taux de déduplication que vous devriez pouvoir atteindre dans votre environnement. Le niveau de redondance dépend des applications, de la fréquence des captures et des règles de rétention. En outre, certaines variables revêtent une importance particulière : le taux de modification des données, par exemple, car plus les modifications sont minimes, plus il y a de données à dédupliquer ; la fréquence des opérations de sauvegarde, car le taux de déduplication augmente avec le nombre de "sauvegardes complètes" ; la durée de rétention des données, car plus elle est longue, plus les volumes de données à comparer sont importants ; ou encore la taille du Dataset, puisque plus le volume de données est élevé, plus il y a de données à dédupliquer.

      Pour comparer différentes approches de déduplication, pensez à utiliser des références comparables. Ainsi, certains logiciels de sauvegarde offrent la déduplication, mais appliquent simultanément des stratégies de sauvegarde incrémentielle uniquement. Pour accentuer les écarts, ils comparent les effets de leur technologie de déduplication à des stratégies de sauvegarde quotidienne complète dont la durée de rétention est très longue. EMC préfère pour sa part présenter le comportement du processus de déduplication dans une stratégie qui combine sauvegarde incrémentielle quotidienne et sauvegarde complète hebdomadaire pour des durées de rétention variant d’un à quatre mois.

      Par ailleurs, l’approche de la technologie de déduplication et la granularité du processus ont également une incidence sur les taux de compression. Les techniques de réduction des données consistent habituellement à diviser les fichiers en segments, et la taille de ces segments varie selon les fournisseurs. Si un segment est très long, le nombre de doublons est moins important. L’espace de stockage libéré est limité et le taux de compression est plus faible. À l’inverse, plus un segment est court, plus il y a de correspondances possibles. L'espace de stockage libéré est ainsi plus important.