• Limites

      La principale limite de cette approche réside dans le fait que lorsque les données d’un fichier sont déplacées, par exemple lorsqu’on ajoute une diapositive à une présentation dans Microsoft PowerPoint, tous les blocs ultérieurs du fichier sont réécrits et peuvent être considérés différents du fichier original. L’effet de compression est alors moins significatif. Les petits blocs obtiennent de meilleurs résultats que les grands, mais leur traitement en vue de la déduplication prend plus de temps.

      Une approche plus avancée consiste à appliquer le processus de déduplication à des segments de longueur variable. La longueur des segments dépend alors de leur schéma de données intérieur. Cela résout le problème du décalage des données propre à la déduplication basée sur des segments de longueur fixe.