> Дедупликация в ZFSВы юзали Gluster? Видимо нет.
Дублирующиеся файлы в Gluster означает наличие двух (и более) одинаковых dir entries. Это могут быть всевозможные комбинации из нормальных файлов и "нулевых" файлов, файлов, действительно являющихся дубликатами, но расположенных в другом brick-е, нормальных файлов, но с разной датой access/modify/change, DHT-ссылок и проч.
Выглядит на практике это примерно так:
$ ls -l
...
-rw-r--r-- 1 user1 group1 168 Aug 28 21:51 file.txt
-rw-r--r-- 1 user1 group1 168 Aug 28 21:51 file.txt
-rw-r--r-- 1 user1 group1 0 Aug 28 21:51 file.txt
-rw-r--r-- 1 user1 group1 168 Jul 13 16:23 file.txt
...
Причём, нормальным может быть, скажем, второй file.txt, а все остальные фантомами.
Стоит ли говорить, что у клиентов едет крыша от такого изобилия?