Mediante un programa especializado en buscarlos e identificarlos. Existen muchas opciones, algunos son "automáticos", pero es peligroso hacerlo de esa manera si la información es importante.
Yo he utilizado uno que se llama AntiTwin, identifica los archivos duplicados aplicando ciertas reglas que tú defines y te muestra la lista de ellos. Posteriormente marcas los que quieras eliminar y listo, los borra.