Documentos duplicados y casi-duplicados en el Web: detección con técnicas de hashing borroso