Documentos duplicados y casi-duplicados en el Web: detección con técnicas de hashing borroso el 31 de Diciembre del 2011