Menu

Deduplicatie en versieherkenning

Verbeter productiviteit en compliancy

Meer informatie

Duplicaten van documenten

Bij het gebruik van contentbronnen (netwerkschijven, fileshares, SharePoint, Google Docs, OneDrive, Dropbox, DM- en ECM-systemen etc.) is het voor gebruikers moeilijk te ontdekken of een document al in het systeem aanwezig is. Daardoor ontstaan duplicaten van documenten. Resultaat, vervuiling, verminderde productiviteit en compliancy issues.

Wilt u ten behoeve van een opschoning, analyse of een migratie, duplicaten herkennen (= 100% identieke documenten), dan wordt dat meestal gedaan op basis van bestandsnaam, bestandsgrootte, extensie of exacte gelijkheid.

Deze methode is echter niet waterdicht. Want ook wanneer een bestand slechts minimaal wordt aangepast of zelfs alleen geopend en opnieuw opgeslagen, is er vaak geen sprake meer van een exact duplicaat. Deze bestanden worden normaal niet meer herkent als duplicaat.

Speuren naar look-a-likes

De methode van Xillio is uniek en zoekt niet alleen naar exacte dubbele documenten, maar ook naar look-a-likes. Dat wil zeggen documenten die voor een vastgesteld percentage qua inhoud (woorden in het document) overeenkomstig zijn met elkaar, oftewel verschillende versies van een document.

Deduplicatie is een dienst die door Xillio consultants wordt uitgevoerd. Daarbij worden de verschillende versies van een document (documente versiebeheer) worden verzameld en gebundeld, waarna op basis van business rules wordt besloten wat de bestemming van de documenten is (bv. verwijderen, verplaatsen, versies stapelen).

Meer weten over deduplicatie?