Document capture staat voor het omzetten van informatie van papieren en PDF documenten naar gestructureerde databestanden.
Van papier en PDF naar data
Om informatie op papieren documenten en PDF documenten (zonder data-laag) om te zetten naar een databestand kan gebruik worden gemaakt van zogenaamde scan en capture of object character recognition (OCR) software, zoals dat van Kofax.
Het bedrijfsleven bevindt zich sterk in een digitale transformatie. In die transformatie wordt er nog regelmatig met papieren documenten en PDF documenten gewerkt. Een PDF document is weliswaar digitaal, maar de meeste PDF documenten hebben geen data-laag. Het zijn niet meer dan digitale afbeeldingen die door mensen moeten worden afgelezen.
Om bedrijfsprocessen als factuurverwerking te automatiseren, zal informatie naar databestanden geconverteerd moeten worden.
PDF documenten die ontvangen worden of zelf gemaakt zijn op basis van gescande papieren documenten, kunnen met OCR software automatisch worden omgezet naar een databestand. In de software kan worden ingesteld hoe de informatie op een specifiek document omgezet moet worden. Met andere woorden: dat een factuurnummer op een document ook als zodanig wordt in het databestand wordt opgeslagen.
Document Capture uitbesteed
Het digitaliseren van documenten kan een tijdrovende bezigheid zijn. Het digitaliseren van documenten als facturen van leveranciers kan worden uitbesteed, door gebruik te maken van open, zakelijke transactie netwerken waarin document conversie plaatsvindt.
Het grote voordeel van een zakelijk netwerk als het Basware Network, is dat partijen die op het netwerk zijn aangesloten, documenten naar elkaar kunnen toesturen, zonder daarbij rekening te moeten houden met het gewenste format van de ontvangende partij. Leveranciers kunnen bijvoorbeeld facturen in papier of PDF naar een klant sturen, maar dan via het netwerk, waarna de klant gestandaardiseerde databestanden ontvangt die direct en automatisch verder verwerkt kunnen worden.