Zajem podatkov z različnih vrst dokumentov

Skeniranju dokumentov tipično sledi postopek digitalizacije vsebin oziroma zajem podatkov z dokumentov.

Z njim lahko podjetja znatno povečajo hitrost obdelave poslovnih dokumentov in učinkovitost dela zaposlenih. V Mikrografiji skenograme obdelamo z orodjem za zajem oziroma optično prepoznavo podatkov ter tako stranki omogočimo iskanje po celotni vsebini dokumenta.

Z zajemom podatkov

  • Znižate stroške vnosa podatkov v informacijski sistem.

  • Pospešite vnos podatkov in skrajšate čas, potreben za procesiranje dokumentov.

  • Integracije s tretjimi sistemi (ERP, CRM, …).

  • Dokumente obdelujete na eni skupni točki.

  • Zmanjšate možnost nastanka napak in morebitne napake odkrijte že na samem začetku procesa (manjkajoči podatki, ...).

  • Uporaba šifrantov za hitrejši vnos in kontrolo podatkov.

Zakaj skeniranje in zajem podatkov zaupati specialistom?

Ker bo delo opravljeno brez napak in visoke kakovosti. Poleg tega smo eno redkih podjetij, ki je kos tudi najbolj zahtevnim nalogam. O tem priča tudi podatek, da smo v šestih mesecih uspeli zajeti podatke z več milijonov dokumentov.

Rezultat optične prepoznave vsebin je možnost uporabe celotnega ali le dela besedila, ki se nahaja na dokumentu, kar pohitri iskanje in hkrati tudi zmanjša ali v celoti odpravi potrebo po ročnem klasificiranju dokumentov glede na vsebino.

Naše tehnične rešitve podpirajo tudi masovno prepoznavo unikatnih elementov ali znakov (t. i. identifikatorjev) s posameznega dokumenta – npr. črtne kode.

Proces storitve mZajem

Glede na vaše potrebe se lahko odločite najem storitve mZajem, kot je opisano zgoraj, kjer koristite znanje in kapacitete Mikrografije, ali pa izberete vzpostavitev lastnega vložišča in uporabite certificirano rešitev za zajem in validacijo mScan.

Z visokokakovostnim orodjem, za optično prepoznavo vsebine, lahko zajamemo podatke iz naslednjih vrst dokumentacije:

Pogosta vprašanja

Potrebno je imeti primerno strojno opremo, ki omogoča skeniranje na ploskvi, saj to pomeni da dokumenta ni potrebno razdreti. Potrebujete skener, ki omogoča skeniranje s »flatbed«-om. Razlika v skeniranju je samo v koraku zajema.

Seveda, to je del tehničnih zahtev, ki jih kot naročnik podate pri integraciji. To je seveda mogoče, če zna zaledni sistem preko spletnega servisa priklicati dokument in ga prikazati. Glede na izražene želje in tehnične možnosti vedno pomagamo poiskati najbolj optimalni način, da je uporabniška izkušnja čim boljša za vse končne uporabnike.

Potrebno je imeti primerno strojno opremo, ki omogoča skeniranje na ploskvi, saj to pomeni da dokumenta ni potrebno razdreti. Potrebujete skener, ki omogoča skeniranje s »flatbed«-om. Razlika v skeniranju je samo v koraku zajema.

Samodejna prepoznava deluje po principu delaj in uči (work&learn). To pomeni, da so v praksi strukturirani dokumenti prebrani po neki predlogi, ki npr. zajema 75% vseh računov v slovenščini. V kolikor se ugotovi, da kakšen metapodatk (znesek, datum, …) ni bil pravilno prepoznan, se mScan te stvari samodejno “nauči” in od takrat naprej bo znal pravilno prebrati tudi takšno obliko računov. Seveda je na začetku nekaj ročnega dela, ampak sčasoma je takih primerov vedno manj.

Dokumente lahko ločujete na več načinov – ročno, s črtno kodo, po vsebini, … Tako je v eni zbirki na koncu lahko več dokumentov oz. v praksi to pomeni tudi več PDF-jev.

Ja, dostop je lahko popolnoma identičen. Pri sodobnih internetnih povezavah tudi pri dostopanju do velikih dokumentov ni več težav. Sam dostop in aplikacija sta v obeh primerih enaka. Vse naše aplikacije (razen mScana) so spletne aplikacije, tako, da jih lahko uporabljate na enak način, ne glede na to kje se nahaja strežnik na katerem so dokumenti. Še ena prednost spletnih aplikacij je, da jih lahko uporabljate na katerikoli napravi (računalnik, tablica, mobilni telefon).

Da, ravno nedolgo nazaj smo skupaj s podjetjem Imagine izvedli intergracijo za rešitvi mScan (certificirana programska oprema za skeniranje, zajem in validacijo) ter mSef (certificirana e-hramba). Rešitev poteka na način, da je mScan rešitev, ki se integrira v dokumentni sistem podjetja Imagine za vse dokumente, ki jih zajemajo kot pošto, dokumenti se po potrditvi shranijo v mSef.

Ko smo delali predloge za optično prepoznavo določenih dokumentov smo bili pri OCR vezani na to kje na dokumentu se podatek nahaja. ICR je šel korak naprej, s tem, da se, ko je dokument poskeniran prebere celoten tekst na dokumentu in na podlagi vzročnih povezav lahko vemo kateri podatek je pravilen, npr. na računu imamo več datumov (datum storitve, datum plačila, datum izdaje,…). Z logiko vemo da je prvi datum na računu datum opravljene storitve, zadnji datum na računu pa je datum plačila. Z algoritmi lahko vnaprej določimo za kakšen podatek gre in s tem močno skrajšamo čas validacije dokumenta.

Pri zajemu strukturiranih dokumentov je znana lokacija podatka in je zajem mnogo lažji. Pri zajemu nestrukturiranih podatkov pa je potrebna vpeljava logike iskanja metapodatka na podlagi ključnih besed, oblike iskanega podatka (datum, številka, znesek, …), povezave med različnimi podatki, kot so kalkulacije med podatki, oddaljenost med njimi, pozicija na dokumentu (datumi na gornji polovici, zneski na spodnji polovici, prejemnik zgornja leva polovica in podobno, …).

Odvisno od tega ali ste gospodarska družba ali ste del javnega sektorja. ZVDAGA in njena uredba določata, da se morata v procesu uporabljati certificirana strojna in programska oprema. Idealno je, da se že na začetku naredi pretvorba v dolgoročno hrambo. V primeru, da se tega ne naredi takoj na začetku, je to potrebno narediti po 5 letih v kolikor je dokument po klasifikacijskem načrtu tipa/narave, da ga je potrebno hraniti 5 let ali dlje. Pretvorba v digitalno obliko mora izpolnjevati enake pogoje uporabnosti kot dokumenti v originali. Na koncu mora biti zagotovljena varna dolgoročna hramba. Notranja pravila so za javnopravne osebe obvezna, saj vam šele potrjena notranja pravila dovoljujejo da začnete z uničevanjem dokumentacije. Za gospodarstvo velja, da v idealnem svetu sledite določbam v ZVDAGA in uredbi, lahko pa si dovolite bistveno več, ker gre pri stvareh, ki niso določene z zakonom, za vašo poslovno odločitev. Če vzamemo za primer finančne institucije, je smiselno, da te institucije napišejo notranja pravila samo za del dokumentacije ne za celotno poslovanje (npr. dokumentacija z bančnih okenc). Organizacija mora sama ocenit kje je dokumentacije največ in kje je poslovno tveganje največje.

mScan podpira več možnosti integracij. Rezultat skeniranja dokumentov (nabor metapodatkov)  je običajno zapisan v obliki xml dokumentov. mScan omogoča integracijo z aplikacijami, ki podpirajo spletne servise ali nam omogočajo zapis dokumentov v tabelo. Potreben je tehnični dogovor glede izvedbe integracije, kjer stranka vsebinsko določi kaj želi z integracijo doseči.