PaperOffice sarrerako ohikoa den harremanaThe PaperOffice Sarrerako Ohikoa den harremana
PaperOffice sarrerako ohikoa den harremanaThe PaperOffice Sarrerako Ohikoa den harremana
Nahi zauden lagunak izan nahi dugu

Gehieneko deskontu ofertarik altuena

Exklusiboko barrukako albisteak

Doako bira eguneraketak

Gehieneko deskontu ofertarik altuena

Exklusiboko barrukako albisteak

Doako bira eguneraketak

Adiskidetasuna Sinadura Hitza Onurarako
Ez dugu zure helbide elektronikoa inori emanen eta gurekin bidaltzen duen edozein email-ek deskarga ezazu estekaren botoi bat baino ez du.

Dokumentuak prozesu inteligentea ondo burutu


Bazkidea emateko

Regulamentazio-adierazpenekin datu-amate automatikoa: Nola prozesatzeko dauden datu handiak eraginkorregatik regulamentazio-adierazpenekin.


Datu-amate automatikoaren eta datu-ateratzearen gako galera.

Ariketa honetan azalduko dizuegu nola erabili adierazpen erregularretak automatizatutako dokumentuen prozesamenduan izan ditzazuen abantailak atzitzeko. Hau bereziki enpresetako dokumentuak izanik da.

Adierazpen erregularretako adibide zehatzak erakutsiko dizkizuegu eta urratsetan azalduko dizugu horien esanahia eta nola erabili ahal dituzun ere.

Hori dela eta, zuen enpresetako eraginkortasuna areagotu ahal duzue, akatsak gutxiagotu ahal dituzue zehaztasun handiagoa emanez, kostu aktua murriztu ahal izatez, datu integritatea babestu ahal izatez eta datu segurtasuna hobetu ahal izatez.

Atal honetan, lehenengo bertsioaren ondoren ikusi daitekeen dokumentu- prozesamendu adimentsu baten gaineko argitalpena prestatzen dugu, hemen klikatu artikulura.

Dokumentu batzuk irakurri ditzazketen datu-elementu zehatzak ateratzeak lan garestia eta garraiatzea suposatzen du. Dokumentu eskanez egin ohi dira biltegi handietako datu-saltze-enpresetara bidaliak, non datuak esku-zabertuta sartzen baitira.

Hala ere, modu honetan har dituen desabantaila hainbat daude, honako hauetan barne:

  • Dokumentuen segurtasuna arriskuan jartzen da
  • Fluxu-prozesuetan atzerapen bat sortzen da
  • Eskuzko adierazpenek prozesu motelagoa dira automatikoengatik
  • Azkargak handienetan orriki ezinbestekoak dira eskuzko adierazpenak
  • Eskuz sartzeko arriskua dago datuetan akatsak barneratuko ditzake
  • Dokumentua aldatu behar bada, prozesu osoa lehengotik hasten da berriz

Eta beste asko barne.

Eskaneatzeko hedapena dela eta, negozio-eragiketa handi batzuk igarotzen dira oraindik dokumentu-paperazko printzipioetan. Iragarriko da fakturak %85 paperran edo iruditan egiten direla.

Gainera, bertako papelak nahastegi handietan gordeta egon behar daude!!

Zein da adierazpen erregularra?

Adierazpen erregularrek, aldez aurretik ezaguna ziren "Regex" dela, testuak bilatu eta manipulatzeko gune aberatsa dira. Testu konplexuak testuetan detektatzeko eta editatzeko aukera ematen dute.

Adierazpen erregular batek hizki normal eta metakaraktere bereziak batera ditu, haien funtzio bereziak dituztenak.

Adierazpen erregularrek testua ere ordeztu edo manipulatu ahal dute. Adibidez, erabili daiteke adibide honetan.

Zaituzten tresna oso boteretsuak dira testu-prozesadoa eta egitekoeko automatizazioa.

Nola lagundu ditzakete adierazpen erregularrek enpresaren automatizazioan?

Testu desberdinen eta izenpetze arauen metatzeak dituzten dokumentu digitalen gehikuntza, eta sistemaren bilaketa nahikorik gabeko datuen atzera-irakurtze prozesua eta informazio dokumenten cola izaten da, bereziki eragileriak izan ezik, bilaketa desegokia eta luzerazkoa izaten da.

Adierazpen erregularrek (Regex) baliagarri eta azkarra eskaintzen dute metodo zehatz bat datu zehatzak bilatzeko, atera eta ordezkatzeko dokumentuetan. Adierazpen erregularrek adierazpen bilatzaile bat deskribatzeko textu-adierazpen berezi bat dira.

Horrela, dokumentuaren edukia eskatutako kate karakteristikookin bilatzen da eta irakurtzen da.Adierazpen erregularrek informazio mintegiak definitu ditzaketen ereduak definitzeko erabiltzen dira.

Regex metodoak ondo egokitzeko gai dira, azalpenak ezinezkoak dira diren balioak hasiera batean baino behin eta berriz erabiliko diren dokumentuetan.

Adibide bilera bat aurkitu dezakezu gure ComDesk orrian.

PaperOffice Regex Beispielsammlung
Aus der PaperOffice Regex Beispielsammlung können umfangreiche Ausdrücke verwendet werden

Nola eraiki daitezke adierazpen erregularrek?

Adierazpen erregularrek era desberdinetan eraiki daitezke, bilatzen den eredu mota bera ezagutzen denean.

Metakaraktereak erabili dezakezu, adibidez (.), (*), (+), (?), (^), ($), [] eta [a-z], hizki edo eredu mota bereziak adierazteko.

Zati aukerakoak erabili dezakezu: Galdera-marka (?)-a edo izar-marka (*)-a erabili dezakezu adierazpenaren zatiak aukerazkoan bihurtzeko.

Taldeak erabili dezakezu: Bilatu-du-tei erabili dezakezu inguruneak taldekatu eta unitate bakarrean nolabait behandu nahi diren adierazpenaren zati bezala.

Garrantzitsua da adierazpen erregularraren arauak programazio-hizkuntzaren arabera antzekoak izan daitezkeelako ala ez jakitzea. Dena den, PaperOffice-aren erregularrak ECMAScript eta PCRE2-ekin bateragarriak izan behar dira.

Aholkua

"EZERKETA PAPERAREN PROZESAMENDUA / REGEX & BARIAK / FAKTURA-PROZESAMENDUA AUTOMATIZATU" gaiarekin, YouTube bidezko bideoa ere badago, astelezain eta garbi azalduko dena:

Nola atera ditzaket dokumentuaren informazioa REGEX bidez?

Adibideak

Artikulu honetan, REGEX bidez PaperOffice bidezko eskaeraren zenbait datu lortzen moduak erakutsiko dizkizugu, eta eskaeran datuak automatikoki dokumentua bidezkotzat gorde ahal izango dituzu.

Hemen dugu adibide dokumendu bat sortu dugu, zeinetan data zehaztua dago. Dokumentu honetan faktura bat da. Gure dokumentuan data-mota honela formatatua dago:

PaperOffice Rechnung mit Regex zu auslesen
Informationen automatisiert aus Rechnungen extrahieren

Hilabetea, letrak osaturik, baina lehen letran hizki larriz, ondoren hutsune bat, ondoren eguna, eta hurrengo koma bat, bestelako hutsune bat eta gero urtea.

Adibidez: Sep 20, 2019 edo Mär 05, 2022


Data hori atera nahi dugunean, hurrengo erregular expresioa (REGEX) erabili dezakegu:

([A-Z][a-zä]{2})\s(0[1-9]|[12][0-9]|3[01]),\s(20\d{2})

Eman dezagun esaldiak taldeka ulertzeko. Taldeak parentesi sinpleek () bereizten dituzte.

Lehen taldean 3 hilabete hizki-en bila jarraitzen dugu: ([A-Z][a-zä]{2})

([A-Z][a-zä]{2})\s(0[1-9]|[12][0-9]|3[01]),\s(20\d{2})

Hilabetearen xehetasunak atera

  • [A-Z] Kate honen bidez, A-Z-ko maiuskula bat bilatu nahi dugu. Adibidez, „S“ „Sept-ekotik“.
  • [a-zä]{2} Kate honen bidez, bi minuskulako hizki (a-z) eta / edo „ä“ (alemanierazko „März“ hilabete-izena) bilatu nahi ditugu. Adibidez, ep „Sep“-etik edo är „Mär“-etik.

Gero, hutsune bat bilatzen dugu: \s

([A-Z][a-zä]{2})\s(0[1-9]|[12][0-9]|3[01]),\s(20\d{2})

Egunaren xehetasunak atera

Bigarren taldean egunaren izenburua zenbaki bati buruz bilatzen dugu: (0[1-9]|[12][0-9]|3[01])

([A-Z][a-zä]{2})\s(0[1-9]|[12][0-9]|3[01]),\s(20\d{2})

Egunaren xehetasunak hiru agintza desberdinez bereiztu behar dira.
Dokumentuan zein data atera ahal duen ezagutzen ez badugu, hurrengo aukerak adierazi behar dira. Data batean azkeneko eguna (31) edo lehenengo eguna (01) egon daiteke, beraz agintza desberdinak izango dira.
Hauek benetan barneratu ahal dira „|“ karakterearekin bereizita.
Adibidez: (1|2|3) = 1 edo 2 edo 3.

Hazpandar aurreko parentesiak, onarturiko karaktere-zerrenda idazten da. Hazpandar lauak zenbait karaktere adierazten dituzte. Adibidez, adierazpena gehiago hizki deskribatu nahi badu, hauek txerto eransteko, orden honen batetik ezkerretik esaldia sartuko da frogapean.

Normala da ez beti guztiak adierazi beharrik izatea. Agian, osoko grupo babestuak karaktere batean soilik daude.

  • 0[1-9] Kate honen bidez, zeroz hasten den zenbaki bat izan daiteke, ondoren 1-9 arteko zenbaki bat izango duena. Hortaz, 01-09ko zenbaki baten bat.
  • Kateak, zeroz hasitako zenbakiak bilatzen ditu, frogak 0-arekin hasten den zenbaki-motak. Frogatu dokumentuak sostengatzen badu «5. März 2022» data adierazpena, hau da, bada bitan 0-rik txostenen irteera, «5»-aren aurretik dagoen 0-a frogako litzateke

  • [12][0-9] Kate honen bidez, bat edo bi-aren artean denbora hasi daiteke, 0-9 arteko zenbaki baten bat izan daiteke. Inferentziatzat, 10-29ko zenbaki bat atera daiteke.
  • 3[01] Kate honen bidez, hirurenek ezkerretik genituen 3aren aurrean hasi zitekeen zenbaki baten bat izan daiteke, 0 edo 1 bat izan daitekeena. Hau da, 30-a eta 31-a izan daitezke.

Eguneko esangaiak zehaztu aurretik, zenbaki bat jakin behar da.

Orain koma eta hutsunea bilatu behar ditugu: ,\s

([A-Z][a-zä]{2})\s(0[1-9]|[12][0-9]|3[01]),\s(20\d{2})

Urteko xehetasunak atera

Azken taldean urtearen bila jarraitzen dugu: (20\d{2})

([A-Z][a-zä]{2})\s(0[1-9]|[12][0-9]|3[01]),\s(20\d{2})

Eskaera zenbakia ateratzen, REGEX esker

Hurrengo adibide gisa, dokumentutik eskuratu nahi dugu eskaera zenbakia.

Variablen werden aus dem Dokument ausgelesen und bereitgestellt
Auftragsnummern werden aus dem Dokument extrahiert

Gure dokumentuan eskaera zenbakia hurrengo formatuan dago:

Zuzeneko 3 hizki hauestakin hasten da XYB, hurrengoa da lotura, ondoren 8 zenbaki, besterik gabe, berriz lotura bat eta azkenik 3 hizki larri batzuk ditu.

Eskaera zenbakiaren adibideak hauek izango dira:

XYB-12316723-LSH

XYB-98456723-JRD

Eskaera zenbaki hau atera ahal izateko, hurrengo erregulartasun adierazpena erabil daiteke:

XYB-\d{8}-[A-Z]{3}

Eremu horren adierazpena aztertu dezagun:

Lehenik eta behin bilatzen ditugu 3 hizki metodo larriekin: XYB-

XYB-\d{8}-[A-Z]{3}

Ondoren 8 zenbaki bilatzen ditugu, lotura bat ondorengoak dira: \d{8}-

XYB-\d{8}-[A-Z]{3}

\d, jada azaldu dugun moduan, 0tik 9ra arteko zenbaki bat balio du. Berriro ere, \d{8} balio hiru digituak bilatzen ditu.

Azkenik, 3 larri hizki bilatzen ditugu: [A-Z]{3}

XYB-\d{8}-[A-Z]{3}

Beraz, PaperOfficek hurrengo eskaera zenbakiak aukeratuko lituenez:

XYB-12316723-LSH

XYB-98456723-JRD

XYB-975432671829

ZYB-12342176-ZHD

XYB-12316723-LSH eta XYB-98456723-JRD bilatuko litu prakika.

Adibide honen berriko link bat prestatu dugu, non erregulartasun adierazpen azaldu behar den 4 adibideekin. Ikusiko duzu, eskaera zenbaki horietako bi bakarrik esan nahi ditugula.

Artikulu zenbakia atera, REGEX esker

Artikulu zenbakia gure dokumentuan hurrengo formatuan dago:

Bi letra larriez hasiko da beti, hurrengoa da lotura, ondoren 6 zenbaki.

PaperOffice Rechnung mit Regex zu auslesen
Verschiedene Artikelnummern können aus Rechnungen ausgelesen werden

Artikulu zenbakien adibideak hauek izango dira:

MS-863398

DS-452829

Artikulu zenbakiak atera ahal izateko, hurrengo erregulartasun adierazpena erabil dugu:

[A-Z]{2}-\d{6}

PaperOfficek zure dokumentuak digitalizatu eta zure sistemekin integra ditzake, fakturan eta beste agiri batzuetan datuak erautasiz automatizatuz, kode ugari idazte eta ondoren mantentze beharrik gabe.

Kontaktatu gurekin zure aplikazio-kasuak aztertzeko eta PaperOfficek nola erabili dezakezun jakiteko, zure negozio-ibilgaileran ere hanboratuin tak jakiteko.

Hasi ea pentsamenduak ziurtasun kontra dauzkazun.

Oraindik ulertzen ez baduzu, PaperOffice integratzea zure negozio-bizitzan adibide kasuak irakur ditzazkezu eta sinetsi informazioa eskuratzea errazteaz edo instalazio-probak eskatuz gero.

FAQs

Azkenik, gaiarekin lotutako galdera askoren erantzunak ematen ditugu "Erabili erregele-zuzenak REGEX datu automatizatua eta ateratzea (2. atala)":

Nori da paperezko bulego bat pribatua?

Galdera honetan erantzuna dauden enpresa guztientzat da: famili-gaiek jasaten dute paperezko bulegoetatik, start-up-ak eta enpresa handiek. Bereziki baloratuko da txiki eta ertaindako enpresenetarako aldatzea: trataerako lan eta kostuak murriztuz, diru-laguntza beharrezkoenak dohainduko dira hazkuntza-boosterretarako.

Erabili al dezaket enpresako cloud-aratzea ezpaperezko bulego baterako DMS Hornitzaile bezala?

Ez. DSGVOaren indarrean jarraipen definitiboaren aldian (2018. urtean) beti da ari den faktore gehiago, hau da, datuen babeserako legea. DMSak eta DMS Softwareak dokumentuen prozesatzeko, kudeatzeko eta biltegiratzeko erabiltzen dira, oso datu pertsonal sentitiboak izan ohi dituztenak. DSGVOra ekitekorra datu juridikoak iragarri ditu. 

Ondorioa

  • Abantailak ausapenak eta gastuak baliatzen

    Bertan digitala bezala lan egitea eta dokumentu zaharrak garai berriaren garaiarekin hurbiltzea gero dugun denbora, dirua eta nerbio asko aurreztea izango da.

  • Ezaugarriak geldiarazi behar dira

    Ez duzu IT aditu bat behar dituena digitalizazioaren abantaila guztiak aprobetxatzeko.
    Zure aldeko lagun egokiena behar duzu, bere esperientziaren bitartez zure beharrezkoena burutu dezakeena. Saiatu itzultzailuak saiakera-testuak aukeratu, apaintaldi baino egin ondo balitz bezala baino.

  • Maiztasunak dagoeneko existsatzen dira

    Arrazoizko bizitza duen arloa bakarrik ez du naueke kopilatzaile handi bat duela, bere aukera erabili gabe. Gailu horiek ategi pixkorrak maite dute, ofizil txekekin tolergarriak direla eta digitalizazio-hasierarako eskaerarik gabeko bartxo egiten dute nortasun.

  • Gastu jakin baino merkeagoak, duzuon DMS egokia duzuelarik

    Ez ititu DMS / ECM sistemek erabiltzaileak esplotatu behar dituzten kostu sugeinekin. Ez ititu dei-emaileei beren administrarazpen posibleen konpromisoak egiterik adierzaitutenantzazun adibidez, dokumentuak berak ikasteratzea eta ezarpenak egitea. Behar izanez gero, lagunduko dizue enpresak, baina iraun iten ondo, independente.

  • Digitalean automatizatzen etorkizuna da

    Inoiz barrena papera egiten? Lana automatikoki egiten da.
    Factura sartzen da? Workflowa agertzen da eta guztia bere bide definiatuan egiten du.
    1000 ohar-faktorez arakatzen? Ez problemarik ez dago, zure Google propioa daukazu!

PaperOffice-ek arazorik ez du ebazten: ziurtatuta.

Azterketa kasua

Aldaketa digitala rejillaren industrian: dokumentuen kudeaketa arrakastatsua

"Sareen industrian, digitalizazioaren gaia gero eta nabarmenagoa bihurtzen ari da. Hori, adibidez, gure albaranei, piezen zerrendei edo gure planoei, marrazkiei eta konfiguratzaileei aplikatzen zaie. PaperOffice DMS sartu ondoren, eskuzko ahalegina murriztu egin daiteke. Orain aitzindariak gara sare digitalen fabrikatzaile gisa".

Stephan Reichel jauna
K60 Gitterrostsysteme GmbH &Co.KG