Erabili erregele-zuzenak REGEX datu automatizatua eta ateratzea (2. atala)
Gehieneko deskontu ofertarik altuena
Exklusiboko barrukako albisteak
Doako bira eguneraketak
Gehieneko deskontu ofertarik altuena
Exklusiboko barrukako albisteak
Doako bira eguneraketak
Adiskidetasuna Sinadura Hitza Onurarako
Ez dugu zure helbide elektronikoa inori emanen eta gurekin bidaltzen duen edozein email-ek deskarga ezazu estekaren botoi bat baino ez du.
Ariketa honetan azalduko dizuegu nola erabili adierazpen erregularretak automatizatutako dokumentuen prozesamenduan izan ditzazuen abantailak atzitzeko. Hau bereziki enpresetako dokumentuak izanik da.
Adierazpen erregularretako adibide zehatzak erakutsiko dizkizuegu eta urratsetan azalduko dizugu horien esanahia eta nola erabili ahal dituzun ere.
Hori dela eta, zuen enpresetako eraginkortasuna areagotu ahal duzue, akatsak gutxiagotu ahal dituzue zehaztasun handiagoa emanez, kostu aktua murriztu ahal izatez, datu integritatea babestu ahal izatez eta datu segurtasuna hobetu ahal izatez.
Atal honetan, lehenengo bertsioaren ondoren ikusi daitekeen dokumentu- prozesamendu adimentsu baten gaineko argitalpena prestatzen dugu, hemen klikatu artikulura.
Dokumentu batzuk irakurri ditzazketen datu-elementu zehatzak ateratzeak lan garestia eta garraiatzea suposatzen du. Dokumentu eskanez egin ohi dira biltegi handietako datu-saltze-enpresetara bidaliak, non datuak esku-zabertuta sartzen baitira.
Hala ere, modu honetan har dituen desabantaila hainbat daude, honako hauetan barne:
Eta beste asko barne.
Eskaneatzeko hedapena dela eta, negozio-eragiketa handi batzuk igarotzen dira oraindik dokumentu-paperazko printzipioetan. Iragarriko da fakturak %85 paperran edo iruditan egiten direla.
Gainera, bertako papelak nahastegi handietan gordeta egon behar daude!!
Adierazpen erregularrek, aldez aurretik ezaguna ziren "Regex" dela, testuak bilatu eta manipulatzeko gune aberatsa dira. Testu konplexuak testuetan detektatzeko eta editatzeko aukera ematen dute.
Adierazpen erregular batek hizki normal eta metakaraktere bereziak batera ditu, haien funtzio bereziak dituztenak.
Adierazpen erregularrek testua ere ordeztu edo manipulatu ahal dute. Adibidez, erabili daiteke adibide honetan.
Zaituzten tresna oso boteretsuak dira testu-prozesadoa eta egitekoeko automatizazioa.
Testu desberdinen eta izenpetze arauen metatzeak dituzten dokumentu digitalen gehikuntza, eta sistemaren bilaketa nahikorik gabeko datuen atzera-irakurtze prozesua eta informazio dokumenten cola izaten da, bereziki eragileriak izan ezik, bilaketa desegokia eta luzerazkoa izaten da.
Horrela, dokumentuaren edukia eskatutako kate karakteristikookin bilatzen da eta irakurtzen da.Adierazpen erregularrek informazio mintegiak definitu ditzaketen ereduak definitzeko erabiltzen dira.
Regex metodoak ondo egokitzeko gai dira, azalpenak ezinezkoak dira diren balioak hasiera batean baino behin eta berriz erabiliko diren dokumentuetan.
Adibide bilera bat aurkitu dezakezu gure ComDesk orrian.
Adierazpen erregularrek era desberdinetan eraiki daitezke, bilatzen den eredu mota bera ezagutzen denean.
Metakaraktereak erabili dezakezu, adibidez (.), (*), (+), (?), (^), ($), [] eta [a-z], hizki edo eredu mota bereziak adierazteko.
Zati aukerakoak erabili dezakezu: Galdera-marka (?)-a edo izar-marka (*)-a erabili dezakezu adierazpenaren zatiak aukerazkoan bihurtzeko.
Taldeak erabili dezakezu: Bilatu-du-tei erabili dezakezu inguruneak taldekatu eta unitate bakarrean nolabait behandu nahi diren adierazpenaren zati bezala.
Garrantzitsua da adierazpen erregularraren arauak programazio-hizkuntzaren arabera antzekoak izan daitezkeelako ala ez jakitzea. Dena den, PaperOffice-aren erregularrak ECMAScript eta PCRE2-ekin bateragarriak izan behar dira.
Aholkua
"EZERKETA PAPERAREN PROZESAMENDUA / REGEX & BARIAK / FAKTURA-PROZESAMENDUA AUTOMATIZATU" gaiarekin, YouTube bidezko bideoa ere badago, astelezain eta garbi azalduko dena:
Artikulu honetan, REGEX bidez PaperOffice bidezko eskaeraren zenbait datu lortzen moduak erakutsiko dizkizugu, eta eskaeran datuak automatikoki dokumentua bidezkotzat gorde ahal izango dituzu.
Hemen dugu adibide dokumendu bat sortu dugu, zeinetan data zehaztua dago. Dokumentu honetan faktura bat da. Gure dokumentuan data-mota honela formatatua dago:
Hilabetea, letrak osaturik, baina lehen letran hizki larriz, ondoren hutsune bat, ondoren eguna, eta hurrengo koma bat, bestelako hutsune bat eta gero urtea.
Adibidez: Sep 20, 2019 edo Mär 05, 2022
Data hori atera nahi dugunean, hurrengo erregular expresioa (REGEX) erabili dezakegu:
Eman dezagun esaldiak taldeka ulertzeko. Taldeak parentesi sinpleek () bereizten dituzte.
Lehen taldean 3 hilabete hizki-en bila jarraitzen dugu: ([A-Z][a-zä]{2})
Gero, hutsune bat bilatzen dugu: \s
Bigarren taldean egunaren izenburua zenbaki bati buruz bilatzen dugu: (0[1-9]|[12][0-9]|3[01])
Egunaren xehetasunak hiru agintza desberdinez bereiztu behar dira.
Dokumentuan zein data atera ahal duen ezagutzen ez badugu, hurrengo aukerak adierazi behar dira. Data batean azkeneko eguna (31) edo lehenengo eguna (01) egon daiteke, beraz agintza desberdinak izango dira.
Hauek benetan barneratu ahal dira „|“ karakterearekin bereizita.
Adibidez: (1|2|3) = 1 edo 2 edo 3.
Hazpandar aurreko parentesiak, onarturiko karaktere-zerrenda idazten da. Hazpandar lauak zenbait karaktere adierazten dituzte. Adibidez, adierazpena gehiago hizki deskribatu nahi badu, hauek txerto eransteko, orden honen batetik ezkerretik esaldia sartuko da frogapean.
Normala da ez beti guztiak adierazi beharrik izatea. Agian, osoko grupo babestuak karaktere batean soilik daude.
Kateak, zeroz hasitako zenbakiak bilatzen ditu, frogak 0-arekin hasten den zenbaki-motak. Frogatu dokumentuak sostengatzen badu «5. März 2022» data adierazpena, hau da, bada bitan 0-rik txostenen irteera, «5»-aren aurretik dagoen 0-a frogako litzateke
Eguneko esangaiak zehaztu aurretik, zenbaki bat jakin behar da.
Orain koma eta hutsunea bilatu behar ditugu: ,\s
Azken taldean urtearen bila jarraitzen dugu: (20\d{2})
Hurrengo adibide gisa, dokumentutik eskuratu nahi dugu eskaera zenbakia.
Gure dokumentuan eskaera zenbakia hurrengo formatuan dago:
Zuzeneko 3 hizki hauestakin hasten da XYB, hurrengoa da lotura, ondoren 8 zenbaki, besterik gabe, berriz lotura bat eta azkenik 3 hizki larri batzuk ditu.
Eskaera zenbakiaren adibideak hauek izango dira:
XYB-12316723-LSH
XYB-98456723-JRD
Eskaera zenbaki hau atera ahal izateko, hurrengo erregulartasun adierazpena erabil daiteke:
Eremu horren adierazpena aztertu dezagun:
Lehenik eta behin bilatzen ditugu 3 hizki metodo larriekin: XYB-
Ondoren 8 zenbaki bilatzen ditugu, lotura bat ondorengoak dira: \d{8}-
\d, jada azaldu dugun moduan, 0tik 9ra arteko zenbaki bat balio du. Berriro ere, \d{8} balio hiru digituak bilatzen ditu.
Azkenik, 3 larri hizki bilatzen ditugu: [A-Z]{3}
Beraz, PaperOfficek hurrengo eskaera zenbakiak aukeratuko lituenez:
XYB-12316723-LSH
XYB-98456723-JRD
XYB-975432671829
ZYB-12342176-ZHD
XYB-12316723-LSH eta XYB-98456723-JRD bilatuko litu prakika.
Adibide honen berriko link bat prestatu dugu, non erregulartasun adierazpen azaldu behar den 4 adibideekin. Ikusiko duzu, eskaera zenbaki horietako bi bakarrik esan nahi ditugula.
Artikulu zenbakia gure dokumentuan hurrengo formatuan dago:
Bi letra larriez hasiko da beti, hurrengoa da lotura, ondoren 6 zenbaki.
Artikulu zenbakien adibideak hauek izango dira:
MS-863398
DS-452829
Artikulu zenbakiak atera ahal izateko, hurrengo erregulartasun adierazpena erabil dugu:
PaperOfficek zure dokumentuak digitalizatu eta zure sistemekin integra ditzake, fakturan eta beste agiri batzuetan datuak erautasiz automatizatuz, kode ugari idazte eta ondoren mantentze beharrik gabe.
Kontaktatu gurekin zure aplikazio-kasuak aztertzeko eta PaperOfficek nola erabili dezakezun jakiteko, zure negozio-ibilgaileran ere hanboratuin tak jakiteko.
Hasi ea pentsamenduak ziurtasun kontra dauzkazun.
Oraindik ulertzen ez baduzu, PaperOffice integratzea zure negozio-bizitzan adibide kasuak irakur ditzazkezu eta sinetsi informazioa eskuratzea errazteaz edo instalazio-probak eskatuz gero.
ERROR: LID-5759 missing
ERROR: LID-6036 missing
ERROR: LID-6035 missing
ERROR: LID-5763 missing
ERROR: LID-6039 missing
ERROR: LID-6035 missing
ERROR: LID-5756 missing
ERROR: LID-6042 missing
ERROR: LID-5803 missing
ERROR: LID-5793 missing
ERROR: LID-6069 missing
ERROR: LID-6070 missing
ERROR: LID-5787 missing
ERROR: LID-6072 missing
ERROR: LID-6035 missing
ERROR: LID-5789 missing
ERROR: LID-6077 missing
ERROR: LID-6070 missing
ERROR: LID-6074 missing
ERROR: LID-5771 missing
ERROR: LID-6075 missing
ERROR: LID-6035 missing
ERROR: LID-5777 missing
ERROR: LID-5759 missing
ERROR: LID-5763 missing
ERROR: LID-5800 missing
ERROR: LID-5769 missing
ERROR: LID-6082 missing
ERROR: LID-6083 missing
Web-based PWA for document intelligence — runs in the browser on any platform, EU-hosted, optional BYOS (Bring Your Own Storage).