The PaperOffice sisäpiiri-uutiskirje
The PaperOffice sisäpiiri-uutiskirje
Haluamme olla ystäviä.

Korkein mahdollinen alennustarjous

Yksinomainen sisäpiiritieto

Ilmaisia bonuksen päivityksiä

Korkein mahdollinen alennustarjous

Yksinomainen sisäpiiritieto

Ilmaisia bonuksen päivityksiä

Ystävyys luottamus Kunnia sana
Emme koskaan anna sähköpostiosoitettasi kenellekään muulle, ja jokaisessa sähköpostissa on yhden klikkauksen peruuta-tilauslinkki.

Suorita älykäs asiakirjankäsittely oikein


Vinkki

Automaattinen tiedonkeruu säännöllisillä lausekkeilla: Miten käsitellä suuria määriä dataa tehokkaasti säännöllisten lausekkeiden avulla.


Avain automaattiseen tiedonkeruuseen ja tietojen eristämiseen.

Nykyisessä artikkelissa näytämme, miten voit hyödyntää säännöllisiä lausekkeita nauttiaksesi automatisoidusta asiakirjojen käsittelystä. Tämä pätee erityisesti yritysten asiakirjoihin kaikilla toimialoilla.

Näytämme sinulle tarkkoja esimerkkejä säännöllisistä lausekkeista ja selitämme vaihe vaiheelta, mitä ne tarkoittavat ja miten niitä voi käyttää.

Näin voit lisätä liiketoiminnan tehokkuutta, vähentää ihmisen virheitä parantamalla tarkkuutta, alentaa nykyisiä kustannuksia, säilyttää tiedon eheyden ja parantaa tietoturvaa.

Tämä artikkeli laajentaa ensimmäistä osaa älykkäästä asiakirjankäsittelystä, pääset artikkeliin suoraan tästä.

Tiettyjen tietoelementtien eristäminen asiakirjoista voi olla erittäin kallis ja aikaavievä tehtävä. Usein asiakirjojen skannaukset lähetetään suuriin ulkoistettuihin tietojenkeruuyrityksiin, joissa tiedot syötetään käsin.

Tällä lähestymistavalla on kuitenkin erilaisia haittoja, kuten:

 • Asiakirjojen turvallisuus voi vaarantua
 • Työnkulun prosesseihin tulee viivästys
 • Manuaalisen indeksoinnin prosessi on hitaampi verrattuna automatisoituun tiedon eristämiseen
 • Manuaalinen indeksointi ei sovellu hyvin suuriin projekteihin
 • Manuaalinen indeksointi voi mahdollisesti tuoda virheitä tietoihin
 • Jos asiakirjaa muutetaan, koko prosessi alkaa alusta

Niin monia muita.

Paperiasiakirjoihin perustuu edelleen suuri osa liiketoiminnan tapahtumista, vaikka skannaamisen levinneisyys onkin suuri. Arvioidaan, että 85% laskuista on edelleen paperilla.

Lisäksi on olemassa vuoria olemassa olevaa paperia, jotka on varastoitu valtaviin varastoihin!

Mikä on säännöllinen lauseke?

Säännölliset lausekkeet, tunnetaan myös nimellä "regex", ovat tehokas työkalu tekstien etsimiseen ja manipulointiin. Ne mahdollistavat monimutkaisten mallien tunnistamisen ja muokkaamisen teksteissä.

Säännöllinen lauseke koostuu tavallisten kirjainten ja erikoismetamerkkien yhdistelmästä, joilla on erityisiä toimintoja.

Säännöllisiä lausekkeita voidaan myös käyttää tekstin korvaamiseen tai muokkaamiseen. Esimerkiksi säännöllinen lauseke voidaan käyttää.

Ne ovat erittäin tehokas työkalu tekstinkäsittelyyn ja tehtävien automatisointiin.

Miten säännölliset lausekkeet voivat auttaa yrityksen automatisoinnissa?

Eri tyyppisten ja nimikkeiltään erilaisten digitaalisten asiakirjojen määrän kasvaessa ilman riittävää hakujärjestelmää sekä tietyn sisällön tiedoista dokumenttien tulkitsemisprosessi vaikeutuu ja kestää kauemmin, erityisesti silloin, kun kyseessä on luokittelemattomat asiakirjat, haku on epätarkkaa ja vie aikaa.

Säännölliset lausekkeet (regex) tarjoavat nopean ja tehokkaan menetelmän tiettyjen tietojen etsimiseen, eristämiseen ja korvaamiseen asiakirjoista. Säännölliset lausekkeet ovat käytännössä erityinen tekstijono, joka kuvaa hakumallia.

Asiakirjan sisältöä etsitään ennalta määrätyn merkkijonon avulla ja eristetään se.Säännölliset lausekkeet ovat tapa määritellä malleja tietoihin käyttämällä erityisiä symboleja.

Regex-menetelmä sopii parhaiten asiakirjoihin, joiden poimittavien arvojen sijainnit voivat vaihdella ja yksinkertaiset asiakirjapohjat eivät riitä.

Luettelo yksinkertaisista ilmaisuista löytyy ComDeskistämme.

PaperOffice Regex Beispielsammlung
Aus der PaperOffice Regex Beispielsammlung können umfangreiche Ausdrücke verwendet werden

Kuinka voin koota säännöllisiä lausekkeita?

Säännöllisiä lausekkeita voidaan koota eri tavoin riippuen etsittävästä mallista.

Käytä erikoismerkkejä, kuten ., *, +, ?, ^, $, [] ja [a-z] edustamaan tiettyjä merkkejä tai malleja.

Käytä valinnaisia osia: käytä kysymysmerkkiä (?) tai tähteä (*), jotta osat mallista ovat valinnaiset.

Käytä ryhmiä: käytä pyöreitä sulkeita, jotta voit ryhmitellä osia mallista ja käsitellä niitä yhtenä kokonaisuutena.

On tärkeää huomata, että säännöllisten lausekkeiden säännöt voivat vaihdella ohjelmointikielestä riippuen. Siksi on tärkeää lukea käytettyjen työkalujen dokumentointi. PaperOfficeen käytetyt Regexit on oltava yhteensopivia ECMAScriptin ja PCRE2:n kanssa.

Vinkki

Automaattiseen asiakirjojen SÄILÖNTÄÄN / REGEX & Variaabelien / Laskujen automaattiseen käsittelyyn on myös YouTube-video, joka selittää tämän prosessin helposti ja ymmärrettävästi:

Sisältö

Kuinka saan tiedot dokumentistani REGEX:in avulla?

Käytännön esimerkkejä

Tässä artikkelissa näytämme, kuinka voit käyttää moniosaisia säännöllisiä lausekkeita PaperOffice-järjestelmässä, jotta voit poimia ja tallentaa automaattisesti dokumentin metatietoja.

Alla on esimerkkidokumentti, joka sisältää tietyn päivämäärän. Tässä dokumentissa on lasku ja päivämäärämuoto on seuraava:

PaperOffice Rechnung mit Regex zu auslesen
Informationen automatisiert aus Rechnungen extrahieren

Kuukausi koostuu kirjaimista, joista ensimmäinen kirjain on aina iso, sitten välilyönti, päivämäärä pilkulla erotettuna, toinen välilyönti ja sitten vuosi.

Esimerkiksi: Sep 20, 2019 tai Mär 05, 2022


Tämän päivämäärän poimimiseksi voimme käyttää seuraavaa säännöllistä lauseketta (REGEX):

([A-Z][a-zä]{2})\s(0[1-9]|[12][0-9]|3[01]),\s(20\d{2})

Pilkomme lausekkeen eri ryhmiin, jotka erotetaan yksinkertaisilla sulkeilla ().

Ensimmäisessä ryhmässä haemme kolmen kuukauden kirjainta: ([A-Z][a-zä]{2})

([A-Z][a-zä]{2})\s(0[1-9]|[12][0-9]|3[01]),\s(20\d{2})

Kuukauden poimiminen

 • [A-Z] Tämä merkkijono tarkoittaa, että etsimme isoja kirjaimia A-Z. Esimerkiksi kirjain „S“ sanan „Septem“ alusta. On huomattava, että iso- ja pienikirjaimet eroavat toisistaan.
 • [a-zä]{2} Tämä merkkijono tarkoittaa, että etsimme kahta pienikirjainta a-z ja myös ä:tä (saksankielisessä sanassa „März“). Esimerkiksi „ep“ sanasta „Sep“ tai „är“ sanasta „Mär“.

Etsimme sitten välilyöntiä käyttäen seuraavaa merkkijonoa: \s

([A-Z][a-zä]{2})\s(0[1-9]|[12][0-9]|3[01]),\s(20\d{2})

Päivän poimiminen

Toisessa ryhmässä etsitään numeromuotoista päivää: (0[1-9]|[12][0-9]|3[01])

([A-Z][a-zä]{2})\s(0[1-9]|[12][0-9]|3[01]),\s(20\d{2})

Päivä on jaettava kolmeen osaan, koska emme tiedä, mistä päivämäärätiedoista dokumentissa on kyse. Esimerkiksi päivä voi olla joko kuukauden alussa (01) tai lopussa (31), joten on määriteltävä useita vaihtoehtoja.

Hakuruudussa on luettelo sallituista merkeistä. Useampi hakuruutu vastaa useampia merkkejä. Jos ilmoitus kuvaa useita merkkejä, ne vain yhdistyvät toisiinsa. Sitten syöte verrataan lausekkeeseen vasemmalta oikealle.

On selvää, että kaikki numerot eivät aina näy. Koko ryhmä vastaa kuitenkin vain yhtä merkkiä.

 • 0[1-9] Tämä merkkijono tarkoittaa, että numero voi alkaa nollalla ja seuraavat luvut voivat olla välillä 1-9. Tällöin saadaan lukualue 01-09.
 • Merkkijono etsii numerojärjestelmää, jossa on nolla, jos dokumentissasi on yleensä päivämäärämuoto „5. März 2022“ ilman, että 0 on ennen 5, tarvitset tätä merkkijonoa.

 • [12][0-9] Tämä merkkijono tarkoittaa, että numero voi alkaa joko 1:llä tai 2:lla ja seuraavat numerot voivat olla mitä tahansa 0-9 väliltä. Tuloksena voi olla mikä tahansa luku välillä 10-29.
 • 3[01] Tämä merkkijono tarkoittaa, että numero voi alkaa 3:lla, ja sen jälkeen voi tulla joko 0 tai 1. Tuloksena voi olla 30 tai 31.

Kun päivälle on määritetty vaihtoehdot, on aika määrittää vuosi

Etsimme nyt pilkkua ja välilyöntiä: ,\s

([A-Z][a-zä]{2})\s(0[1-9]|[12][0-9]|3[01]),\s(20\d{2})

Vuoden poimiminen

Viimeisessä ryhmässä etsitään vuotta: (20\d{2})

([A-Z][a-zä]{2})\s(0[1-9]|[12][0-9]|3[01]),\s(20\d{2})

Aloituskohteenamme on mikä tahansa vuosi, joka on 2000 tai sen jälkeen.

 • 20 Tämä merkkijono tarkoittaa, että etsimme mitä tahansa vuotta, joka alkaa 20:llä.
 • \d{2} Tämä

Tilausnumerojen lukeminen REGEX:in avulla

Toisena esimerkkinä haluamme lukea tilausnumeron asiakirjasta.

Variablen werden aus dem Dokument ausgelesen und bereitgestellt
Auftragsnummern werden aus dem Dokument extrahiert

Asiakirjamme tilausnumero on muotoiltu seuraavasti:

Se alkaa aina isoilla kirjaimilla XYB, sitten on viiva, jota seuraa 8 numeroa, toinen viiva ja lopuksi 3 sattumanvaraista iso kirjainta.

Tilausnumeron esimerkkejä ovat:

XYB-12316723-LSH

XYB-98456723-JRD

Tilausnumeron erottamiseksi voimme käyttää seuraavaa säännöllistä lausetta:

XYB-\d{8}-[A-Z]{3}

Puretaan lause osiin yksitellen.

Etsimme ensin kolme isoa kirjainta viivalla: XYB-

XYB-\d{8}-[A-Z]{3}

Sitten etsimme 8 numeroa, jotka seuraa toista viivaa: \d{8}-

XYB-\d{8}-[A-Z]{3}

Merkki \d, kuten jo mainittiin, tarkoittaa numeroa väliltä 0-9, taas merkki \d{8} etsii 8-numeroista numeroyhdistelmää.

Ja lopuksi etsimme 3 mielivaltaista isoa kirjainta: [A-Z]{3}

XYB-\d{8}-[A-Z]{3}

PaperOffice tunnistaisi seuraavista tilausnumeroista:

XYB-12316723-LSH

XYB-98456723-JRD

XYB-975432671829

ZYB-12342176-ZHD

kaksi ensimmäistä XYB-12316723-LSH ja XYB-98456723-JRD

.

Olemme valmistaneet esimerkin kaltaiselle Regex101-linkin, joka näyttää juuri kuvaillun säännöllisen lauseen neljällä esimerkillä. Näet, että vain kahdet annetuista tilausnumeronäytteistä vastaavat vaatimuksiamme.

Artikkelinumeron lukeminen REGEX:in avulla

Artikkelinumero asiakirjassamme on muotoiltu seuraavasti:

Se alkaa aina kahdella isolla kirjaimella, sen jälkeen on viiva, ja perässä on 6 numeroa.

PaperOffice Rechnung mit Regex zu auslesen
Verschiedene Artikelnummern können aus Rechnungen ausgelesen werden

Artikkelinumeron esimerkkejä ovat:

MS-863398

DS-452829

Artikkelinumeroiden erottamiseksi voimme käyttää seuraavaa säännöllistä lausetta:

[A-Z]{2}-\d{6}

PaperOffice voi digitoida asiakirjasi ja integroida ne järjestelmiisi, jotta voit automatisoida tietojen erottamisen laskuista ja muista asiakirjoista, ilman että sinun tarvitsee kirjoittaa loputtomasti koodeja ja ylläpitää niitä myöhemmin.

Ota yhteyttä meihin, keskustellaan käyttötarkoituksestasi ja saadaan lisätietoa siitä, miten PaperOffice voi auttaa sinua kilpailemaan digitaalisella aikakaudella.

Aloitetaan on helpompaa kuin luuletkaan.

Oletko yhä huolissasi, etten pysty siihen? Lue asiakkaidemme tapaustutkimuksia PaperOffice-integraatiosta liiketoimintaasi ja vakuuta itsesi yksinkertaisuudesta tai hae testi-asennusta helposti.

FAQs

Lopuksi, vastaamme muutamaan usein kysyttyyn kysymykseen aiheesta "Käytä säännöllisiä lausekkeita REGEX automatisoituun tietojen keräämiseen ja poimintaan (osa 2)":

Kenelle paperiton toimisto sopii?

Nopea ja helppo vastaus kysymykseen on: kaikenlaisille yrityksille. Paperittomasta toimistosta hyötyvät kaikenlaiset yritystoimialat ja -koot, pienistä ja keskisuurista yrityksistä aina pieniin yrityksiin. Erityisen arvokas muutos on kuitenkin pienille ja keskisuurille yrityksille: Käsittelykustannusten ja -vaivannäön vähentämisen ansiosta tarvittava budjetti vapautuu muihin kasvun edistäjiin.

Voinko käyttää pilvipohjaista DMS-palveluntarjoajaa yrityksen paperittomaan toimistoon?

Ei. Toinen tekijä, joka on ollut kaikkien huulilla viimeistään vuonna 2018, kun GDPR lopullisesti tuli voimaan, on tietosuoja. DMS-ratkaisuja ja DMS-ohjelmistoja käytetään dokumenttien käsittelyyn, hallintaan ja säilyttämiseen, ja ne sisältävät usein arkaluonteisia henkilötietoja. GDPR:n rikkomisesta säädetään korkeat sakot.

Johtopäätös

 • Edut edut oikeuttavat vaivan ja kustannukset

  Digitaaliseen työskentelyyn siirtyminen ja vanhojen asiakirjojen tuominen uuteen aikaan on paras avaininvestointi, jonka avulla voit säästää uskomattoman paljon aikaa, rahaa ja hermoja tulevaisuudessa.

 • Tarvitset jonkun, jolla on tietämystä

  Sinun ei tarvitse omata omaa IT-asiantuntijaa hyödyntääksesi digitalisoinnin kaikkia etuja. Mitä tarvitset, on oikea kumppani rinnallasi, joka voi toteuttaa kokemuksensa perusteella juuri sitä, mitä tarvitset. Vältä paniikinlietsojia ja valitse kokeilukohteita sen sijaan, että luottaisit näyttäviin PowerPoint-esityksiin ilman todellista testausta.

 • Laitteisto on usein jo olemassa

  Kokemuksemme mukaan lähes jokaisella yrityksellä, firmalla ja organisaatiolla on suurennettuva kopiomasiini, joka ei hyödynnä mahdollisuuksiaan. Nämä laitteet rakastavat massaskannauksia, sietävät paperiliittimiä ja voivat toimia digitaalisen aloituksen perustana ilman skannerisijoitusta.

 • Halvempaa kuin odotit oikean DMS:n avulla

  Vältä kustannusansoja DMS / ECM -järjestelmissä, joihin olet armottomasti sidottu valmistajan toimesta. Älä tee kompromisseja omien hallinnointimahdollisuuksien suhteen, kuten esimerkiksi dokumenttien itseoppiminen ja asetusten tekeminen. Jos tarvitset apua, valmistaja auttaa mielellään, mutta pysy itsenäisenä ja riippumattomana.

 • Digitaalinen automatisointi on tulevaisuutta

  Toimintojen suorittuminen tulevaisuudessa on täysin identtistä, mutta täysin automatisoitua. Lasku saapuu? Työnkulku käynnistyy ja kaikki etenee kerran määritettyä polkua pitkin. Täytyykö etsiä tuhansia asiakirjahakemistoja? Ei ongelmaa, koska sinulla on oma Google!

PaperOffice ratkaisee jokaisen ongelman: Taattu.

Tapauskertomus

Digitaalinen muutos tuotekehityksessä - onnistunut dokumenttienhallinta

"Teollisuudessa digitalisaation aihe on yhä havaittavampi. Tämä koskee esimerkiksi teknisiä tietolomakkeitamme, asiakastietojamme, laskelmiamme tai suunnitelmiamme, piirustuksiamme ja kokoonpanojamme. PaperOffice DMS: n käyttöönoton jälkeen manuaalista työtä voitaisiin vähentää. Olemme nyt digitalisoinnin edelläkävijöitä tuotantoyhtiöissä, Teollisuus 4.0."

Antonio Jesús Sánchez
Butterfly Engineers S.L.:n toimitusjohtaja sekä tuote- ja prosessi-insinööri