PaperOffice İçeriden Bülten
PaperOffice İçeriden Bülten
Arkadaş olmak istiyoruz

En Yüksek İndirim Teklifleri

Özel içeriden haberler

Ücretsiz bonus yükseltmeler.

En Yüksek İndirim Teklifleri

Özel içeriden haberler

Ücretsiz bonus yükseltmeler.

Dostluk Güven Sözü ve Onur Sözü
E-posta adresinizi asla başka kimseye vermeyeceğiz ve her e-postada bir tıklamayla aboneliği iptal etme bağlantısı bulunur.

Akıllı belge yönetimini doğru bir şekilde gerçekleştirin.


İpucu

Düzenli ifadelerle otomatik veri yakalama: Büyük veri miktarlarını etkili bir şekilde nasıl işleyebileceğinizi gösteren düzenli ifadelerle otomatik veri yakalamanın anahtarı.

Mevcut makalede, otomatik belge işleme avantajlarından yararlanmak için düzenli ifadelerin nasıl kullanılacağını göstereceğiz. Bu özellikle herhangi bir sektördeki işletmelerin belgeleri için geçerlidir.

Düzenli ifadelerle ilgili kesin örnekleri gösterecek ve bunların ne anlama geldiğini ve nasıl kullanılabileceğinizi adım adım açıklayacağız.

Böylece iş verimliliğinizi artırabilir, daha yüksek hassasiyetle insan hatalarını azaltabilir, mevcut maliyetlerinizi düşürebilir, veri bütünlüğünü koruyabilir ve veri güvenliğinizi iyileştirebilirsiniz.

Mevcut makale, akıllı belge işleme hakkındaki ilk bölümü genişletmektedir, makaleye buradan doğrudan erişebilirsiniz.

Belgelerden belirli veri öğelerini çıkarmak son derece maliyetli ve zaman alıcı bir görev olabilir. Sık ​​sık belge taramaları, büyük dış kaynaklı veri yakalama şirketlerine gönderilir, burada veriler manuel olarak girilir.

Ancak bu yaklaşıma çeşitli dezavantajlar da vardır, şunlar gibi:

  • Bu, belge güvenliğini tehlikeye atabilir
  • İş akışı süreçlerinde gecikmeye neden olur
  • Manuel indeksleme otomatik çıkarma ile karşılaştırıldığında yavaş bir işlemdir
  • Büyük projelerde manuel endeksleme iyi ölçeklendirilemez
  • Manuel indeksleme verilere hata sokabilir
  • Bir belge değiştirildiğinde, tüm süreç baştan başlar

Ve diğer birçok dezavantaj.

Taramanın yaygınlığına rağmen, işlemlerin büyük kısmı hala kağıt tabanlı belgelere dayanmaktadır. Tahminlere göre, faturaların hala% 85'i kağıt üzerinde düzenlenmektedir.

Ayrıca, depolanması gereken devasa miktarlarda kağıt var!

Düzenli bir ifade nedir?

Düzenli ifadeler, metinleri aramak ve değiştirmek için güçlü bir araç olarak bilinir. Metinlerde karmaşık desenleri algılamak ve düzenlemek için kullanılırlar.

Bir düzenli ifade, özel işlevlere sahip normal harflerin ve özel meta karakterlerin bir kombinasyonundan oluşur.

Düzenli ifadeler aynı zamanda metni değiştirmek veya manipüle etmek için de kullanılabilir. Örneğin, bir düzenli ifade kullanılabilir.

Bunlar, metin işleme ve görev otomasyonu için çok güçlü bir araçtır.

Düzenli İfadeler, bir şirketin otomasyonuna nasıl yardımcı olabilir?

Farklı tiplerde, farklı adlandırma kurallarına sahip ve yeterli bir arama sistemi olmadan dijital belgelerin artması, belge bilgilerinin belirli içeriklerden çıkarılma sürecini ve ayrıştırma sürecini zorlaştırmaktadır, özellikle sınıflandırılmamış belgelerle ilgili olduğunda, arama doğru olmaz ve uzun sürer.

Regüler ifadeler (Regex), belgelerde belirli verileri arama, çıkarma ve değiştirme için hızlı ve güçlü bir yöntem sunar. Düzenli ifadeler, temelde bir arama desenini tanımlayan özel bir metin dizesidir.

Bu şekilde belge içeriği belirtilen bir karakter dizisi ile aranır ve okunur.Düzenli ifadeler, özel simgeler kullanarak bilgilerde desenleri tanımlama yoludur.

Düzenli ifade yöntemi, çıkarılacak değerlerin pozisyonlarının değişebileceği belgeler için en uygun olanıdır ve basit belge şablonları işe yaramaz.

Basit ifadelerle bir liste için ComDesk sayfamızı ziyaret edebilirsiniz.

PaperOffice Regex Beispielsammlung
Aus der PaperOffice Regex Beispielsammlung können umfangreiche Ausdrücke verwendet werden

Düzenli ifadeler nasıl yapılandırılır?

Düzenli ifadeler, aranan desen türüne bağlı olarak farklı şekillerde yapılandırılabilir.

Karakterler veya kalıplar belirtmek için ., *, +, ?, ^, $, [] ve [a-z] gibi meta karakterleri kullanın.

İsteğe bağlı parçaları kullanın: Parçaları isteğe bağlı hale getirmek için ? (soru işareti) veya * (yıldız) işaretini kullanın.

Grupları kullanın: Parçaları gruplayın ve bunları bir birim olarak ele almak için parantez kullanın.

Düzenli ifadelerin kuralları programlama dillerine göre farklılık gösterebilir. Bu nedenle, kullanılan araçların belgelerini okumanız önemlidir. PaperOffice için yazılan RegEx, ECMAScript ve PCRE2 ile uyumlu olmalıdır.

İpucu

"Otomatik belge arşivleme / Regex & Değişkenler / Fatura işleme otomasyonu" konulu bir video da bulunmaktadır. Bu süreci basit ve anlaşılır bir şekilde açıklıyor.

İçerik

Dokümandan bilgi nasıl çıkarırım REGEX ile?

Uygulama Örnekleri

Bu makalede, PaperOffice'da çok elemanlı düzenli ifadeler (REGEX) kullanarak belgenizden herhangi bir veriyi çıkarmanızı ve otomatik olarak belge etiketlerine yerleştirmenizi göstereceğiz.

Aşağıda, belirli bir tarih içeren bir örnek belge oluşturduk. Bu belge bir fatura. Belgemizdeki tarih şu şekilde biçimlendirilmiştir:

PaperOffice Rechnung mit Regex zu auslesen
Informationen automatisiert aus Rechnungen extrahieren

Ay, büyük harfle başlayan harflerden oluşur ve ardından bir boşluk, günün ardından bir virgül, başka bir boşluk ve ardından yıl gelir.

Örneğin: Eyl 20, 2019 veya Mar 05, 2022


Bu tarihi çıkarmak için aşağıdaki düzenli ifadeyi (REGEX) kullanabiliriz:

([A-Z][a-zä]{2})\s(0[1-9]|[12][0-9]|3[01]),\s(20\d{2})

İfadeyi gruplarına ayırmaya başlayalım. Bu gruplar basit parantezler () ile ayrılır.

İlk grupta 3 harfli ayları arıyoruz: ([A-Z][a-zä]{2})

([A-Z][a-zä]{2})\s(0[1-9]|[12][0-9]|3[01]),\s(20\d{2})

Ayı çıkar

  • [A-Z] Bu karakter dizisi, büyük harflerden A-Z arasında bir harf aradığımızı belirtir. Örneğin, S harfi Sept kelimesinde olduğu gibi. Büyük-küçük harf ayrımının ayrı olarak ele alınması gerektiğine dikkat edin.
  • [a-zä]{2} Bu karakter dizisi, küçük harflerden a-z ve aynı zamanda ä (Almanca "März" ay adı için) harf dizisini aradığımızı belirtir. Bu, "Sep" kelimesinin ep veya Almanca "Mär" kelimesinin är kısmı olabilir.

Ardından bir boşluk ile bir dize ararız: \s

([A-Z][a-zä]{2})\s(0[1-9]|[12][0-9]|3[01]),\s(20\d{2})

Günü çıkar

İkinci grupta, gün adını sayılarla arıyoruz: (0[1-9]|[12][0-9]|3[01])

([A-Z][a-zä]{2})\s(0[1-9]|[12][0-9]|3[01]),\s(20\d{2})

Gün ifadesi üç farklı talimatla ayrıldı.
Belgede hangi tarih ifadesinin olabileceğini bilmediğimizden, ayın ilk günü (01) veya ayın son günü (31) olabileceğini tahmin etmeliyiz, bu nedenle ilgili seçenekler ayrı ayrı adlandırılmalıdır.
Bunlar | işaretiyle ayrılır.
Örnek: (1|2|3) = 1 ya da 2 ya da 3.

Köşeli parantez içinde izin verilen karakterlerin bir listesi yer alır. Bir ifade birden fazla karakteri tanımlamak için, bunları yan yana eklemeniz yeterlidir. Ardından girişiniz, sağdan sola doğru ifadenizle karşılaştırılır.

Tanımlanan tüm sayıların her zaman kullanılması gerekmez. Klamplı ifadenin tamamı, tek bir karakter için kullanılır.

  • 0[1-9] Bu karakter dizisi bir sıfır ile başlayan ve ardından 1 ila 9 olan bir sayı ile eşleşeceğimizi belirtir. Bu şekilde 01 ila 09 arasında herhangi bir sayı alırız.
  • Karakter dizisi, bir sıfır ile başlayan bir numara modelini arar. Belgeniz genellikle "5. März 2022" tarihini içeriyorsa, yani sayı "5" den önce "0" olmadan, bu durumda karakter diziden "0" çıkarılır.

  • [12][0-9] Bu karakter dizisi, bir "1" veya "2" ile başlayabilecek ve ardından 0 ila 9 arasında herhangi bir sayıyla eşleşebileceğimizi belirtir. Sonuç, 10 ila 29 arasında herhangi bir sayı olabilir.
  • 3[01] Bu karakter dizisi, "3" ile başlayan ve ardından "0" veya "1" olan bir sayıyı eşleştirebileceğimizi belirtir. Sonuç 30 veya 31 olabilir.

Gün seçenekleri belirlendikten sonra, yıl ifadesi belirlenmelidir.

Şimdi virgül ve boşluğa bakıyoruz: ,\s

([A-Z][a-zä]{2})\s(0[1-9]|[12][0-9]|3[01]),\s(20\d{2})

Yılı çıkar

Son grupta yılı arıyoruz: (20\d{2})

([A-Z][a-zä]{2})\s(0[1-9]|[12][0-9]|3[01]),\s(20\d{2})

Herhangi bir yıl için aramaya başlıyoruz, ancak ≥ 2000 olacağını biliyoruz.

  • 20 Bu karakter dizisi, belirli bir yı

REGEX ile Sipariş Numarasını Okuma

Bir diğer örnek olarak, belgeden sipariş numarasını okumak istiyoruz.

Variablen werden aus dem Dokument ausgelesen und bereitgestellt
Auftragsnummern werden aus dem Dokument extrahiert

Sipariş numarası belgemizde şu şekilde formatlanmıştır:

Bu her zaman büyük harflerle XYB ile başlar, ardından bir tire gelir, bunu sekiz rakam, bir daha tire, ve son olarak üç rastgele büyük harf izler.

Örnek sipariş numaraları:

XYB-12316723-LSH

XYB-98456723-JRD

Bu sipariş numarasını çıkarmak için şu düzenli ifadeyi kullanabiliriz:

XYB-\d{8}-[A-Z]{3}

Gelin, ifadeyi ayrı ayrı inceleyelim.

İlk olarak tire işaretiyle tam olarak ilk üç büyük harfi arıyoruz: XYB-

XYB-\d{8}-[A-Z]{3}

Ardından sekiz rakam ve bir daha tire arıyoruz: \d{8}-

XYB-\d{8}-[A-Z]{3}

Daha önce belirtildiği gibi, \d karakteri 0 ile 9 arasındaki bir rakam için kullanılır, \d{8} ise sekiz haneli bir sayıyı arar.

Son olarak, üç büyük harf arıyoruz: [A-Z]{3}

XYB-\d{8}-[A-Z]{3}

Örneğin, PaperOffice aşağıdaki sipariş numaralarından:

XYB-12316723-LSH

XYB-98456723-JRD

XYB-975432671829

ZYB-12342176-ZHD

XYB-12316723-LSH ve XYB-98456723-JRD gibi ilk iki numarayı tanır.

Belirtmiş olduğumuz dört örnekyle birlikte açıklanan bu düzenli ifade için Regex101 üzerinde bir link oluşturduk. Göreceksiniz ki, verilen sipariş numaralarından sadece ikisi gereksinimlerimize uygun.

REGEX ile Ürün Numarasını Okuma

Ürün numarası belgemizde şu şekilde formatlanmıştır:

Bu her zaman iki büyük harf ile başlar, ardından bir tire gelir, bunu altı rakam izler.

PaperOffice Rechnung mit Regex zu auslesen
Verschiedene Artikelnummern können aus Rechnungen ausgelesen werden

Örnek ürün numaraları:

MS-863398

DS-452829

Bu ürün numaralarını çıkarmak için şu düzenli ifadeyi kullanabiliriz:

[A-Z]{2}-\d{6}

PaperOffice, faturalardan ve diğer belgelerden veri çıkarma işlemini gerçekleştirmenizi sağlamak için belgelerinizi dijitalleştirebilir ve sistemlerinize entegre edebilir. Bu işlem için sayısız kod yazmak ve ardından bunları sürdürmek zorunda kalmazsınız.

Uygulama durumlarınız hakkında konuşmak ve PaperOffice'in dijital çağda daha rekabetçi olmanıza nasıl yardımcı olabileceği hakkında daha fazla bilgi edinmek için bizimle iletişime geçin.

Başlamanız düşündüğünüzden daha kolay.

Bunu başaramayacağınız hakkında hala endişeleriniz mi var? Müşterilerimizin PaperOffice'i iş hayatına entegre etme hikayelerini okuyun ve kolaylığını kendiniz görün veya test kurulumu isteyin.

FAQs

Son olarak, konuyla ilgili birkaç daha sık sorulan soruya cevap veriyoruz. "Otomatik Veri Yakalama ve Çıkarma İçin Düzenli İfadeler REGEX Kullanımı (Bölüm 2)":

Elektronik ev kimlere uygundur?

Hızlı ve kolay cevap şudur: her şirkete. Herhangi bir işletme sektörü ve büyüklüğü elektronik bir ofisten yararlanabilir, küçük ve orta ölçekli işletmeler için ise geçişi özellikle değerlidir: İşleme ve maliyetleri azaltarak, gereken bütçe için daha fazla büyüme faktörü serbest kalır.

Şirketimde bulut tabanlı bir DMS sağlayıcısı kullanabilir miyim?

Hayır. Son olarak, özellikle 2018'de kesin olarak yürürlüğe giren GDPR ile herkesin aklında olan başka bir faktör de veri korumasıdır. DMS çözümleri ve DMS yazılımı, sıklıkla hassas, kişisel veriler içeren belgelerin işlenmesi, yönetimi ve depolanması için kullanılır. GDPR'ye karşı ihlallerde, yasama organı yüksek para cezaları öngörüyor.

Sonuç

  • Faydalar, çabayı ve maliyeti haklı çıkarır

    Dijital çalışmak ve eski belgeleri yeni çağa taşımak, gelecekte inanılmaz miktarda zaman, para ve sinir tasarrufu sağlayacak en iyi temel yatırım olacak.

  • Bu konuda bilgi sahibi birine ihtiyacınız var

    Dijitalleşmenin tüm faydalarından yararlanmak için kendi IT uzmanınıza ihtiyacınız yoktur. İhtiyacınız olan doğru ortak, deneyimleriyle ihtiyaçlarınızı tam olarak uygulayabilecek biri. Paniğe kapılanlardan kaçının ve gerçekten test etmeden yapılmış şık PowerPoint sunumları yerine test yerleştirmelerini tercih edin.

  • Donanım genellikle mevcuttur

    Tecrübelere göre, hemen hemen her işletme bir büyük fotokopi makinesine sahiptir ve bu makine olanaklarını kullanmaz. Bu cihazlar toplu taramaları çok sever, ataçlara karşı hoşgörülüdür ve tarayıcı yatırımı olmadan dijital başlamanın temeli olabilir.

  • Doğru DMS ile beklenenden daha uygun maliyetli

    DMS / ECM sistemleri ile ilgili mali tuzağa düşmekten kaçının. Kendi yönetim olanaklarına sahip olma konusunda taviz vermeyin, belgeyi kendiniz öğrenin ve ayarları yapın gibi. Yardım ihtiyacınız varsa, üretici size yardımcı olabilir, ancak bağımsızlık ve özgürlüğünüzü koruyun.

  • Diğerleştirmek geleceğin yolu

    İşlemler gelecekte tamamen aynı şekilde ancak tam otomatik olarak gerçekleşir. Fatura bir geliyor? İş akışı tetiklenir ve herşey bir kez tanımlanan yolu takip eder. 1000 dosya klasörünü aramak? Sorun değil, çünkü kendi Google'ınız var!

PaperOffice her problemi çözer: Garantili.

Durum incelemesi

IDC Construccion, PaperOffice DMS ile İnşaat Sektöründe Doküman Yönetimini Nasıl Devrimleştiriyor