Biuletyn informacyjny PaperOffice Insider
Biuletyn informacyjny PaperOffice Insider
Chcemy zostać przyjaciółmi

Najwyższe możliwe oferty rabatowe

Wy

Darmowe bonusowe uaktualnienia

Najwyższe możliwe oferty rabatowe

Wy

Darmowe bonusowe uaktualnienia

Przyjaźń Zaufanie Słowo Honoru
Nigdy nie podamy twojego adresu e-mail nikomu innemu, a każdy e-mail zawiera link do wypisania z listy subskrybentów jednym kliknięciem.

Prawidłowe przeprowadzenie inteligentnego przetwarzania dokumentów


Wskazówka dla profesjonalistów

Automatyczne zbieranie danych za pomocą wyrażeń regularnych: Jak efektywnie przetwarzać duże ilości danych za pomocą wyrażeń regularnych.


Klucz do automatycznego zbierania danych i ekstrakcji danych.
W bieżącym artykule pokażemy Ci, jak korzystać z wyrażeń regularnych, aby czerpać korzyści z automatyzacji przetwarzania dokumentów. Dotyczy to zwłaszcza dokumentów firmy z dowolnej branży.Przedstawimy dokładne przykłady wyrażeń regularnych i krok po kroku wyjaśnimy, co oznaczają i jak można je zastosować.Dzięki temu można zwiększyć wydajność działalności, zmniejszyć błędy ludzkie dzięki większej dokładności, obniżyć obecne koszty, zachować integralność danych i poprawić bezpieczeństwo danych.Ten aktualny artykuł rozszerza pierwszą część na temat inteligentnego przetwarzania dokumentów, tutaj znajdziesz bezpośredni link do artykułu.Wyodrębnianie określonych elementów danych z dokumentów może być niezwykle kosztownym i czasochłonnym zadaniem. Często skany dokumentów są wysyłane do dużych firm outsourcingowych zajmujących się gromadzeniem danych, gdzie dane są wprowadzane ręcznie.Jednak istnieje wiele wad takiego podejścia, które należy uwzględnić:Bezpieczeństwo dokumentów może zostać zagrożoneWprowadzany jest opóźnienie w procesach workflowW porównaniu do automatycznego wydobywania, indeksowanie ręczne jest wolnym procesemRęczne indeksowanie nie skaluje się dobrze w przypadku dużych projektówRęczne indeksowanie może wprowadzać błędy do danychW przypadku zmiany dokumentu cały proces musi zostać rozpoczęty od nowaOraz wiele innych.Mimo rozpowszechnienia skanowania, znaczna część transakcji biznesowych nadal opiera się na dokumentach w formie papierowej. Szacuje się, że 85% faktur wciąż jest wystawianych na papierze.Ponadto istnieje składnica istniejącego papieru, która musi być przechowywana w gigantycznych magazynach!Czym jest wyrażenie regularne?Wyrażenia regularne, znane również jako "Regex", są potężnym narzędziem do wyszukiwania i manipulowania tekstem. Pozwalają na rozpoznawanie i edycję złożonych wzorców w tekście.Wyrażenie regularne składa się z połączenia zwykłych liter i specjalnych znaków metaznaczników, które mają specjalne funkcje.Wyrażenia regularne mogą być również używane do zastępowania lub manipulowania tekstem. Na przykład wyrażenie regularne można użyć.Są to bardzo potężne narzędzia do przetwarzania tekstu i automatyzacji zadań.Jak wyrażenia regularne mogą pomóc w automatyzacji firmy?Wzrost ilości cyfrowych dokumentów o różnych typach, różnych regułach nazewnictwa i braku systemu wyszukiwania utrudnia proces wyszukiwania i wyciągania informacji z dokumentów z określonej zawartości, zwłaszcza jeśli są to nieklasyfikowane dokumenty, wyszukiwanie jest niedokładne i trwa długo.Wyrażenia regularne (Regex) oferują szybki i potężny sposób na wyszukiwanie, wyciąganie i zastępowanie określonych danych w dokumentach. Wyrażenia regularne to specjalny ciąg znaków używany do opisu wzorca wyszukiwania.Tak więc zawartość dokumentu jest wyszukiwana i odczytywana na podstawie określonego ciągu znaków.Wyrażenia regularne są sposobem definiowania wzorców w informacjach za pomocą specjalnych symboli.Metoda Regex jest najlepiej adaptowana do dokumentów, w których pozycje do odczytu mogą się różnić, a proste szablony dokumentów nie działają.Listę prostych wyrażeń znajdziesz w naszym ComDesku.Jak mogę złożyć wyrażenia regularne?Wyrażenia regularne można montować na różne sposoby, w zależności od poszukiwanego rodzaju wzorca.Użyj znaków metaznaczników, takich jak ., *, +, ?, ^, $, [] i [a-z], aby reprezentować określone rodzaje znaków lub wzorce.Użyj części opcjonalnych: użyj znaku zapytania (?) lub gwiazdki (*), aby części wzorca były opcjonalne.Używaj grup: używaj nawiasów okrągłych, aby grupować części wzorca i traktować je jako jedną jednostkę.Warto zauważyć, że zasady wyrażeń regularnych mogą się różnić w zależności od języka programowania. Ważne jest, aby zapoznać się z dokumentacją używanych narzędzi. Wyrażenia regularne pisane dla PaperOffice muszą być zgodne z ECMAScript i PCRE2.
Zawartość

Wyszukiwanie numeru zamówienia za pomocą REGEX

Jako kolejny przykład chcemy odczytać numer zamówienia z dokumentu.

Variablen werden aus dem Dokument ausgelesen und bereitgestellt
Auftragsnummern werden aus dem Dokument extrahiert

Numer zamówienia w naszym dokumencie jest formatowany następująco:

Zawsze zaczyna się od wielkich liter XYB, następnie jest myślnik, a następnie 8 cyfr, kolejny myślnik i na końcu 3 losowe duże litery.

Przykłady numerów zamówień:

XYB-12316723-LSH

XYB-98456723-JRD

Aby wyodrębnić ten numer zamówienia, możemy użyć następującego wyrażenia regularnego:

XYB-\d{8}-[A-Z]{3}

Złóżmy teraz to wyrażenie na części.

Pierwsze 3 duże litery są wyszukiwane przy użyciu symbolu myślnika: XYB-

XYB-\d{8}-[A-Z]{3}

Następnie szukamy 8 cyfr, po których występuje kolejny myślnik: \d{8}-

XYB-\d{8}-[A-Z]{3}

Znak \d, jak już opisaliśmy, oznacza cyfrę od 0 do 9, a znak \d{8} oznacza ośmiocyfrową liczbę.

Na koniec szukamy 3 dowolnych dużych liter: [A-Z]{3}

XYB-\d{8}-[A-Z]{3}

W ten sposób PaperOffice rozpoznaje dwa pierwsze numery zamówień:

XYB-12316723-LSH

XYB-98456723-JRD

XYB-975432671829

ZYB-12342176-ZHD

XYB-12316723-LSH i XYB-98456723-JRD

są wyodrębniane z tych numerów zamówień.

W tej przykładzie przygotowaliśmy link do Regex101, na którym wymieniono wyrażenie regularne we wszystkich czterech przykładach. Widzisz, że tylko dwa z podanych numerów zamówień spełniają nasze wymagania.

Wyszukiwanie numerów artykułu za pomocą REGEX

Numer artykułu w naszym dokumencie jest formatowany następująco:

Zawsze zaczyna się od dwóch dużych liter, a następnie jest myślnik, a po nim 6 cyfr.

PaperOffice Rechnung mit Regex zu auslesen
Verschiedene Artikelnummern können aus Rechnungen ausgelesen werden

Przykłady numerów artykułów:

MS-863398

DS-452829

Aby wyodrębnić te numery artykułów, możemy użyć następującego wyrażenia regularnego:

[A-Z]{2}-\d{6}

PaperOffice może cyfrowo przetwarzać dokumenty i integrować je z systemami, aby zautomatyzować ekstrakcję danych z faktur i innych dokumentów, bez konieczności pisania i utrzymania wielu kodów.

Skontaktuj się z nami, aby omówić swoje przypadki użycia i dowiedzieć się więcej na temat tego, jak PaperOffice może pomóc Ci jeszcze bardziej konkurować w erze cyfrowej.

Zaczynaj jest prostsze, niż myślisz.

Czy nadal masz obawy, czy sobie poradzisz? Przeczytaj studia przypadków naszych klientów na temat integracji PaperOffice z Twoim biznesem i przekonaj się sam o prostocie, lub po prostu poproś o instalację testową.

FAQs

W końcu odpowiemy na kilka innych najczęściej zadawanych pytań na ten temat. "Używaj wyrażeń regularnych REGEX do automatycznego zbierania i ekstrakcji danych (Część 2)":

Dla kogo nadaje się biuro bez papieru?

Szybka i prosta odpowiedź brzmi: dla każdej firmy. Korzyści ze zmiany na biuro bez papieru mają wszelkie rodzaje i wielkości firm, od małych i średnich przedsiębiorstw po startupy i duże korporacje. Szczególnie wartościowa jest ta zmiana dla małych i średnich firm: Redukcja nakładów i kosztów umożliwia zwolnienie niezbędnych środków na dalszy rozwój

Czy mogę używać dostawcy DMS w chmurze do mojego biura bez papieru w firmie?

Nie. Kolejny czynnik, który od czasu formalnego wejścia w życie ogólnego rozporządzenia o ochronie danych w 2018 r. jest na ustach wszystkich, to ochrona danych osobowych. Rozwiązania DMS i oprogramowanie DMS są wykorzystywane do przetwarzania, zarządzania i przechowywania dokumentów zawierających często wrażliwe dane osobowe. W przypadku naruszenia ogólnego rozporządzenia o ochronie danych osobowych, ustawodawca przewiduje wysokie kary pieniężne.

Podsumowanie

  • Korzyści przewyższają wysiłek i koszty

    Praca w trybie cyfrowym i wprowadzenie starych dokumentów do nowej ery będzie najlepszą inwestycją w oszczędności czasu, pieniędzy i nerwów w przyszłości.

  • Potrzebujesz kogoś, kto się na tym zna

    Nie potrzebujesz własnego specjalisty ds. IT, aby korzystać z korzyści cyfryzacji.
    Właśnie potrzebujesz odpowiedniego partnera, który na podstawie swojego doświadczenia może zrealizować to, czego potrzebujesz. Unikaj panikarzy i wybieraj testowe wdrożenia zamiast ładnych prezentacji PowerPoint, które nie zostały naprawdę przetestowane.

  • Sprzęt jest z reguły już dostępny

    Doświadczenie pokazuje, że niemal każde przedsiębiorstwo, firma i przedsiębiorca ma duży kserokopiarkę, której nie wykorzystuje w pełni swoich możliwości. Te urządzenia uwielbiają skanować na masową skalę, tolerują spinacze biurowe i mogą stanowić podstawę dla cyfrowego startu bez konieczności inwestycji w skaner.

  • Tańsze niż się spodziewasz, przy właściwym DMS

    Unikaj pułapek kosztownych systemów DMS / ECM, w których jesteś całkowicie uzależniony od producenta. Nie kompromituj się, jeśli chodzi o możliwości zarządzania, takie jak samodzielne wprowadzanie dokumentów i konfigurowanie ustawień. Jeśli potrzebujesz pomocy, producent z chęcią ci pomoże, ale zachowaj niezależność i samodzielność.

  • Automatyzacja cyfrowa to przyszłość

    Procesy będą działać w sposób całkowicie identyczny, ale w pełni zautomatyzowany.
    Przychodzi faktura? Zapoczątkowany zostaje odpowiedni workflow i wszystko idzie już wyznaczoną drogą.
    Sprawdzenie wszystkich 1000 segregatorów? Żaden problem, bo masz swoje własne Google!

PaperOffice rozwiązuje każdy problem: gwarantowane.

Przykład zastosowania

Cyfrowe rozwiązania specjalistyczne do automatyzacji procesów biznesowych

"Ręczne przetwarzanie dokumentów w tak dużej społeczności kosztowałoby nas dużo czasu.
Dzięki zautomatyzowanemu rozwiązaniu PaperOffice DMS można znacznie zmniejszyć wysiłek ręczny, jednocześnie inwestując w technologię zorientowaną na przyszłość. Jesteśmy pionierami w cyfrowym zarządzaniu nieruchomościami".

Pan Alejandro Campos
specjalista IT i kierownik projektu w dziale zarządzania nieruchomościami El Guijo