Jak przyspieszyć pracę w działach operacyjnych- iOCR i RPS, czyli inteligentny odczyt danych w parze z robotyzacją

Działania związane z wprowadzaniem i przetwarzaniem danych w organizacji potrafią być niezwykle czasochłonne, żmudne, monotonne i kosztowne. Zwłaszcza, jeśli odbywają się w sposób manualny, który niesie ze sobą duże ryzyko pomyłek. Przy zastosowaniu odpowiednich systemów OCR, nie tylko można tego typu procesy przyśpieszyć, ale także zautomatyzować, sprawiając, że zaangażowanie siły roboczej spada nawet do 30%! W poniższym artykule opowiadamy właśnie o zrobotyzowanej transformacji danych oraz uczeniu maszynowym, a także korzyściach płynących z obu rozwiązań.

Czym są systemy OCR, czyli systemy do optycznego rozpoznawania znaków

Głównym zadaniem systemów OCR (optical character recognition) jest zamiana tekstu, którego nie jesteśmy w stanie odczytać w postaci cyfrowej (znajdującego się np. na zdjęciach lub grafikach), w twór w pełni zdigitalizowany. Dzieje się to przy pomocy zestawu technik lub specjalnego oprogramowania, a taka „obróbka” odbywa się zwykle z udziałem dokumentów zeskanowanych (formularzy, faktur, polis, zamówień, itp.).

Klasyczny, a inteligentny OCR 

Klasyczne systemy OCR zostały zaprojektowane, aby rozpoznawać treści drukowane oraz zapisywać je w wersji cyfrowej. Obsługują one dokumenty ustrukturyzowane, czyli o jednolitym formacie. Zastanawiałeś/łaś się czasem, dlaczego w pismach urzędowych występują „okienka” z podziałem na poszczególne litery, a określone pola (np. z imieniem i nazwiskiem) zawsze znajdują się na danym wzorze w tym samym miejscu? Znacznie ułatwia to proces digitalizacji, który nie wymaga wówczas stosowania zaawansowanych rozwiązań. Efektem końcowym będzie tutaj np. plik wordowski, który jesteśmy w stanie dowolnie edytować.

Co potrafi inteligentny OCR

Inteligentne systemy OCR mają z kolei znacznie bardziej rozbudowane możliwości. Pozwalają one między innymi na:

  • identyfikację typów dokumentów na podstawie elementów dla nich charakterystycznych (dla faktury będzie to np. numer, ponieważ każda taki posiada),
  • rozpoznawanie treści pisanych (zwłaszcza drukowanymi literami),
  • tworzenie obiegu dokumentów, czyli tzw. workflow,
  • obsługę dokumentów pół-ustrukturyzowanych (czyli posiadających ten sam zestaw danych, jednak znajdujących się w różnych lokalizacjach, jak to ma miejsce w przypadku faktur czy paragonów) – w ich przypadku wdrożenie systemu OCR przyniesie największe korzyści,
  • obsługę dokumentów nieustrukturyzowanych, czyli litych tekstów, takich jak np. umowy zlecenie (by znaleźć w nich informacje potrzebne są słowa lub znaki-klucze, a także stworzenie algorytmów i odpowiedniej logiki w systemie OCR),
  • obsługę zestawów dokumentów (np. wniosków z kompletem załączników),
  • auto-uczenie, czyli ciągłe doskonalenie się i przyswajanie przez maszyny nowych elementów (np. faktur od nowego dostawcy),
  • integrację z różnymi źródłami danych,
  • odczyt rozbudowanych elementów (np. tabele z wieloma kolumnami i wierszami).

iOCRi o co ten rwetes? Kilka słów o korzyściach

iOCR to tak naprawdę jeden system do obsługi wielu typów dokumentów. Jego głównym celem jest przekształcenie ich w ustrukturyzowane dane oraz zminimalizowanie czasu, który operator musi spędzić nad danym plikiem. Raczej nie zdarzy się sytuacja, w której jego zaangażowanie nie będzie zupełnie potrzebne – zawsze na etapie wdrożenia iOCRowania danych będzie wymagana osoba, która będzie odpowiadać za ich jakość (gdy skany będą miały słabą rozdzielczość, system może nie rozpoznać pewnych elementów). Zespoły wdrożeniowe firmy Mindbox zawsze dążą jednak do stworzenia procesu prawie w pełni zautomatyzowanego, w którym wkład człowieka będzie znikomy. Dzięki temu możliwe jest zwiększenie jego jakości, oszczędność czasu i środków, a także jego skalowalność i przyspieszenie. Nie wspominając już o jednoczesnym uwolnieniu energii osób, które mogą zaangażować się w ciekawsze i bardziej kreatywne zadania.

Wykorzystujemy do tego oprogramowanie (tzw. robota), które zawiera algorytm postępowania, czyli te same kroki, które wykonywaliby ludzie na aplikacjach, na których pracują (więcej o RPA, czyli robotyzacji, i jej korzyściach możecie przeczytać tutaj). Jest to możliwe bez głębokiej ingerencji w systemy, które już działają w danej firmie („robot” wykonuje swoje zadania w tle, natomiast można je podejrzeć na komputerze, który jest do niego przypisany).

Co jeszcze możemy uzyskać

Co więcej, możliwe jest zintegrowanie danych „wyprodukowanych” przez system OCR z systemami IT, z których korzystamy (np. CRM czy ERP), jak i systemami zewnętrznymi. Możemy to zrobić z wykorzystaniem API, elektronicznej wymiany danych czy baz danych (produktów itp.). Jeśli w grę wchodzą procesy zaawansowane, które wykorzystują wiele systemów w firmie, i zastosujemy do tego robota z zaimplementowanymi algorytmami, to po otrzymaniu danych z systemu OCR będzie on dokładnie wiedział, co ma z nimi zrobić. Może on dla przykładu pobrać je z pliku xml i wprowadzić do CRM czy aplikacji webowych.

Jeszcze bardziej wyrafinowanym rozwiązaniem jest zastosowanie w tej całej układance modeli uczenia maszynowego. Pozwalają one na zrozumienie danych dostarczonych przez system OCR, nadanie im kontekstu oraz ich interpretację. Następnie mogą one zostać przekazane do robota, który zajmie się ich odpowiednim przetworzeniem.

Przy procesach, które automatyzujemy w Mindbox, staramy się zatem nie skupiać tylko na jednym z dostępnych rozwiązań, a raczej tworzyć kombinację systemów OCR oraz elementów sztucznej inteligencji z wykorzystaniem odpowiedniego oprogramowania. Możliwości połączeń są tutaj nieskończone, przy czym proces wdrożeniowy rozwija się wraz z organizacją i jej potrzebami. Poszczególne algorytmy i logika mogą zostać rozbudowywane o kolejne elementy, zaś operatorzy, którzy pracują z daną aplikacją na co dzień, mogą samodzielnie dodawać kolejne reguły czy dostawców. Projekty iOCR realizujemy od początku do końca i towarzyszymy naszym klientom w przejściu wszystkich kroków, mając na koncie już ponad 60 zautomatyzowanych procesów realizowanych w ponad 30 krajach.

Jak to działa w praktyce – case study

Aby lepiej zobrazować schemat działania, przyjrzyjmy się zautomatyzowanemu księgowaniu faktur zakupowych. Wygląda to mniej więcej w ten sposób:

  • Dane wejściowe przechodzą przez system OCR, który następnie je przetwarza, strukturyzuje i weryfikuje (np. za pomocą oprogramowania ABBYY® FlexiCapture®, które obsługuje wszystkie najbardziej popularne języki). Wydobyte zostają z nich elementy, których potrzebujemy (np. nazwy produktów, które znajdują się na fakturze).
  • Kolejny krok to interpretacja danych za pomocą uczenia maszynowego oraz odpowiedniego programu (np. APPLICA.AI). Dzięki niej system wie, w jaki sposób powinny zostać zaksięgowane i gdzie trafić oraz jakich dekretów użyć. Na dokumentach nie ma czegoś takiego jak unifikacja nazw – każdy z dostawców może stosować własne nazewnictwo. Udało nam się jednak stworzyć rozwiązanie, które na podstawie sporej bazy danych, przepuszczonej przez model uczenia maszynowego, umożliwiło stworzenie swego rodzaju klasyfikatora.  Dzięki niemu na podstawie różnych treści jesteśmy w stanie stworzyć przydział do danej „klasy”. Dla przykładu, jeśli w linii faktury pojawi się nazwa „podnośnik kanałowy”, nasz model uczenia maszynowego będzie wiedział, że powinien zostać on zaksięgowany np. na konto 1281, do oddziału 901,  działu 850 i projektu nr 2. Gdyby zaś na fakturze od innego dostawcy pojawiła się nazwa „usługa podnośnikiem kanałowym”, co brzmi już trochę inaczej, to nasz algorytm na podstawie dostępnej bazy danych będzie wiedział, że to powinno zostać zaksięgowane w ten sam sposób. Inne przykłady to usługa noclegowa, nocleg i hotel. Jeśli słowa te znalazły się w danych uczących, czyli w bazie, którą najpierw zasililiśmy nasz model uczenia maszynowego, to algorytm będzie w stanie poprawnie zinterpretować te dane z linii faktury.
  • Za ostatni element procesu odpowiedzialny jest robot, który „spina” wszystko razem. Poza algorytmem uczenia maszynowego możemy bowiem zastosować dowolną liczbę reguł biznesowych, które też pomagają określić, w jaki sposób księgować dane dokumenty (finalny krok). Na tym etapie robot przechodzi dokument po dokumencie i uzupełnia potrzebne dane oraz wybiera osobę, do, której powinien wysłać końcowy plik do akceptacji lub ewentualnych poprawek. Użytkownik loguje się więc do aplikacji, gdzie jego zadaniem jest jedynie uzupełnienie kilku wartości i „przeklikanie” paru okienek. Pełny proces- od wpłynięcia faktury, do przesłania jej do ostatecznej akceptacji może zaś wynosić jedynie 2-5h, podczas gdy w przypadku braku wdrożenia tego typu systemu trwa to średnio 5 dni!

Dla tych co chcą wiedzieć więcej

Mindbox działa na rynku już od 13 lat, zatrudniając 10 certyfikowanych deweloperów RPA i z powodzeniem wdraża inteligentną technologię OCR, przeprowadza projekty z użyciem modeli Artificial Intelligence oraz udzielaja wsparcia w modelu usług zarządzanych. Jeśli masz pytania odnośnie automatyzacji lub systemów optical character recognition, bądź myślisz o wprowadzeniu tego typu rozwiązań do swojej firmy, skontaktuj się z Magdaleną Kwaśny używając adresu magdalena.kwasny@mindboxgroup.com. Polecamy również kontakt telefoniczny pod numerem +48 572773537 . Z przyjemnością porozmawiamy o Twoich potrzebach i posłużymy fachowym doradztwem.