Jak wykorzystać GenAI w UiPath
W tym artykule dowiesz się:
- Jakie są ograniczenia tradycyjnej technologii OCR
- W jaki sposób GenAI może zwiększyć skuteczność rozpoznawania tekstu i ograniczyć liczbę błędów
- Jakie znaczenie mają dobrze przygotowane prompty w pracy z GenAI i jak wpływają na trafność odpowiedzi
- Dlaczego opracowane rozwiązanie może być z powodzeniem wykorzystane w różnych branżach
Roboty programowe UiPath pomagają nie tylko w automatyzowaniu obsługi dokumentów elektronicznych, ale także papierowych. W tym celu wykorzystywane są technologie odczytu danych i rozpoznawania tekstu, które zostały wbudowane w oprogramowanie. Niestety o ile rozwiązanie OCR stosunkowo dobrze radzi sobie z pismem cyfrowym, to ma kłopoty z notatkami odręcznymi.
Wówczas z pomocą przychodzi technologia generatywnej sztucznej inteligencji. Firma Mindbox przygotowała i testuje na potrzeby jednego z klientów rozwiązanie, które znacząco podnosi poprawność odczytu zapisanych pismem odręcznym dokumentów.
Jak zwiększyć możliwości oprogramowania RPA w zakresie obsługi zapisanych odręcznie dokumentów przy pomocy GenAI
Opracowane przez naszych ekspertów rozwiązanie wykorzystujące GenAI przy rozpoznawaniu tekstu nie zostało jeszcze wdrożone produkcyjnie, jednak jest już na tyle zaawansowane, że warto zaprezentować je szerszej publiczności. Zwłaszcza, że jego zastosowanie nie ogranicza się do konkretnej firmy, czy nawet branży. Jest absolutnie uniwersalne i sprawdzi się zarówno w handlu, finansach jak i instytucjach publicznych.
Jedna ze współpracujących z nami firm udostępnia swoim klientom możliwość rezygnacji z usług poprzez wysłanie dokumentu zawierającego podstawowe dane klienta i konkretnej usługi. Takie dokumenty mogą być tworzone przy wykorzystaniu elektronicznego wzoru, który można uzupełnić na komputerze, ale także wypełnić w całości odręcznie.
Robot programowy pobiera dokumenty przesłane na adres poczty elektronicznej firmy, a następnie rozpoznaje tekst i klasyfikuje je do odpowiedniej grupy. Na tym etapie konieczna jest walidacja danych przez człowieka w module UiPath Action Center. W ten sposób korygowane są błędy powstające na etapie rozpoznawania tekstu. Ostatecznie zwalidowane dane wprowadzane są przez robota do dwóch różnych systemów.
Proces jest prosty i robot radzi sobie z nim znakomicie, jednak na etapie działania technologii OCR pojawiają się pewne wyzwania. System UiPath rozpoznaje tekst i na tej podstawie przypisuje do dokumentu odpowiednie etykiety.
Robot otrzymuje otagowane dokumenty. Dzięki temu wie gdzie znajduje się imię i nazwisko, dane dotyczące usługi i wszelkie inne niezbędne informacje. Jednak sam tekst zawiera często błędy wynikające z trudności rozpoznania pisma odręcznego lub błędów, np. prostych literówek, popełnionych przez autora. W ten sposób, do robota trafiają imiona takie jak Emikie czy Dawyta. Człowiek zapewne domyśli się od razu, że chodzi o Emilię i Danutę, jednak robot już nie. Liczba dokumentów zawierających błędy sięgała 70%. Wymagało to sporego nakładu pracy od ludzi, którzy walidowali dane wprowadzane do systemów przez robota. Choć wydaje się, że to dużo, to przy tak dużym wolumenie danych automatyzacja procesowania już nawet 30% wniosków jest postrzegana jako sukces. Niemniej apetyt rośnie w miarę jedzenia. Zwłaszcza, że inżynierowie odpowiedzialni za pracę robota mieli kilka pomysłów na poprawę tego wyniku.
Poszukiwanie rozwiązania
Dlatego pojawił się pomysł, żeby robotowi pomóc przy wykorzystaniu w procesie GenAI. Jej zadaniem miałoby być lepsze rozumienie tekstu i znaczne zwiększenie poprawności rozpoznawania tekstu, a w konsekwencji zmniejszenie ilości pracy, jaką ludzie musieliby wykonywać w module walidacji UiPath Action Center.
Początkowo rozważano wykorzystanie algorytmu Levenstheina, który mógłby porównywać tekst ze wskazanymi innymi tekstami i pokazywać, ile znaków należałoby w nich zmienić, żeby osiągnąć zgodność. Wykorzystując ten mechanizm, można by wybierać najbardziej zbliżony do wzoru tekst. O ile w przypadku poszczególnych kategorii danych byłoby to stosunkowo proste a zarazem efektywne to dla całości danych już nie . Prowadzone operacje porównań byłyby liczone w milionach dla jednego dokumentu. Rozważano także wykorzystanie oprogramowania Elastic Search, jednak pierwsze testy pokazały, że nie udałoby się wyeliminować znaczącej liczby błędów.
Wreszcie zdecydowano się na przetestowania GenAI. Było to o tyle proste, że UiPath udostępnia dedykowane rozwiązania pozwalające na integrację usług sztucznej inteligencji.
Ostatecznie udało się zmniejszyć ilość dokumentów z błędami do 20%, co jest znacznym osiągnięciem w porównaniu do punktu wyjścia. Co więcej, rozwiązanie cały czas jest rozwijane. Jego twórcy mają nadzieję, że liczba błędów będzie jeszcze niższa dzięki temu, że sztuczna inteligencja nie przestaje się uczyć.
Jak to działa?
Skuteczność wykorzystania GenAI, podobnie jak w innych przypadkach, opiera się na odpowiednim prompcie. Dla każdego z pól dokumentu – imię, nazwisko, nazwa usługi itp. – przygotowano osobne prompty. GenAI proszona jest o weryfikację każdego pola z osobna. Koniecznie jest bowiem naszkicowanie dla sztucznej inteligencji jak najbardziej szczegółowego kontekstu, w jakim będzie szukać odpowiedzi.
Zadanie prostego pytania „jakie to imię” nie sprawdzi się. Chociażby dlatego, że odpowiedź, jaką otrzymamy będzie zbyt obszerna. Potrzebujemy tymczasem odpowiedzi, która ograniczy się do wskazania poprawnego imienia. W przeciwnym wypadku konieczna byłaby obróbka wygenerowanego przez AI tekstu.
Dlatego ostateczny prompt bardziej przypomina informację, że dostarczamy wyniki działania oprogramowania OCR, informujemy, że wynik nie jest dokładny i może zwierać błędy, dodajemy, że szukamy polskiego imienia i że odpowiedź ma się ograniczać do samego imienia.
Co więcej, prompty można wzbogacać o wskazania dodatkowych źródeł danych. W przypadku imion, może to być baza polskich imion, a w przypadku adresów – baza danych GUS. Można także dostarczyć własny plik np. zawierający informacje o usługach czy produktach.
W tym przypadku wykorzystano usługę ChatGPT, jednak równie dobrze mógłby się sprawdzić inny model językowy. Dzięki narzędziom integracji przygotowanym przez UiPath dodanie innej usługi jest bardzo proste.
Porozmawiajmy!
a my pomożemy Ci wdrożyć najnowsze rozwiązania!



