Rozbrajam mity AI. Tłumaczę technologię. Pokazuję praktykę.

dr Zbigniew Okoń – doktor nauk prawnych, absolwent Uniwersytetu Jagiellońskiego, radca prawny, partner w kancelarii Lubasz i Wspólnicy. Posiada ponad 25 lat doświadczenia w obszarach prawa własności intelektualnej i nowych technologii. Wykładowca na Akademii Leona Koźmińskiego (studia podyplomowe „Prawo sztucznej inteligencji”).


Marcin: Zbyszku, jak sam wykorzystujesz generatywną sztuczną inteligencję, do czego i dlaczego?

dr Zbigniew Okoń: Moje motywacje są trojakie. Pierwsza to absolutnie czysta fascynacja. Czytałem science fiction w latach 80. i jakoś nigdy mi do głowy nie przyszło, że będę kiedyś rozmawiał z komputerem na takim poziomie. To zawsze było lokowane gdzieś w okolicy lotów na Alfa Centauri albo co najmniej kolonizacji Księżyca. Jest więc element przeniesienia się do krainy dzieciństwa, do tamtej wyobraźni.

Fascynujące jest też to, że do uruchomienia czegoś takiego nie jest potrzebny kosmiczny wynalazek, nowy hardware, te przeźroczyste płytki jak w HAL 9000 z „Odysei Kosmicznej”. Uruchamiam to wszystko na normalnym komputerze, co najwyżej z trochę mocniejszą grafiką.

Drugi poziom jest zawodowy. Ostatnio w IIC – jednym z poważniejszych periodyków dotyczących własności intelektualnej – ukazał się felieton Andresa Guadamuza „Why We Need Tech Lawyers to Shine Again”: znowu potrzebujemy prawników technologicznych, bo pojawiła się nowa technologia, której zrozumienie jest konieczne dla naszej branży. 25 lat temu, na początku mojej kariery, intensywnie zajmowałem się sieciami, systemami sieciowymi, „stronami internetowymi”, jak to się wtedy mówiło. To, czego się wtedy nauczyłem, procentowało mi przez lata, bo rozumiałem, jak doradzać klientom – byłem w stanie zrozumieć architekturę oprogramowania, architekturę systemu na dużym poziomie ogólności. Nie jest tu potrzebna wiedza szczegółowa, ale potrzebne jest zrozumienie, co to jest i jak to działa.

Teraz robię to samo w odniesieniu do AI. Bez zrozumienia, czym jest RAG, czym jest model językowy, bez zajrzenia do środka – co to są te wektory, jak to się uruchamia – ciężko później doradzać klientom i ciężko robić to w sposób intelektualnie uczciwy. A tym bardziej ciężko zajmować się tym naukowo. To jest trochę tak, jakby kosmici zajmowali się naukowo jakimś aspektem naszego życia społecznego. Coś będą wiedzieć z obserwacji, coś z czytania naszych książek, ale bez minimum doświadczenia osobistego to wszystko będzie momentami bardzo absurdalne. I mamy dzisiaj bardzo dużo takich absurdalnych wypowiedzi o AI – w nauce też.

Trzeci poziom to pytanie, w jaki sposób AI zmieni naszą rzeczywistość i nasz sposób wykonywania zawodu prawnika. Wielu prawników się tego obawia, niektórzy wolą nie patrzeć. Ja przeszedłem tu dość długą ewolucję – samą technologią interesuję się od lat, pierwszy artykuł o aspektach prawnych uczenia maszynowego napisałem w 2018 roku, zanim to było modne. Ale to, co dzieje się teraz, jest zmianą zupełnie innej skali. I ja z całą pewnością nie chcę tego przegapić.


Marcin: Wspomniałeś o „rozmawianiu” z komputerem. Czy ta nauka „rozmowy” z modelami była dla Ciebie prosta?

dr Zbigniew Okoń: Tu popełniłem swój największy błąd na starcie. Jako „stary geek” cały czas próbowałem znaleźć „magiczny prompt”, który spowoduje, że komputer zadziała dokładnie tak, jak tego oczekuję. Spodziewałem się, że muszę posłużyć się tu odpowiednim językiem – z odpowiednimi poleceniami, parametrami, strukturą – żeby wykonał precyzyjnie to, co chcę. Dopiero po czasie połapałem się, że to niepotrzebne.

Ciekawe, że w tym samym czasie moja żona, która jest językoznawcą i jest kompletnie nietechniczna, z dużym powodzeniem używała GPT do swoich prac. Ona traktowała model po prostu jako partnera – współpracownika, z którym rozmawia, omawia temat, współtworzy. I okazało się, że jej podejście daje lepsze rezultaty niż moje szukanie jednego idealnego promptu.


Marcin: Korzystasz z wielu modeli. Czym się różnią w Twojej codziennej praktyce?

dr Zbigniew Okoń: Claude to dziś mój główny współpracownik. Jego instrukcja systemowa i pewna specyficzna „osobowość” powodują, że dużo łatwiej mi się z nim pracuje. Lubię tę pracę. Efekt jest mniej entuzjastyczny, mniej „zhype’owany” niż w przypadku ChatGPT, bardziej stonowany. To zresztą znajduje pokrycie w udostępnionych niedawno instrukcjach systemowych Claude’a – tam jest opisana jego „charakterystyka psychiczna”. To powoduje, że dzisiaj wybieram go jako głównego współpracownika.

Gemini jest bardzo dobry, jeżeli chodzi o zadawanie pytań o najdziwniejsze tematy – „hydraulika w okolicy Krakowa” i tego typu rzeczy. Łatwiej mu przychodzi przeszukiwanie – linki, lokalne usługi – tu Google ma oczywistą przewagę.

Płaciłem jakiś czas abonament za wszystkie trzy: miałem maksymalny tier w Claude’zie, płaciłem za Gemini, za ChatGPT również. Z ChatGPT ostatnio w ogóle zrezygnowałem, nie z powodu ceny, tylko po prostu przestałem go używać.

Nawiasem mówiąc, wczesne wersje GPT-3 pozwalały na fascynujące pogawędki. Prowadziłem fantastyczną rozmowę o świadomości komputerowej: czy ma świadomość, jak się „czuje” jako komputer. Nie to, żebym w to wierzył – to osobny temat – natomiast dziś te kwestie są bardzo szybko ucinane standardową formułką „jestem tylko dużym modelem językowym”. No ale jailbreaking jest wciąż stosunkowo łatwy – niewiele trzeba, żeby model skłonić ponownie do rozmowy na takie tematy. Zdaje się, że z modeli Claude jest najskuteczniej „wychowany”, żeby w takie rozmowy nie wchodzić.


Marcin: Przejdźmy do konkretów – jak wygląda Twój workflow przy tworzeniu tekstów prawniczych?

dr Zbigniew Okoń: Na początku to było klasyczne testowanie: „napisz to”, „napisz tamto”, przetłumacz, streść, przełóż na inny rejestr językowy. Wyniki były różne. Gdzieś na swoim profilu w social mediach mam nawet screen z tego okresu, jak pięknie mi model „wyhalucynował” literaturę. Zadałem mu pytanie o moje własne publikacje i wygenerował kompletne zmyślenia: inne tytuły, inne roczniki, wszystko. Co ciekawe, kręcił się w pewnym kręgu towarzyskim – pisał, że jestem współautorem z osobami, które rzeczywiście znam i z którymi rzeczywiście coś napisałem, ale coś zupełnie innego. Widziałem więc, że potrafi opowiadać bardzo przekonujące bzdury, i nie do końca wiedziałem, jak do tego podejść.

Realnie na poważnie zacząłem używać Claude’a mniej więcej rok temu. Sonnet 3 był pierwszym modelem, który okazał się dla mnie przydatny. W międzyczasie pewien znajomy wjechał mi trochę na ambicję. Zapytał, czy korzystam tylko z abonamentowego czatu, czy przez API. I czy próbowałem Visual Studio Code z różnymi klientami do pracy z modelami. Teoretycznie wiedziałem, że można, praktycznie – nie używałem. No to oczywiście zadziałał mechanizm „co ja nie potrafię?” – i zacząłem się tym bawić.

Marcin: Używałeś Claude’a w Visual Studio Code do pracy nad tekstem? Nie nad kodem?

dr Zbigniew Okoń: Tak, świetnie sobie z tym radzi. Jest oficjalna wtyczka Claude’a do VS Code, bardzo uniwersalna – ona też świetnie radzi sobie z tekstem, nie tylko z kodem.

Marcin: Czy to jest znak czasów, że używamy narzędzi dla programistów do pracy z tekstem?

dr Zbigniew Okoń: Zdecydowanie tak. Inne narzędzia nie dają takich możliwości pracy kadencyjnej, iteracyjnej nad tekstem jak edytory „dla programistów”. Jestem hardkorowym użytkownikiem Worda od wczesnych lat 90., od wersji 2.0. A w tym momencie większość pracy wykonuję albo w Visual Studio Code, albo w Obsidianie, czyli wyspecjalizowanym edytorze markdownowym.

Do Obsidiana długo się przymierzałem, jest stroma krzywa uczenia się na początku, ale jak już go opanowałem, okazał się fantastyczny. Zwłaszcza jak wpadłem na wtyczkę agentyczną – „Agent Client” – i mogłem wydać polecenie: „a teraz mi w Obsidianie przygotuj notatkę, szkic książki o takiej i takiej strukturze”.


Marcin: Jak konkretnie wygląda Twoja metoda pracy z modelem przy pisaniu?

dr Zbigniew Okoń: Poszedłem własną ścieżką. Próbując to robić na abonamentowych czatach, wypracowałem sobie metodę „wsadową”: przygotowywałem w pliku tekstowym wsad – zestaw poleceń, co ma być w najbliższych dwóch, trzech akapitach – plus kontekst, na którym model ma pracować. Czyli wyciąg z komentarzy, kawałek tekstu, kawałek wyroku, inne materiały. I ładowałem to „wsadowym” sposobem do modelu.

Marcin: Czyli miałeś precyzyjny plan dokumentu, wiedziałeś, co w jakiej kolejności ma się pojawić, z jakich źródeł mają być cytaty i odniesienia. I dopiero to wszystko miało zostać syntetyzowane przez model językowy.

dr Zbigniew Okoń: Tak. Te polecenia sprowadzały się do instrukcji typu: „realizuj określony tok wywodu, argument A, B, C, trzymaj się ściśle tej kolejności, podziel tekst w taki i taki sposób”. To był dość efektywny sposób pracy, do niedawna go stosowałem – teraz trochę inaczej zarządzam kontekstem.

Marcin: Czy ten typ współpracy to jest coś, co zdarza się w kancelariach wykonywane przez ludzi?

dr Zbigniew Okoń: Myślę, że tak. Nie tylko z paralegalami – także z młodszymi prawnikami. Jeżeli dajesz komuś zadanie, to dajesz mu instrukcję, co ma zrobić, jak, w jakiej kolejności, jakiej argumentacji ma użyć, do czego się odwołać. Inaczej nie dostaniesz tego, czego oczekujesz. Różnica była taka, że z modelem dzieliłem pracę na dużo mniejsze porcje, bo model ma jednak mniejszą zdolność „udźwignięcia” kontekstu niż człowiek. Po prostu musisz rozbić zadanie na drobniejsze kawałki. Teraz za zarządzanie kontekstem odpowiedzialny jest RAG.


Marcin: Co zyskujesz, tak pracując?

dr Zbigniew Okoń: Dwie główne rzeczy. Po pierwsze: mnie się regularnie zdarza, że żeby dobrze pisać – czy to tekst zawodowy, naukowy, czy publicystyczny – muszę być wypoczęty. Jeżeli jestem zmęczony, słowa mi się „zawieszają”. Wiem, co chcę powiedzieć, ale zmęczenie powoduje, że ta praca jest dużo mniej efektywna. Nadanie subtelnego wyrazu słowom, delikatne balansowanie sensem – to jest wtedy bardzo trudne. Czasem tekst wychodzi zwyczajnie drewniany. Model daje mi standaryzację wyniku. Jeżeli skupiam się tylko na myśli, a on mi to pakuje w moją formę, w formę zrozumiałą i logiczną, to oszczędzam sporo czasu na późniejszym dopieszczaniu języka.

Druga rzecz: zdarzyło mi się pracować nad tekstem, gdzie nie mogłem znaleźć dobrego podsumowania. Skorzystałem wtedy z MacWhisper – to dodatek do macOS, który pozwala wygodnie dyktować i rozpoznawać tekst na lokalnych modelach. Zacząłem dyktować strumieniem świadomości: „co ja właściwie myślę, co powinno być powiedziane”. Mówiłem chaotycznie, w nieuporządkowany sposób. A potem dawałem modelowi: „zrób z tego spójny akapit według tego i tego przykładu”. Dostawałem fajny, klarowny tekst. Czasem coś poprawiałem, ale to była moja myśl, wydobyta z potoku słów i skojarzeń, ułożona w logiczny wywód. To jest świetne narzędzie do radzenia sobie z trudniejszymi fragmentami, z końcówką tekstu, kiedy jesteś już zmęczony.


Marcin: Wspomniałeś o systemie RAG. Jak on u Ciebie działa?

dr Zbigniew Okoń: RAG – Retrieval Augmented Generation – to generowanie wspomagane wyszukiwaniem. Dajesz modelowi narzędzia, które pozwalają mu wyszukiwać konkretne informacje. Wtedy z dużo mniejszym prawdopodobieństwem halucynuje, bo dostaje dopasowany kontekst i na nim generuje odpowiedź.

Zbudowałem sobie bazę wektorową do przechowywania fragmentów literatury, materiałów, wyroków – używam Qdrant. Szczerze mówiąc, mniejszym wyzwaniem jest samo postawienie bazy i spięcie jej z modelem – open source’u jest masa – a większym wyzwaniem jest zbudowanie jakościowych workflowów do ładowania danych.

Efekt jest taki, że w momencie, w którym model ma dostęp do kontekstu i jest w stanie sam znaleźć potrzebne informacje, praca przyspiesza dramatycznie. Ale nawet przy RAG-u model potrafi halucynować. Do bazy ładujesz „chunki”, czyli fragmenty tekstu określonej długości. To dzielenie nigdy nie jest idealne – może się zdarzyć, że coś zgubisz na granicach chunków.

Ciekawa jest obserwacja, że model – gdy ma możliwość poszukiwania – zaczyna preferować teksty o wysokiej gęstości informacyjnej, a omija „pustosłowie”. Te fragmenty nic mu nie dają przy generowaniu odpowiedzi.


Marcin: Jak podchodzisz do problemu halucynacji?

dr Zbigniew Okoń: Na bardzo wysokim, trochę filozoficznym poziomie: ja widzę rolę AI tak, że ma mnie wzmacniać, a nie zastępować. Staram się więc tak pracować, żeby moje procesy – to, co czytam, jak myślę – znajdowały odzwierciedlenie w tym, z czego korzysta model. Czyli żeby on miał dostęp do tych samych informacji, które ja przetwarzam. Wtedy jestem w stanie łatwiej wychwycić, gdzie zmyśla, bo wiem, z czego korzysta. To jest moja główna strategia wobec halucynacji – świadomość wykorzystywanego kontekstu.

Praktycznie wygląda to tak: czytam te kilkaset stron tekstu, szybko, robię notatki. Potem pytam model: „znajdź mi pozycje, w których pojawia się taki wątek, pokaż, jak autor X i Y to ujęli”. Albo: „przeczesz ten wyrok i wskaż punkty dotyczące konkretnego aspektu”. Albo: „spróbuj zidentyfikować w tych pięciu wyrokach spójną linię orzeczniczą”. I dzięki temu przy setkach stron tekstu jestem w stanie pracować na wyższym poziomie, zestawiać, porównywać.

I to jest podstawowe nieporozumienie: AI nie będzie pisać tak dobrze jak ty. Ale jeżeli potraktujesz je jako turbo-doładowanie swoich możliwości intelektualnych, efekty mogą być świetne.

Marcin: Zauważyłem, że modele słabo rozumieją pojęcia z precyzyjnymi kwantyfikatorami – „czasem”, „nigdy”, „zawsze”, „prawie każdy”. Masz podobne obserwacje?

dr Zbigniew Okoń: Bardzo ciekawa obserwacja. Ja widzę inny, ale zbliżony problem: modele mają duży kłopot z szacowaniem ryzyka. Bardzo często moja praca polega na tym, że mam określić poziom ryzyka związanego z rozwiązaniem prawnym, konstrukcją kontraktową. I niemal zawsze to szacowanie robię jednak ręcznie – modele mają tendencję do przejaskrawiania albo niedoszacowywania, nie potrafią dobrze zważyć czynników.

Na tej podstawie wyliczenie, że poszczególne czynniki ryzyka są wysokie – ale żaden z nich nie ma istotnego wpływu na sytuację klienta – prowadzi model do wniosku, że całość ma wysokie ryzyko. A przecież niekoniecznie tak jest. Modele mają więc problem z szacowaniem ogólnego wpływu pojedynczych zdarzeń – o różnych wagach – na całościowe ryzyko. Sądzę, że to podobne zjawisko, co wspomniane przez ciebie kwantyfikatory.


Marcin: Czy struktura kancelarii prawnych musi się zmienić?

dr Zbigniew Okoń: Wspomniałem, że postrzegam AI jako turbo-doładowanie. I to ma bardzo konkretne konsekwencje. Jak podłączysz turbo do słabego silnika, osiągniesz pewien wzrost mocy, ale nie taki, jak gdy podłączysz go do czegoś potężnego, co ma odpowiednią pojemność i wydolność. Dobry senior czy counsel, który ma techniczne obycie, osiągnie znakomite rezultaty. Natomiast junior będzie błądził mniej więcej tak samo, jak błądził dotychczas.

Co ciekawe, w pracy z modelem pojawiają się bardzo podobne problemy jak w pracy z prawnikami. Model potrafi „zahalucynować”, nadinterpretować fakty, źle zrozumieć rozstrzygnięcie. Dokładnie te same mechanizmy weryfikacji, które stosujesz wobec pracy młodszego prawnika, powinieneś zastosować wobec wyników modelu. To jest zaskakująco podobne.

Przekłada się to na biznes. Typowa struktura kancelarii to piramida: juniorzy, associates, seniorzy, partnerzy. Wpływ AI może być taki, że ten niższy szczebel przestaje być aż tak potrzebny. Wyraźnie spada zapotrzebowanie na paralegali i na najmłodszy szczebel. Z piramidy zrobi nam się raczej „cygaro”: wąski dół, szeroki środek, wąska góra.

Dla mnie fantastyczną rzeczą jest choćby to, że wrzucam do AI swój tekst napisany na szybko i mam kapitalną korektę językową – interpunkcja, błędy składniowe, niezgrabności. A to przecież element pracy, który często robili właśnie paralegali. Jeżeli dołożysz do tego zarządzanie kalendarzem, spotkaniami, transkrypcjami, obiegiem dokumentów, to okaże się, że dużą część tej prostej pracy kancelaryjnej da się zautomatyzować.


Marcin: Czyli to przełoży się na większą konkurencyjność rynku?

dr Zbigniew Okoń: Myślę, że tak, ale tu zderzają się dwie wizje. Moja pierwsza wizja była idealistyczna. Zakładałem, że te narzędzia są w zasadzie dostępne dla każdego. Że jesteś w stanie zbudować sobie efektywny system samodzielnie, korzystając z pomocy AI, mając minimalne ogarnięcie techniczne i bazując na komponentach open source. Koszt takiego systemu sprowadza się do kilkuset dolarów rocznie na abonamenty – i masz naprawdę topowy system, o możliwościach jak najlepsze komercyjne rozwiązania.

Problem w tym, że patrzyłem z własnej perspektywy. Próbowałem robić takie eksperymenty z zaprzyjaźnionymi kolegami i koleżankami po fachu i wyniki były zaskakujące. Musiałem tłumaczyć od zera, co to jest edytor tekstowy w rozumieniu innym niż Word i co to jest język znaczników. Jeżeli już na tym etapie się wywracasz, to pójście dalej, do RAG-ów, wektorowych baz wiedzy i orkiestracji agentów, nie wchodzi w grę. To jest ta „trudna ścieżka”: każdy może, ale w praktyce prawie nikt nie pójdzie tak daleko.

I tu pojawia się drugi aspekt. Rzeczywistą wyporność do wdrażania tych narzędzi mają największe kancelarie – stać je na eksperymenty, na szkolenia, na specjalistyczne systemy. A jeżeli dzięki temu rosną ich zdolności produkcyjne, to mogą oferować usługi taniej, zachowując marże. Paradoksalnie, AI może więc nie być czynnikiem demokratyzującym, tylko sprzyjającym koncentracji rynku.


Marcin: A czy klienci też zaczynają używać AI do weryfikowania porad prawnych?

dr Zbigniew Okoń: Bardziej to sobie wyobrażam, niż widzę w codziennej pracy – jestem raczej na tym „drugim końcu” spektrum spraw, nie przy basicowych pytaniach. Ale ten wpływ istnieje i nie zaczął się wraz z AI, tylko wcześniej – od słynnego „mecenasa Google’a”.

Dawniej jak chciałeś wiedzieć, czy możesz obciąć gałęzie sąsiada, jakie masz prawa jako najemca – szedłeś do prawnika, on wertował kodeks, dokładał interpretację, faktura za 200–300 zł. Od jakiegoś czasu te usługi zastępuje wpisanie pytania do Google, a dziś te odpowiedzi są doładowane generatywną AI.

To nie dotyczy tylko prawników. Zrobiłem sobie niedawno prostą rzecz z Gemini – „Gema” dietetycznego. Wrzuciłem założenia diety z ograniczeniami, preferencjami. Teraz jeśli jestem w knajpie i mam w menu kilka opcji, pytam: „Co najlepiej, żebym zjadł?”. Dostaję personalizowaną odpowiedź w każdej chwili. To pewnie gdzieś podgryza rynek dietetyków w prostych sprawach. W prawie będzie podobnie: proste interpretacje przesuwają się do modeli, a do prawnika trafią sprawy bardziej złożone.


Marcin: Wokół wykorzystania AI przez prawników powstaje chyba jakaś społeczność?

dr Zbigniew Okoń: Tak. Na przykład Jamie Tso, senior associate z Clifford Chance w Hongkongu, wrzuca swój kod na GitHuba i opisuje narzędzia na LinkedIn. Wokół niego wyrosła społeczność młodych prawników i paralegali, którzy używają AI do budowania sobie własnych rozwiązań.

Ciekawym projektem jest Red Ink – add-in do Worda działający z własnym kluczem API do dowolnego modelu językowego. Stworzył go David Rosenthal, partner szwajcarskiej kancelarii VISCHER, szef praktyki data & privacy i AI. Masz więc bardzo międzynarodowe towarzystwo. To jest całkiem nowe zjawisko społeczne.


Marcin: Na koniec Twój „tech stack”. Jak to wszystko u Ciebie działa od strony technicznej?

dr Zbigniew Okoń: Podstawą jest serwer linuxowy. Nie trzymam wszystkiego na laptopie – trochę ideologicznie, a trochę praktycznie. Wolę mieć odciążony komputer, którym chodzę po świecie.

Zaczynałem od naprawdę słabego sprzętu: pokancelaryjny serwer z 2016 roku, który nazywałem „krakowskie biuro”. Na nim pierwszy raz odpaliłem bazę wektorową – i sensownie działało jako proof of concept. Teraz mam serwer z mocnym procesorem AMD, 64 GB RAM-u i kartą graficzną z 12 GB VRAM.

Do pracy koncepcyjnej, argumentacji, pisania – używam topowych modeli w chmurze: Claude i Gemini. Czasem przepuszczam ten sam problem przez dwa modele, daję im swoje odpowiedzi nawzajem do skomentowania. Czasem to jest wartościowe, czasem „komplementują się nawzajem bez sensu”, jak dwóch grzecznych ekspertów w talk-show.

Do pracy klasyfikacyjnej, embeddingów, prostych decyzji – mniejsze modele lokalne, 7–10 miliardów parametrów. Tam chcę mieć szybkość, niższy koszt i pełną kontrolę nad danymi. Ale uruchamiam też większe modele, nawet 30-miliardowe z kwantyzacją – wtedy wykorzystuję 64 GB RAM-u i zintegrowaną kartę graficzną. Zewnętrzna karta z 12 GB VRAM służy mi do innych zadań obliczeniowych (np. uruchamiania modeli wizyjnych do zaawansowanego OCR). To hybrydowa architektura, która pozwala dobierać narzędzie do zadania.

Kluczowa zasada: embeddingi robię wyłącznie lokalnie. Po pierwsze ze względu na poufność, po drugie na trwałość. Jeżeli zrobisz embeddingi w chmurze na modelu jakiegoś dostawcy, a dostawca zniknie, zmieni API albo wyłączy model, to możesz mieć problem z całą zgromadzoną bazą wiedzy.

Baza wektorowa to Qdrant – dawno przekroczyłem sto tysięcy wektorów, zbliżam się do miliona. Qdrant to spokojnie wytrzymuje.

Do zarządzania workflowami eksperymentowałem z narzędziami low-code/no-code: n8n, Make i podobnymi. Teoretycznie mają ułatwiać budowę automatyzacji, ale praktycznie są trudniejsze w utrzymaniu, aktualizacji, wersjonowaniu. Im dłużej z tym pracuję, tym bardziej wracam do klasyki: dedykowane skrypty w Pythonie, odpalane w kontenerach Dockera. Cały system jest zbudowany jako zestaw mikrousług: osobny serwis do embeddingów, osobny do klasyfikacji, osobny do RAG-a, osobny do konwersji plików.

No i korzystam z „agenta-programisty”. Daję modelowi dostęp przez SSH do serwera deweloperskiego i każę mu napisać konkretną funkcjonalność: zaprojektować schemat bazy, napisać kod, przygotować scenariusze testowe, uruchomić je, poprawić błędy i dopiero wdrożyć na produkcję. Nie działa idealnie za pierwszym razem, ale przy kilku iteracjach da się zbudować całkiem złożone klocki. Cały czas mam nad tym kontrolę architektoniczną – rozumiem, jak to ma być poukładane, model jest raczej „wykonawcą”.

AI wpłynęło też na to, jak czytam wiadomości. Mam czytnik RSS, który pobiera newsy z różnych źródeł. Na wejściu przepuszczam to przez model, który nadaje tagi i ocenia, na ile dana treść mnie prawdopodobnie zainteresuje. Czytam tylko to, co przejdzie przez określony próg. Jestem odfiltrowany od szumu: „kto z kim”, „co powiedział Jasnowidz Jackowski”, kolejny clickbait. Widzę tylko rzeczy sensowne z mojego punktu widzenia.

To nie jest jakieś wielkie, korporacyjne wdrożenie, tylko coś, co ma mnie realnie wspierać w codziennej pracy z tekstem i wiedzą. I w tej roli sprawdza się znakomicie.


Marcin: Zbyszku, bardzo dziękuję za tę rozmowę.

dr Zbigniew Okoń: Dzięki, było mi bardzo miło. Jesteśmy w kontakcie.

– Marcin Sawicki
Piszę o używaniu AI i pracy z chatbotami. O mnie · LinkedIn

Odkryj więcej z REWOLUCJA AI

Zasubskrybuj już teraz, aby czytać dalej i uzyskać dostęp do pełnego archiwum.

Czytaj dalej