Przejdź do treści

Claude Sonnet 5: dlaczego tańszy model zmienia ekonomię automatyzacji agentowej

Anthropic wycenił Claude Sonnet 5 na poziomie, który zmienia kalkulację architektów automatyzacji agentowej. Dla klientów UiPath - Agent Builder, Coded Agents, Maestro - to nie jest wymiana silnika. To zmiana tego, na ile kroków weryfikacji można sobie pozwolić bez przekroczenia budżetu.

30 czerwca 2026 Anthropic wypuścił Claude Sonnet 5. Nagłówki mówiły o cenie - 2 dolary za milion tokenów wejściowych, 2 dolary 50 centów za wyjściowe, wprowadzająco, do końca sierpnia. O oknie kontekstowym - 2,5 miliona tokenów, jedno z największych na rynku. O tym, że Anthropic pozycjonuje nowy model jako tańszą alternatywę dla Opusa, GPT-5.5 i Gemini Pro, nie jako kolejnego pretendenta do szczytu benchmarków.

To wystarczyło, żeby wywołać 622 punkty i 329 komentarzy na Hacker News. Dla nas, w SNOK, ciekawsze niż sama premiera jest to, co ona realnie zmienia w projektowaniu architektury automatyzacji agentowej u klienta - a konkretnie w środowisku UiPath, gdzie budujemy większość takich wdrożeń.

Bariera nie była techniczna. Była budżetowa

Architekci automatyzacji agentowej znają ten moment: projekt ma sens technicznie, ale w pewnym punkcie trzeba zdecydować, ile kroków rozumowania (reasoning steps) architektura może sobie pozwolić, zanim koszt tokenów przestanie być do uzasadnienia przed klientem. Każdy dodatkowy agent w pipeline - na przykład agent, który tylko sprawdza, czy wynik poprzedniego kroku jest zgodny z polityką firmy, zanim trafi do człowieka - to koszt, który architekt musi wytłumaczyć, nie tylko zaprojektować.

To nie jest ograniczenie wymyślone. To realny mechanizm, który spowalniał przejście automatyzacji agentowej z pilotażu do produkcji szybciej niż jakiekolwiek ograniczenie modelu. Można mieć najlepszą architekturę governance na świecie i nie wdrożyć jej w całości, bo trzeci krok weryfikacji podnosi koszt operacyjny o wartość, którą trudno uzasadnić w biznesplanie.

Claude Sonnet 5 przesuwa tę granicę. Nie eliminuje kosztu - zmienia jego skalę na tyle, że decyzja “dodać czy nie dodać kolejny krok weryfikacji” przestaje być decyzją budżetową i wraca do tego, czym powinna być: decyzją architektoniczną.

Gdzie to wchodzi w architekturę UiPath

AI Trust Layer w UiPath nie wymusza jednego dostawcy modelu językowego. Model wybiera się konektorem według tego, gdzie fizycznie działa - dla modeli Anthropic realną ścieżką jest konektor Amazon Bedrock, gdzie Claude jest dostępny jako jeden z wielu wspieranych modeli. To rozdzielenie ma znaczenie praktyczne: zmiana modelu w architekturze UiPath to zmiana konfiguracji konektora, nie przepisanie logiki agenta od zera.

W praktyce Claude Sonnet 5 może wejść w trzy różne warstwy stosu UiPath, każdą z innego powodu:

Agent Builder (low-code) to domyślny, rekomendowany do produkcji sposób budowy agenta - prompt plus zestaw gotowych narzędzi, bez Pythona, konwersacyjny. Tańszy koszt reasoningu Sonnet 5 obniża próg wejścia dla tego typu agentów w scenariuszach, gdzie liczba wywołań modelu była dotąd czynnikiem limitującym skalę pilotażu.

Coded Agent (Python) to warstwa, w której 2,5 miliona tokenów kontekstu Sonnet 5 robi największą różnicę. Custom RAG, złożone stany LangGraph, integracje MCP, wieloetapowy human-in-the-loop z możliwością wznowienia - to scenariusze, w których dotąd trzeba było dzielić dokumentację, kod i historię decyzji na fragmenty, żeby zmieściły się w oknie kontekstu. Przy 2,5 miliona tokenów kompletna dokumentacja procesu, historia decyzji i kod aplikacji mogą wejść do jednego promptu bez utraty ciągłości między krokami.

Maestro, orkiestrator wielu agentów, botów i ludzi w jednym, długotrwałym i monitorowanym procesie, jest tam, gdzie zmiana ekonomii ma największy wpływ strategiczny. Niższy koszt reasoningu per krok zmienia kalkulację liczby bramek weryfikacyjnych, które architekt może postawić w procesie bez przekroczenia budżetu - a to bramki weryfikacyjne, nie sama automatyzacja wykonania, są tym, co odróżnia governed automation od zwykłego skryptu z modelem językowym w środku.

Jedno zastrzeżenie techniczne, żeby nie zabrzmiało to szerzej, niż jest: mówimy tu o Claude Sonnet 5 jako opcji chmurowej dostępnej przez Bedrock. To inna ścieżka niż wdrożenia self-hosted - na przykład modele uruchomione lokalnie przez NVIDIA NIM na infrastrukturze klienta, gdzie decydują wymogi rezydencji danych, a nie cena tokenów. Obie ścieżki mają swoje miejsce, w zależności od tego, czy klient ma powód regulacyjny (NIS2, DORA, sektor regulowany), żeby dane nie wychodziły poza jego infrastrukturę.

Ile to znaczy w praktyce - przykład liczbowy

Żeby ta zmiana nie została na poziomie deklaracji, warto ją policzyć na prostym przykładzie. Proces z trzema krokami rozumowania na jedno zdarzenie - klasyfikacja, walidacja zgodności z polityką, generowanie raportu dla człowieka - przy dokumencie wejściowym rzędu 5 tysięcy tokenów i podobnej wielkości odpowiedzi, przy cenach obowiązujących przed wprowadzeniem Sonnet 5 dla modeli w tej klasie kosztował realnie kilka razy więcej za tę samą liczbę zdarzeń niż przy cenniku wprowadzającym $2/$2,5 za milion tokenów. Przy wolumenie rzędu kilku tysięcy zdarzeń miesięcznie - typowa skala procesu średniej firmy, nie korporacji - różnica w koszcie miesięcznym warstwy AI liczona jest w tysiącach złotych, nie w groszach.

To ma znaczenie w dwóch miejscach oferty. Po pierwsze, w kalkulacji ROI projektu automatyzacji agentowej - niższy koszt operacyjny warstwy AI skraca czas zwrotu inwestycji, co jest argumentem łatwym do zweryfikowania przez CFO klienta, nie tylko przez CIO. Po drugie, w decyzji, którą architekt podejmuje na etapie projektowania: czy postawić trzeci krok weryfikacji, czy ograniczyć się do dwóch. Przy niższym koszcie ta decyzja przestaje być kompromisem między governance a budżetem.

Co to znaczy dla governance i zgodności

Środowiska regulowane - sektor finansowy pod DORA, infrastruktura krytyczna pod NIS2, projekty wymagające zgodności z AI Act - mają dodatkowy powód, żeby traktować niższy koszt reasoningu jako okazję, nie tylko oszczędność. Tańszy model oznacza, że przegląd zgodności czy audyt decyzji podjętych przez agenta - krok, który sam w sobie jest kosztem dodanym do procesu, nie wartością biznesową samą w sobie - staje się łatwiejszy do uzasadnienia w budżecie. Okno kontekstu 2,5 miliona tokenów pozwala też wprowadzić do jednego przeglądu kompletną politykę czy regulację, zamiast dzielić ją na fragmenty i ryzykować utratę kontekstu między nimi - co ma znaczenie praktyczne przy audytach AI Act, gdzie kompletność przeglądu jest częścią dowodu zgodności.

Dlaczego nie rekomendujemy klientom jednego modelu

To prowadzi do pozycji, którą SNOK zajmuje od dawna i którą Claude Sonnet 5 dobrze ilustruje: nie sprzedajemy wdrożenia konkretnego modelu językowego. Sprzedajemy architekturę, w której wybór modelu jest parametrem konfiguracyjnym, a nie fundamentem, na którym stoi całe rozwiązanie.

Konsekwencja tego podejścia jest konkretna i policzalna. Gdy - jak teraz - na rynku pojawia się model, który jest tańszy lub lepszy w danym zadaniu, klient z architekturą opartą na AI Trust Layer płaci za przetestowanie i przełączenie konektora. Nie płaci za przepisanie agenta, przebudowanie integracji czy migrację danych. To jest różnica między wdrożeniem, które trzeba przeprojektować przy każdym cyklu premier modeli - a Anthropic, OpenAI i Google wypuszczają nowe wersje w tempie kilku miesięcy, nie lat - a architekturą, która ten cykl absorbuje bez dodatkowego projektu.

Wybór modelu językowego powinien być decyzją governance: koszt, opóźnienie, zgodność regulacyjna, rezydencja danych. Nie powinien być decyzją marketingową ani lojalnością wobec jednego dostawcy. Kiedy klient pyta nas, czy powinien “wdrożyć Claude” albo “wdrożyć GPT”, odpowiedź zaczyna się od pytania o architekturę, w której ten model będzie działał - nie od nazwy modelu.

Co z tym zrobić teraz, a czego nie robić

Pricing wprowadzający Claude Sonnet 5 jest ograniczony czasowo - obowiązuje do końca sierpnia 2026, potem wraca do poziomu wyższego. To jest okno demonstracyjne, nie trwała cena, i tak należy je traktować w planowaniu budżetu projektu. GPT-5.5 i Gemini Pro pozostają silnymi konkurentami w benchmarkach specyficznych zadań - Sonnet 5 wygrywa przede wszystkim na koszcie i rozmiarze kontekstu, nie automatycznie na każdym kryterium jakości.

Rekomendacja SNOK jest w związku z tym prosta i taka sama, jaką stosujemy wewnętrznie: benchmarkować na własnych, konkretnych przypadkach użycia przed migracją produkcyjną, nie migrować na podstawie nagłówka prasowego. Dla klienta z istniejącą architekturą AI Trust Layer ten benchmark jest tygodniem pracy, nie osobnym projektem - i to jest właściwy moment, żeby go wykonać, zanim okno wprowadzającej ceny się zamknie.

Dla klientów, którzy dziś projektują architekturę agentową od zera, Claude Sonnet 5 jest dobrym argumentem, żeby od początku budować na warstwie abstrakcji modelu, a nie na integracji z jednym dostawcą - żeby następna premiera modelu, za kilka miesięcy, była okazją do testu, a nie kolejnym projektem migracyjnym.


Materiał przygotowany na podstawie oficjalnych ogłoszeń Anthropic oraz analizy architektury AI Trust Layer w UiPath. Rekomendacje dotyczące konkretnej architektury klienta wymagają odrębnej weryfikacji technicznej - zapraszamy do rozmowy o architekturze automatyzacji agentowej.

Zobacz też: UiPath otwiera platformę na agentów AI: Claude Code i Codex już w środku oraz UiPath przestał być RPA. Stał się Szwajcarią agentów AI.

Tematy: Technologiczny Czwartek automatyzacja-ai UiPath Maestro UiPath Agent Builder AI Trust Layer
Spodobał się artykuł? Proszę podać go dalej:

Skontaktuj się z nami