Architektura RAG - design i wdrożenie
Wektorowa baza danych (pgvector, Qdrant, Weaviate), embedding model, retrieval strategy, reranking, prompt engineering.
Retrieval-Augmented Generation na bazie wiedzy organizacji - SharePoint, Confluence, ERP, CRM, repozytoria dokumentów. Klasyfikacja danych pod RODO, source-aware access control, audit trail.
Model odpowiada na podstawie pobranych dokumentów, a nie wyłącznie z pamięci. Każda odpowiedź ma wskazanie źródła.
Asystent widzi tylko dokumenty, do których uprawnienia ma konkretny użytkownik. Ogranicza to ryzyko wycieku danych objętych klasyfikacją.
Nowy dokument dodany do bazy jest dostępny od razu, bez kosztownego fine-tuningu modelu.
Każda odpowiedź jest zapisywana wraz z użytym kontekstem: kto pytał i jakie źródła zostały wykorzystane. To istotne z perspektywy AI Act i RODO.
Wektorowa baza danych (pgvector, Qdrant, Weaviate), embedding model, retrieval strategy, reranking, prompt engineering.
SharePoint, Confluence, Notion, Google Drive, SAP, Salesforce, custom repozytoria. Synchronizacja przyrostowa, monitoring świeżości.
Identyfikacja danych osobowych, klasyfikacja wrażliwości, polityki dostępu, masking dla danych ograniczonego dostępu.
Integracja z Entra ID, AD, SAP IDM - asystent dziedziczy uprawnienia użytkownika. Bez ryzyka eskalacji dostępu.
Pomiar jakości odpowiedzi - relevance, faithfulness, citation accuracy. Cykliczne tuning promptów i retrieval strategy.
Test prompt injection przez kontekst, indirect injection przez dokumenty, EchoLeak, ShareLeak. OWASP LLM Top 10.
Zaczynamy od audytu danych: jakie dokumenty mają być dostępne dla asystenta, w jakich formatach występują, jak są klasyfikowane i jakie polityki dostępu obowiązują w organizacji. Na tej podstawie projektujemy architekturę RAG i zakres pierwszego wdrożenia.
Pierwszy use case wdrażamy dla jednego działu, zwykle w horyzoncie 6-10 tygodni. Sprawdzamy jakość odpowiedzi, poprawność cytowania źródeł, działanie kontroli dostępu oraz ryzyka związane z bezpieczeństwem danych.
Po pilotażu skalujemy rozwiązanie na kolejne źródła i grupy użytkowników. Standardowo pracujemy z Claude lub Azure OpenAI, a dla danych krytycznych rekomendujemy lokalne modele LLM.
Stack technologiczny
Doświadczenie zespołu w obszarze AI, integracji danych i systemów enterprise potwierdza gotowość SNOK do wdrażania rozwiązań RAG.
Kancelaria prawna
RAG na 50 tys. dokumentów - asystent prawny z cytowaniem paragrafów
Producent FMCG
RAG na umowach handlowych - asystent dla działu sprzedaży, integracja z SAP
Spółka technologiczna
RAG na dokumentacji technicznej - asystent dla wsparcia klienta L1/L2
RAG dodaje wiedzę dynamicznie przez retrieval - aktualizacje są natychmiastowe, audit trail dostępny. Fine-tuning "uczy" model wiedzy - droższy, wolniejszy do aktualizacji, bez cytowania. W większości przypadków RAG jest lepszym wyborem.
Drastycznie je redukuje - model odpowiada na podstawie pobranych dokumentów. Ale wciąż może źle zinterpretować lub źle scytować - dlatego ważny jest quality monitoring i citation grounding.
Sanityzacja dokumentów przed indeksacją, separation of concerns w promptach, output validation, sandboxing dla narzędzi które agent może wywołać. Pełen AI Security review.
Tak - architektura RAG jest model-agnostic. Działamy z Claude, OpenAI, Gemini oraz lokalnymi LLM (Llama, Mistral, Qwen) w infrastrukturze klienta.