Skills, tools, agents, MCP, AGENTS.md - mapa pojęć dla testerów

W rozmowach o AI w QA zauważyłem, że dyskusja zazwyczaj się zacina nie dlatego, że technologia jest trudna, tylko dlatego, że wszyscy używają tych samych słów na zupełnie różne rzeczy. „Zbudowaliśmy agenta” często oznacza „mamy prompt w Notion”. „Odpaliliśmy MCP” bywa synonimem „skleiliśmy Pythonowy skrypt”. „Piszemy skill” bywa tłumaczone jako „dopisaliśmy akapit do system prompta”.

Zanim zaczniemy cokolwiek wdrażać w zespole testerskim, warto mieć wspólny słownik. Ten wpis to mapa pięciu pojęć, które najczęściej się mylą: skill, tool, agent, MCP i AGENTS.md. Na końcu znajdziesz prosty model decyzyjny „czego użyć do czego”.

Prompt vs skill

Prompt to pojedyncza instrukcja, którą wysyłasz do modelu w konkretnym momencie. „Przejrzyj tę strategię testów i wskaż luki” - to prompt.

Skill to paczka wielokrotnego użytku - zwykle folder z plikiem SKILL.md - która opisuje modelowi, jak wykonywać konkretny rodzaj zadania. Model sam decyduje, czy dany skill załadować, na podstawie opisu zadania. Skill może zawierać:

instrukcje krok po kroku,
przykłady dobrych i złych outputów,
reguły formatu,
skrypty pomocnicze albo szablony.

Różnica praktyczna: prompt piszesz za każdym razem, skill raz, a potem model z niego korzysta, kiedy problem się powtarza. Dla zespołu QA to ważne, bo typowe zadania - generowanie scenariuszy E2E, review strategii, triage logu błędu - są dokładnie takimi powtarzalnymi wzorcami.

Najczęstsza pomyłka: mylenie skilla z długim system promptem. System prompt jest „zawsze włączony”. Skill jest „włączany kontekstowo”. Jeśli ładujesz całą biblioteczkę instrukcji zawsze, marnujesz kontekst i mieszasz modelowi w głowie.

Tool vs MCP

Tool to funkcja, którą model może wywołać zamiast ją tylko opisać słowami. Przykłady: run_playwright_test(name), fetch_jira_ticket(id), search_confluence(query). Każdy tool to kontrakt: nazwa, parametry, schema odpowiedzi.

MCP (Model Context Protocol) to standard - otwarty protokół - który opisuje, jak serwer może wystawić zestaw tooli (i zasobów, i promptów) w sposób, który każdy kompatybilny klient AI potrafi podpiąć. MCP nie jest toolem. MCP jest sposobem dystrybucji tooli.

Analogia z codziennego życia IT: tool to konkretny endpoint w API. MCP to coś w rodzaju OpenAPI / REST - konwencja, która sprawia, że endpointy można odkrywać, opisywać i podłączać w przewidywalny sposób.

Co z tego wynika dla QA:

Pojedynczy tool („wywołaj naszą wewnętrzną testową usługę”) można zbudować ad hoc.
Kiedy chcesz, żeby te same narzędzia działały w wielu miejscach - w Claude, w IDE, w chatbocie zespołowym - sensowniej spiąć je w serwerze MCP.
MCP to nie magia. To głównie dyscyplina nazywania rzeczy i opisywania parametrów.

Workflow vs agent

Tu pojęcia mylą się najczęściej, bo marketing AI lubi mówić „agent” o czymkolwiek, co coś robi.

Workflow to predeterminowana sekwencja kroków. Ty decydujesz, co po czym następuje. Model wykonuje konkretny etap (np. generuje scenariusz), ale nie decyduje o tym, czy iść dalej, czy wrócić.

Agent to model, który dostał pętlę, narzędzia i cel - i który sam decyduje, jakie narzędzie wywołać w następnym kroku, aż uzna zadanie za zakończone.

Praktyczne kryterium: jeśli potrafisz narysować diagram z jasnymi strzałkami i warunkami, prawdopodobnie chcesz workflow. Jeśli problem ma charakter eksploracyjny („przejrzyj raport z ostatnich 10 buildów i znajdź flaky testy, zbierz evidence, zaproponuj kolejność napraw”), agent ma sens.

W QA większość realnie pomocnych zastosowań AI to workflow, nie agent. Workflow jest przewidywalny, łatwiejszy do review i testowania, i rzadziej generuje kosztowne niespodzianki. Agent przydaje się tam, gdzie eksploracja naprawdę jest sednem problemu - typowo: deep-dive triage, systematyczny research wokół incydentu, konwersacyjne śledztwo po evidence.

Częsty błąd zespołów, które wchodzą w AI: od razu biorą się za agentów, bo „tak robi branża”. Efekt jest odwrotny do zamierzonego - zespół traci zaufanie do AI, bo widzi drogie, losowe loopy zamiast powtarzalnej pomocy.

Gdzie wchodzi AGENTS.md

AGENTS.md to plik w repozytorium, który opisuje agentom AI, jak pracować z tym konkretnym kodem. Konwencja jest świadomie podobna do README.md - ten drugi jest dla ludzi, AGENTS.md jest dla modeli.

Co typowo się tam znajduje:

struktura repo,
komendy do setupu,
komendy do uruchamiania testów,
konwencje (nazewnictwo, styl, wymogi PR),
rzeczy, których agent nie ma robić (np. „nie twórz nowych zależności”, „nie ruszaj folderu legacy/”).

Dla repozytoriów testowych AGENTS.md jest szczególnie wartościowy, bo test automation ma dużo ukrytej wiedzy: które fixtures są współdzielone, jak uruchamia się testy lokalnie vs w CI, które tagi znaczą co, jak nazywa się scenariusze. Bez tego pliku agent zgaduje. Z nim - działa w ramach Twoich reguł.

Temu plikowi poświęcam osobny wpis, bo jest tam sporo pułapek. Tutaj zostawiam główny komunikat: AGENTS.md to nie jest długi tekst o projekcie. To operacyjne instrukcje dla modelu.

Najczęstsze pomyłki pojęciowe

Pięć, które widzę najczęściej:

„Mamy agenta” - naprawdę mają prompt i ręcznie kopiowany output między narzędziami. To workflow, na dodatek manualny.
„Wystawiamy MCP” - w rzeczywistości skleili jeden skrypt CLI. Jeśli nie ma protokołu i klient AI nie może tego auto-odkryć, to po prostu skrypt.
„Skill to długi prompt” - skill ma być modularny i ładowany warunkowo, inaczej tracisz sens.
„Dodaliśmy tool” - ale bez dobrego opisu i przykładów model nie wie, kiedy go wywołać. Tool bez dobrego schema to martwy tool.
„AGENTS.md to README.md v2” - README odpowiada „co to jest i jak zacząć”. AGENTS.md odpowiada „jak masz się tu zachować jako agent”.

Prosty model decyzyjny - czego użyć do czego

Zanim coś zbudujesz, zadaj cztery pytania w tej kolejności:

1. Czy problem jest powtarzalny? Tak → zastanów się nad skillem. Nie → wystarczy prompt.

2. Czy model potrzebuje czegoś z zewnątrz (danych, akcji)? Nie → skill wystarczy. Tak, jedna rzecz, jednorazowo → pojedynczy tool. Tak, zestaw rzeczy, do reużycia w wielu miejscach → MCP.

3. Czy kroki są znane i uporządkowane? Tak → zbuduj workflow. Nie, problem jest eksploracyjny → rozważ agenta.

4. Czy agent będzie pracował z kodem / testami? Tak → od razu napisz AGENTS.md, zanim go uruchomisz. Bez tego uczysz się na własnych błędach, a koszt „błędów agenta w repo” jest wysoki.

Ta czwórka pytań zastępuje dziewięćdziesiąt procent architektonicznych dyskusji „czy budujemy agenta, czy workflow, czy może MCP”. Większość zespołów QA kończy na: skill + pojedynczy tool + workflow. I to jest w porządku - to realnie pomaga, bez ryzyka.

Co warto zapamiętać

Skill to powtarzalna paczka instrukcji. Prompt to jednorazowe zapytanie.
Tool to funkcja do wywołania. MCP to protokół dystrybucji tooli.
Workflow to zdefiniowana ścieżka. Agent to model z pętlą i autonomią.
AGENTS.md to operacyjny kontrakt z agentem pracującym w Twoim repo.
Zanim zbudujesz „agenta”, sprawdź, czy naprawdę potrzebujesz autonomii, czy wystarczy przewidywalny workflow.

W kolejnych wpisach rozłożymy każdy z tych elementów na czynniki pierwsze - zaczynając od pisania sensownego AGENTS.md dla repo test automation.