/ blog / tag
#ai
33 wpisów
← wszystkie wpisyAI w codziennym życiu: LLM jako pomocnik przy grach planszowych
LLM może być bardzo praktycznym pomocnikiem przy grach planszowych: tłumaczyć zasady, rozstrzygać niejasności, wyszukiwać fragmenty instrukcji, tworzyć skróty tur i pilnować spójności house rules. Warunek: traktować go jak asystenta, nie nieomylnego sędziego.
Komenda /goal w Claude Code - kontrakt sesji, który nie pozwala agentowi się poddać
Jak /goal w Claude Code wymusza dokończenie pracy przez sesyjny hook Stop. Plusy, minusy, kiedy stosować, jak formułować warunek i czemu to ważne dla QA.
AI w Smart Home, część 1: Dom, który widzi - LLM Vision w praktyce
Pierwsza część mini-serii o łączeniu AI ze smart home. Pokazuję, jak przejść od zwykłego wykrywania ruchu do interpretowania obrazu: kto jest przy furtce, co wydarzyło się na podjeździe i kiedy warto wysłać powiadomienie.
Gdzie skala Holaka zawodzi - autokrytyka
Każdy model jest narzędziem, nie prawdą. Sześć miejsc, w których skala Holaka realnie zawodzi w pracy z zespołami, plus informacje zwrotne od czytelników, które warto zaadresować w wersji 3.
Orkiestracja wieloagentowa - kiedy jeden agent wystarczy
Poziom 10 w skali Holaka jest atrakcyjny dla CV, drogi w utrzymaniu. Sceptyczne spojrzenie na zespoły agentów: kiedy realnie potrzebujesz wielu, kiedy jeden dobrze skonfigurowany wygrywa, i jak rozpoznać orkiestrację miernoty.
MCP, CLI czy hook - kiedy które narzędzie, kiedy MCP to przeinżynierowanie
MCP to narzędzie, nie status. Każdy łącznik to utrzymanie, ryzyko i powierzchnia ataku. Kryteria, kiedy MCP się opłaca, kiedy lepsze jest CLI / polecenie ukośnikowe / hook, drzewo decyzyjne i ścieżka migracji CLI → MCP.
AGENTS.md vs CLAUDE.md vs .cursorrules - który plik kontekstowy do czego
Trzy formaty plików kontekstowych dla agentów AI to nie chaos - każdy ma niszę. Co czyta który agent, co wrzucać do każdego, jak utrzymać w synchronizacji i czego nie kopiować 1:1.
Biblioteka promptów to anti-pattern. Tak, ta z 200 linii
Jeśli kopiujesz prompt z dokumentu - masz problem fazy 4, nie fazy 3. Czemu fetyszyzacja promptów to objaw braku ewolucji, jak rozłożyć 200-linijkowy prompt na custom instructions i kontekst projektu.
Jednostka 9, firma 2 - co robić z rozjazdem dojrzałości AI
Większość firm mierzy maksimum zamiast mediany. Jak wykryć rozjazd między dojrzałością jednostki a organizacji, jak liczyć medianę i co realnie zrobić jeśli jesteś inżynierem na 9 w firmie na 2.
Anti-patterny adopcji AI - 7 sposobów na utknięcie
Większość zespołów nie utyka z braku narzędzi, tylko na konkretnych wzorcach myślenia. Siedem najczęstszych anti-patternów ze skali Holaka, test rozpoznawczy, kto utyka i jak wyjść.
Granica zaufania - jak realnie przeskoczyć z 8 na 9 w skali Holaka
Najtrudniejszy skok w skali Holaka nie jest techniczny. Sprawdzalność i odwracalność jako framework, checklist gotowości i dwa case'y - jeden który przeszedł, jeden który spadł do 2.
Jak zdiagnozować poziom dojrzałości AI w zespole w 30 minut
Konkretny protokół oceny zespołu na skali Holaka - 8 pytań kalibrujących, 5 minut obserwacji w narzędziu i jednostronicowy raport. Bez ankiet, bez warsztatów, bez slajdów.
Claude i Codex: CLI vs desktop vs web - gdzie naprawdę dowozisz robotę
Trzy kanały dostępu do tych samych modeli różnią się tym, co potrafią dotknąć. Praktyczne porównanie Claude Code i Codex CLI z aplikacjami desktop oraz interfejsami web.
Skala Holaka v2.1e - enterprise. Model dojrzałości adopcji AI w organizacji
12 poziomów dojrzałości AI w firmie - od oporu, przez agentowe workflow, po własny agentic OS dla konkretnych celów biznesowych. Wersja v2.1e rozdzielająca ścieżkę firmową od prywatnej.
Skala Holaka v2.1p - private. Dojrzałość prywatnego użycia AI
12 poziomów dojrzałości codziennego użycia AI - dom, nauka, finanse, smart home, organizacja życia. Wersja prywatna Skali Holaka, równoległa do wersji enterprise.
Pisanie własnego subagenta w Claude Code: frontmatter, prompt, deployment
Druga część serii o subagentach. Tworzymy od zera agenta blog-post-writer - co wpisać w frontmatter, jak napisać description, która faktycznie triggeruje, jak uniknąć dwóch klasycznych pułapek.
Advisor w Claude Code: druga opinia od silniejszego modelu zanim się zacementujesz
Tool advisor() forwarduje cały transkrypt do silniejszego modelu i wraca z opinią. Kiedy wołać przed pracą, kiedy NIE dla każdego kroku, jak nie zrobić z tego konsultacji w nieskończoność.
Skill prompt-master w Claude Code: generator promptów do innych narzędzi AI
Zamiast pisać prompt do Midjourneya, Sory, Suno czy Cursora ręcznie, masz w Claude Code skill, który to zrobi. Jak działa, gdzie nie zastąpi znajomości narzędzia docelowego.
Subagenci w Claude Code: po co orkiestrować zamiast pisać w jednym oknie
Jeden Claude vs wielu specjalistów wołanych przez Agent. Po co subagenci, jak Claude wybiera którego użyć, kiedy NIE używać, i dlaczego to nie jest po prostu jedno okno z większym kontekstem.
Open WebUI - front jak ChatGPT do twojego lokalnego LLM
Lokalna Ollama daje tylko CLI. LM Studio jest jednoosobowe. Open WebUI to brakujący kawałek: ChatGPT-like UI z RAG-iem, web search i tools - uruchamiasz w jednej komendzie Dockera.
Lokalne modele LLM w 2026 - co realnie odpalisz na Mac mini M4 16 GB
Przegląd aktualnych modeli, które warto pobrać na 16 GB unified memory: gpt-oss-20b, Gemma 4 e4b, Qwen3-Coder, Phi-4. Co działa, co nie działa, i dlaczego.
Mac mini M4 16 GB jako stacja lokalnego LLM - LM Studio kontra Ollama
Czy najtańszy Mac z linii M4 ma sens jako maszyna do lokalnych modeli językowych? Hardware reality check, porównanie LM Studio i Ollamy, granica zdrowego rozsądku.
Context7 - MCP, który daje modelowi aktualną dokumentację zamiast stanu sprzed pół roku
Jak jeden mały MCP rozwiązuje największy problem pracy z LLM przy kodzie: przestarzałą wiedzę modelu o bibliotekach. Setup, realne przypadki, ograniczenia.
Caveman - plugin, który tnie output tokeny o 75% (i gdzie to pęka)
Jak plugin Claude Code każący modelowi mówić jak jaskiniowiec zmienił mój rachunek za tokeny - i w których zadaniach to działa, a w których wręcz szkodzi.
Skill do zgłaszania bugów w Jirze - przez Atlassian MCP, po ludzku
Jak zbudować skill, który zamienia Twoje „hej, coś się psuje na checkoucie” w kompletny ticket w Jirze - z dowodami, dedupe i bez zaśmiecania projektu. Bez agenta-autopilota, z ludzkim confirmem.
Od artykułu do wideo: HyperFrames dla quality-blog.eu
Kiedy wpis zasługuje na trzydziestosekundowy video explainer, jak zbudować jego scenariusz i jak ten sam materiał reużyć w pięciu kanałach jednocześnie.
Jak tester powinien oceniać output agenta
Pięć wymiarów oceny outputu agenta, checklista, którą przejdziesz w piętnaście minut, i sytuacje, w których po prostu zawracasz wynik bez długiej dyskusji.
10 workflowów AI, które realnie pomagają Test Architectowi
Dziesięć konkretnych workflowów - od review strategii po decyzję „nie automatyzować” - które można wdrożyć w tygodniu i używać codziennie.
Pierwszy MCP dla QA: search/fetch po evidence
Jak zacząć z MCP w QA od najprostszej pary tooli - search i fetch po evidence. Bez autonomii, bez pętli, za to ze strukturą, którą da się utrzymać.
Jak napisać AGENTS.md dla repo test automation
Co wrzucać do AGENTS.md w repozytorium testowym, jakie są typowe pułapki, szkielety dla Playwright, Cypress i API, i jak sprawdzić, czy plik realnie pomaga.
Skills, tools, agents, MCP, AGENTS.md - mapa pojęć dla testerów
Pięć pojęć, które najczęściej mylą się w rozmowach o AI w QA - plus prosty model decyzyjny, czego użyć do czego.
Model dojrzałości adopcji AI
Od oporu do orkiestracji - 11 poziomów wykorzystania AI w organizacji. Sprawdź, na którym etapie jesteś Ty i Twój zespół.
5 promptów, które zmienią Twoją pracę z AI
Sprawdzone techniki prompt engineeringu, które możesz zastosować od razu.