🖥️ #89: Harness Engineering dla Coding Agents

+ Composer 2, AI w Code Reviews i jak pisać dobry CLAUDE.md?

mar 24, 2026

Siema!

Programujesz z AI? To dziś masz co czytać! Jest o nowych modelach, buzzwordach, czy dobrych praktykach w narzędziach. Zastanowimy się też, czy niektóre, dobrze znane nam procesy, nadal mają sens w obecnej formie.

Enjoy!

Harness Engineering

Mieliśmy Prompt, Context, a teraz przyszła pora na tzw. Harness Engineering.

Kolejny buzzword do kolekcji? O co tu chodzi?

Według twórców pojęcia Context Engineering, Harness jest podzbiorem kontekstu i skupia się nie na modelu, ale na wszystkim wokół niego. Główną tezą jest to, że to nie modele są bottleneckiem, a środowisko, w jakim model żyje.

Zamiast czekać na GPT-6, powinniśmy się skupić na dobraniu odpowiedniej “uprzęży”, która pozwoli nam efektywniej pracować, generować lepszej jakości kod i wypluwać mniej błędów.

harness engineering as context engineering

W kontekście agentów do kodowania, częściami harnessu są m.in. AGENTS.md/CLAUDE.md, MCP, Skils, Rules, Hooks, Commands…

To dzięki odpowiedniemu skalibrowaniu tych narzędzi jesteśmy w stanie zwiększyć skuteczność, ograniczyć koszty i zwiększyć determinizm, nawet w tak niedeterministycznym środowisku, jakim są LLMy.

Koniecznie sprawdź cały artykuł od Humanlayer – masa cennej wiedzy.

Jak pisać dobry CLAUDE.md / AGENTS.md?

A jak już jesteśmy przy dopracowywaniu toolkitu dla agentów…

Jeśli pracujesz z agentami do kodowania, to na pewno się natknąłeś na pliki CLAUDE.md lub AGENTS.md. Służą one do dania kluczowego kontekstu agentowi. W zamyśle agent powinien mieć zawsze dostęp do tego pliku i brać pod uwagę informacje w nim zawarte przy każdej konwersacji.

Olaf, mamy przecież np. komendę init/ , która samemu zbierze sobie najważniejsze informacje, więc z czym problem?

Tylko że to nie działa tak idealnie, jak twórcy by tego oczekiwali.

Informacje w tych plikach często nie są brane pod uwagę i np. Claude może zignorować taki plik kompletnie.

Pojawia się również kwestia tego, ile i jakie informacje w takich plikach zawierać. Czy mamy wrzucić tutaj cały nasz code style, strukturę plików, architekturę, opis projektu? Gdzie jest ta granica zbyt wielu informacji? Jak długi powinien być ten plik?

Tak wiele pytań, tak mało odpowiedzi.

Na szczęście goście z Humanlayer ponownie mają dla nas dobre źródło wiedzy.

AI w Code Review

Jak to jest z tym Code Review w dobie AI? Moim zdaniem to jeszcze nierozwiązany problem i nikt do końca nie wie, jak do tego sensownie podejść.

Istnieją oczywiście narzędzia pokroju Code Rabbit, ale opinie o ich skuteczności też raczej są mieszane.

Duzi gracze próbują coś z tym zrobić. Anthropic jakiś czas temu wypuścił nowy feature CR dla Claude Code. Wygląda to spoko, a wyniki prezentują się dobrze. Problem? Jedno review kosztuje $15-25!

Claude@claudeai

Code Review optimizes for depth and may be more expensive than other solutions, like our open source GitHub Action. Reviews generally average $15–25, billed on token usage, and they scale based on PR complexity.

7:22 PM · Mar 9, 2026 · 7.19M Wyświetl

268 Odpowiedz · 123 Udostępnienia · 3.07K Like

Tak drogo to jeszcze nie było…

Niektóre źródła pokazują, że co prawda AI ogromnie wpływa na efektywność pracy, ale przy wykorzystaniu AI rośnie również czas na Code Review, które staje się bottleneckiem.

Artykuł How to Kill the Code Review, jak sam tytuł wskazuje, wychodzi z dość odważnymi tezami. Według autora powinniśmy przenieść swoją uwagę z recenzowania kodu jako takiego na ocenę intencji i specyfikacji. Krok w górę na drabince abstrakcji.

Do tego, moim zdaniem, jeszcze daleka droga i obecnie większość firm nie może pozwolić sobie na takie podejście.

Co jednak przeniesie przyszłość? Well, podajcie mi moją magiczną kulę.

Jestem przekonany, że coś się zmieni. Obecnie dostrajamy wszystkie nasze procesy pod AI, a nie budujemy ich stricte pod agentów.

Cursor Composer 2

Ziomki od Cursora wypuszczają szybszy, tańszy i doganiający konkurencję model?

A nie, to tylko KIMI K2.5 z dodatkowym RL. Bardzo nie na rękę było twórcom, gdy prawda wyszła na jaw.

Wszystko by się udało, gdyby nie te sprytne dzieciaki…

A tak na poważnie, druga wersja Composera, prezentuje się bardzo solidnie:

Composer 2 efficiency and quality on CursorBench

Chińczyk w niektórych benchmarkach dogania samą topkę modeli w postaci Claude Opusa 4.6 czy GPT-5.4. Przy tym wszystkim jest bardzo szybki i kosztuje znacznie mniej - $0.50/M inputu oraz $2.50/M outputu.

Dla użytkowników Cursora to dobra informacja. Model dostępny jest jako część niezależnej puli z dużym limitem. Czekamy na udostępnienie poza Cursorem!

Claude Code: ciekawe zmiany

Poza Code Reviews, ekipa Anthropica w ciągu ostatnich tygodni wypuściła masę zmian do CC.

Zebrałem najważniejsze z nich:

Claude Code Security - skanowanie repozytorium w poszukiwaniu luk bezpieczeństwa, sugerowanie poprawek
Natywna obsługa worktrees - równoległe odpalanie agentów na bazie git worktrees, wsparcie dla subagentów
Remote Control - rozpocznij zadanie z poziomu termianala, dokończ na telefonie
Nowe komendy:
- /simplify - usprawnia kod, zwiększa wydajność, sprawdza poprawność z CLAUDE.md
- /batch - odpalenie wielu agentów do wykonania zadania, używa git worktrees pod spodem
- /btw - wtrącenie kolejnej wiadomości podczas działania Claude’a
- /loop - odpalanie i planowanie powtarzalnych się zadań
Auto memory - automatyczne zapamiętywanie kontekstu projektu, używanych patternów itp.

Kolejny film

Udało mi się domknąć nowy film! Tym razem wchodzimy grubo w programowanie z agentami AI. Ale spokojnie, nie będziemy gadać o podstawach Claude Code, cmon…

Programuję z narzędziami AI już od około 3 lat. Przez ten czas masę rzeczy się zmieniło i nadal, jak dobrze widać po tym newsletterze, bardzo dużo się zmienia.

Od jakiegoś czasu jednak część zasad pozostaje taka sama. Postanowiłem zebrać najważniejsze z nich i nagrać o tym film :)

Będzie o context engineeringu, compaction, zarządzaniu kontrolą, a nawet o przykładowym workflow w stylu research-plan-implement.

Taka pigułka wiedzy, która pozwoli Ci efektywnie pracować z agentami. Bez generowania slopu, w produkcyjnych codebase’ach, nie tylko na małych, pobocznych projektach.

Premiera w najbliższy poniedziałek o 18:00!

Subskrybuj, żeby nie przegapić :)

Ciekawe linki

Lekcje z budowania Claude Code: Skills

Od kogo innego uczyć się o Skillach, jak nie od samego Anthropica? Świetny artykuł w którym autor dzieli się tym, jak twórcy Claude Code używają Skillsów w swojej pracy.

Aesthetics of AI - identyfikacje wizualne marek AI

Brandingi firm AI. Co jest obecnie na czasie? Jakie design patterny przyjmują firmy? Od czego zależą różne podejścia do brandingu? Fajny zbiór!

Już uciekasz?

Jeśli Ci się podobało, kliknij 🧡 poniżej, to nic nie kosztuje! Doceniasz w ten sposób moją pracę i motywujesz do dalszych działań :)

Do następnego,

Olaf

Dyskusja o tym Poście

Gotowy na więcej?