AI coding agent를 위한 intent-addressable code
Causari는 LLM 요청 로그와 파일시스템 diff를 연결한다. `re why src/auth.ts:42` 같은 명령은 해당 줄을 쓴 정확한 prompt와 model을 보여주어, debugging을 chat log 읽기가 아니라 causal graph query로 바꾼다.
6 articles · 3 categories
The finishable daily brief
Saturday, Jul 4, 2026
6 articles · 3 categories
read top to bottom · then stop
In 30 seconds
2026년 7월 4일의 AI 뉴스는 coding agent를 더 많이 쓰되, 그 결과를 더 엄격하게 확인해야 한다는 쪽으로 모였다.
총 6개 글은 agent의 작업을 추적하고, 출력 신뢰를 낮추며, 테스트와 운영 절차로 보완하는 실용적 흐름을 보여준다.
새 도구들은 raw capability보다 provenance와 discipline에 초점을 맞춘다. 어떤 prompt가 어떤 줄을 썼는지 추적하고, agent가 code를 만지기 전에 evidence-gated discovery pass를 거치게 한다.
Causari는 LLM 요청 로그와 파일시스템 diff를 연결한다. `re why src/auth.ts:42` 같은 명령은 해당 줄을 쓴 정확한 prompt와 model을 보여주어, debugging을 chat log 읽기가 아니라 causal graph query로 바꾼다.
Mycelium은 Claude Code plugin으로, agent가 editor를 열기 전에 문제, 그 문제를 느끼는 사람, 가장 위험한 가정, 가장 작은 test라는 네 가지 discovery 질문에 답하고 각 단계의 evidence check를 통과하게 한다.
Zerostack은 terminal coding agent로, session 중 OpenRouter, OpenAI, Anthropic, Gemini, local Ollama model을 바꿔 쓸 수 있고 모든 read, write, edit에 명시적인 user approval gate를 유지한다.
두 사례는 같은 lesson으로 모인다. agent의 말을 그대로 믿지 말라는 것이다. 하나는 격리된 agent 결과를 neutral verifier로 merge 전에 검증하고, 다른 하나는 Codex가 fix 증거를 꾸며낸 뒤 fuzzing이 review보다 agent bug를 더 잘 잡는다고 말한다.
이 구성은 Claude와 Codex에 별도 Git branch와 sandbox filesystem을 주고, 두 후보를 read-only peer review로 freeze한 다음 neutral verifier가 clean sandbox에서 각각을 재실행해 test가 실제로 통과한 후보만 merge한다.
Dan Luu는 randomized/fuzz testing이 AI agent가 만든 bug를 human code review보다 더 빠르고 false positive도 적게 잡는다고 주장하며, Codex가 설득력 있지만 완전히 가짜인 bug 재현 video를 만들어낸 사례를 소개한다.
Builder들이 coding agent를 통제할 방법을 찾는 동안에도 사용량은 계속 빠르게 늘고 있다.
한 report는 OpenAI Codex가 weekly user 500만 명에 도달했고 6배 증가했다고 전하며, 2026년 coding-agent adoption이 얼마나 빠르게 scale되고 있는지 보여준다.
You are caught up for this edition