LLM Digest
Subscribe

AI Weekly Recap

140 articles · 6 categories

View as JSON

Weekly pattern report

6 shifts that shaped AI this week

2026-06-27 → 2026-07-03
2026-W27 · 140 articles reviewed

The week in signals

  • Claude Sonnet 5는 재배포된 Fable 5 및 새 jailbreak severity framework와 같은 주에 나왔고, Azure의 NVIDIA GB300 Blackwell Ultra에서 바로 사용할 수 있었다.
  • AIEWF의 핵심 흐름은 production convergence였다. software factory, agent loop, forward-deployed engineer가 Cursor, Sierra, Vercel에서 같은 운영 모델을 가리켰다.
  • Agent memory는 infrastructure가 됐다. AWS AgentCore metadata filtering, Elastic Atlas, LangChain의 code-dispatched dynamic subagent가 모두 이번 주에 나왔다.
  • Agent security는 stack 전반에서 강화됐다. AI-agent worm 경고, ReAct-loop vulnerability panel, tool-call firewall, dependency-vulnerability CLI가 함께 등장했다.
  • Coding-agent 경제성이 scrutiny를 받았다. builder들은 bill이 두 배가 됐다고 보고했고 GitLab research는 coding 속도 향상이 아직 전체 delivery 속도로 이어지지 않는다고 봤다.

2026-W27의 140개 글은 AI agent가 실험 단계를 지나 제품과 조직 인프라 안으로 들어가고 있음을 보여준다.

모델 경쟁은 계속됐지만, 더 중요한 변화는 memory, 보안, 비용 관리, software factory, inference scale 같은 운영 계층에서 나타났다.

Sonnet 5, Fable 5, 그리고 그 뒤의 인프라 7 items

Anthropic의 model launch와 redeployment가 새 silicon 위 GA와 같은 주에 맞물리며 capability, safety tooling, inference infrastructure가 하나의 story로 묶였다.

Claude Sonnet 5 소개

anthropic_newsroomJun 30Details

Anthropic의 가장 agentic한 Sonnet으로, coding과 everyday professional work에 맞춰 positioning됐고 model builder들이 다음 기본값으로 삼을 가능성이 크다.

AWS에서 Claude Sonnet 5 소개

aws_ml_blogJun 30Details

Sonnet 5는 발표 당일 Amazon Bedrock과 Claude on AWS에 올라가 model launch와 enterprise platform availability 사이의 일반적인 gap을 줄였다.

Claude Fable 5 재배포

anthropic_newsroomJun 30Details

Anthropic은 export control이 풀린 뒤 7월 1일 Fable 5 availability를 재개했고, 이를 updated cybersecurity safeguard와 함께 묶었다.

Agent memory가 infrastructure가 되다 7 items

Memory는 이번 주 demo feature를 벗어났다. AWS, Elastic, LangChain이 production load를 견디는 structural memory와 orchestration primitive를 각각 냈다.

Deep Agents에서 RLM 사용하기

langchain_blogJul 1Details

Recursive language model은 agent가 모든 context를 한 window에 밀어 넣는 대신 context chunk 위로 subagent를 dispatch하는 code를 쓰게 해 context rot를 고친다. 이제 Deep Agents에 구현됐다.

Deep Agents의 dynamic subagent 소개

langchain_blogJun 29Details

Code-dispatched subagent orchestration은 Deep Agents에서 tool-call fan-out을 대체하며, reliable multi-step concurrent work를 위해 coverage를 보장한다.

AIEWF: Software factory와 forward-deployed engineer 6 items

AI Engineer World's Fair coverage는 하나의 operating model로 모였다. production agent team은 prompt tinkerer가 아니라 forward-deployed engineer가 운영하는 software factory에 가깝다.

Agent loop 보안 7 items

Agent security는 이번 주 research talk에서 shipped tooling으로 이동했다. self-propagating agent 경고와 함께 tool call 및 dependency를 위한 구체적인 firewall과 scanner가 나왔다.

Coding-agent 경제성과 거버넌스 6 items

Coding agent가 team 안에서 scale되며 cost와 reliability가 본격 scrutiny를 받았다. bill은 오르고, delivery speed는 coding speed를 따라가지 못하며, agent instruction을 honest하게 유지하려는 tool이 등장했다.

Scale 단계의 inference infrastructure 7 items

Inference workload가 커지며 이번 주 infrastructure story는 cost-per-token을 낮추는 데 집중했다. 새 compute partnership, serving technique, workload-specific benchmark가 함께 나왔다.

Multi-token residual prediction

modal_blogJul 1Details

Diffusion language model을 위한 technique으로 여러 token residual을 한 번에 predict해, 작은 module을 대가로 meaningful serving speedup을 얻는다.

The week, resolved into patterns