LLM Digest

Story

arxiv_llm_reliability · Jun 26, 2026 · paper

Source brief

When Search Agents Should Ask: DiscoBench for Clarification-Aware Deep Search

arxiv.orgJun 26, 2026
original source linked

In brief

Search agents powered by large language models (LLMs) are increasingly used to solve complex information-seeking tasks, requiring multi-step retrieval and reasoning to fulfill user goals. However, existing benchmarks...

Feed lens

agenteval

Read the original at arxiv.org →Open in live feed Read that day’s brief

When Search Agents Should Ask: DiscoBench for Clarification-Aware Deep Search

Earlier in this thread 4 items

ScaffoldAgent: Utility-Guided Dynamic Outline Optimization for Open-Ended Deep Research

DRFLOW: A Deep Research Benchmark for Personalized Workflow Prediction

June 2026: LangChain Newsletter — Fleet On-Call Copilot, Deep Agents Rubrics, and More

Build context-rich research agents with Deep Agents and Bedrock AgentCore