Mapa da pesquisa
Aplicações visuais para deep research
Painel visual da pesquisa selecionada: score, fases, evidências, perguntas abertas e artefatos que sustentam a decisão.
Como a pesquisa chegou até aqui
Primeiro leia o caminho de execução: fases concluídas, eventos relevantes e cobertura alcançada. Isso responde se a pesquisa tem base suficiente para confiar no veredito.
pipeline
Fases e execução
Query reveals prior-art-search intent for visual deep research apps.
7 orthogonal sub-queries across commercial DR apps, OSS agents, observability, workflow builders, UX patterns, comparison, academic skepticism.
v1 broad scope (15+ apps across 5 tiers).
updated 01-deep-research-prompt.md to v2 with explicit LangChain exclusion list.
Wave 1 covers commercial Tier 1, OSS Tier 2 (incl. btahir/open-deep-research with Visual Research Mapping), observability Tier 3 (Phoenix/Helicone/Weave/Lunary), workflow builders Tier 4 (Dify/n8n/Rivet/Vellum).
shifted Wave 2 focus to local-first OSS + CLI wrappers + markdown live-render.
Wave 2: CC/Codex GUIs (Opcode 21k, Kanna, agents-ui, VibeAround), local markdown viewers (Marky, Obsidian, Logseq, InfraNodus), DeerFlow flagged but EXCLUDED (LangChain), btahir/open-deep-research confirmed non-LangChain via WebFetch, Tauri v2 architecture consensus extracted.
Coverage breakdown: fundamentals 92, implementation 82, comparison 88, best_practices 85, real_world 86, current_state 82.
coverage
Breakdown
O que a descoberta revelou
Aqui ficam os aprendizados de produto: gaps, padrões e oportunidades que transformam dados brutos em decisão de design ou engenharia.
matrices
Matrizes
4. Matriz: Fase do `/tech-research` x Prior-Art
fdarkaou/open-deep-research
formulário + parâmetros
não mostra inferência de contexto como objeto auditável
btahir/open-deep-research
follow-up questions e branches
não mostra sub-query JSON + estratégia parallel/sequential
deep-agents-ui / Ylang UI
chat/assistant UI
não trata `01-deep-research-prompt.md` como artefato versionado
fdarkaou / btahir
progress tracking e results
pouca visibilidade de tools, falhas, fallback e credibilidade
RAG Lab
snippets e citações
não está conectado à execução da pesquisa
LangChain Open Deep Research
benchmark/agent state parcial
quase nenhum app mostra coverage_score, gaps e stopping rule
nenhum forte
sem equivalente direto
oportunidade clara: wave summaries como checkpoints
Cogpit/AgentMux/Tide
tool calls e browsers/exec
falta visão de multi-LLM research como evidência comparável
open-deep-research apps
relatório final
pouca rastreabilidade claim → source → wave
RAG Lab / observability tools
snippets/citations
falta integrity_score e claims verificados
btahir Knowledge Base
biblioteca de relatórios
falta renderização filesystem-first de `docs/research/`
patterns
Padrões úteis
turn → tool call → file write → phase result. Cogpit é a referência mais clara.
query raiz → sub-queries → branches → consolidação. `btahir/open-deep-research` é a referência mais direta.
coluna fixa com fases, status, duração, outputs e erros. Bom para adaptar ao pipeline `Phase 0..5`.
cada arquivo gerado vira um card/nó com tipo, fase, timestamp e preview.
painel lateral por fonte com URL, credibilidade, data, trechos usados e claims suportados.
score total, breakdown, gaps, next_queries e stopping decision. Este parece pouco explorado no mercado.
O que ainda precisa ser decidido
Feche o mapa olhando para perguntas abertas e cobertura de artefatos. Se algo aqui estiver fraco, a próxima ação deve nascer na aba Ações.
open questions
Dúvidas que movem a próxima wave
ACP (Agent Coordination Protocol) over stdio é estável o suficiente para wrap Claude Code + Codex CLI em produção em 2026?
Buscar spec ACP, exemplos reais em repos OSS além de VibeAround, e issues conhecidas.
Como o `agents-ui` (Ngxba/claude-code-cli-ui) expõe seu 'relationship graph' e 'visual workflow builder'? É reusable como biblioteca?
Spike técnico no repo — verificar arquitetura, dependências (provavelmente Nuxt/Vue, não React).
Qual é o trade-off real Tauri v2 vs Electron para um app que precisa de Mermaid + ReactFlow + markdown-it + filesystem watcher em 2026?
Spike de 2-4h: scaffold mínimo Tauri v2 + ReactFlow + 5 nodes. Medir bundle, latência, dev experience.
Devil's advocate: o usuário realmente precisa de UI visual ou um TUI rico (estilo `gum`, `charm`, `lazygit`) resolveria 90% do problema com 10% do esforço?
Curto experimento: rodar `/tech-research` com uma camada de TUI Rust (ratatui) que renderiza phase-map em tempo real. Comparar UX com mockup Tauri.
Langfuse deve ser excluído junto com LangChain ou pode ficar como observability opt-in?
Perguntar diretamente ao usuário.
Como o usuário quer rodar searches no MVP — diretamente do Tauri app (chamando API providers) ou só assistindo o que Claude Code/Codex já fez offline (post-run)?
Decisão do usuário/PM.
artifact index