Research · AIOX Research

Mapa da pesquisa

Aplicações visuais para deep research

Painel visual da pesquisa selecionada: score, fases, evidências, perguntas abertas e artefatos que sustentam a decisão.

Cobertura

Integridade

Fontes

Waves

Como a pesquisa chegou até aqui

Primeiro leia o caminho de execução: fases concluídas, eventos relevantes e cobertura alcançada. Isso responde se a pesquisa tem base suficiente para confiar no veredito.

pipeline

Fases e execução

9 fases · 12 eventos

Auto Clarify

auto_clarify

completed

Decompose

decompose

completed

Generate Prompt

generate_prompt

completed

Execute Research

execute_research

completed

Evaluate Coverage

evaluate_coverage

completed

Compress Wave

compress_wave

completed

Synthesize

synthesize

completed

Verify Citations

verify_citations

completed

Document

document

completed

2026-05-11 17:35:00

completed

0 Auto Clarify

Query reveals prior-art-search intent for visual deep research apps.

2026-05-11 17:36:00

completed

1 5 Decompose

7 orthogonal sub-queries across commercial DR apps, OSS agents, observability, workflow builders, UX patterns, comparison, academic skepticism.

2026-05-11 17:38:00

completed

2 Generate Prompt

v1 broad scope (15+ apps across 5 tiers).

2026-05-11 17:40:00

refinement

User Input

updated 01-deep-research-prompt.md to v2 with explicit LangChain exclusion list.

2026-05-11 17:42:00

completed

3 Execute Research Wave1

Wave 1 covers commercial Tier 1, OSS Tier 2 (incl. btahir/open-deep-research with Visual Research Mapping), observability Tier 3 (Phoenix/Helicone/Weave/Lunary), workflow builders Tier 4 (Dify/n8n/Rivet/Vellum).

2026-05-11 17:45:00

refinement

User Input

shifted Wave 2 focus to local-first OSS + CLI wrappers + markdown live-render.

2026-05-11 17:48:00

completed

3 Execute Research Wave2

Wave 2: CC/Codex GUIs (Opcode 21k, Kanna, agents-ui, VibeAround), local markdown viewers (Marky, Obsidian, Logseq, InfraNodus), DeerFlow flagged but EXCLUDED (LangChain), btahir/open-deep-research confirmed non-LangChain via WebFetch, Tauri v2 architecture consensus extracted.

2026-05-11 17:50:00

completed

3 5 Evaluate Coverage

Coverage breakdown: fundamentals 92, implementation 82, comparison 88, best_practices 85, real_world 86, current_state 82.

coverage

Breakdown

88/100

Fundamentals92

Implementation84

Comparison88

Best Practices86

Real World88

Current State86

O que a descoberta revelou

Aqui ficam os aprendizados de produto: gaps, padrões e oportunidades que transformam dados brutos em decisão de design ou engenharia.

matrices

Matrizes

13 quadros

matriz principal

4. Matriz: Fase do `/tech-research` x Prior-Art

Linhas

Colunas

Fase Sinkra

Melhor Prior Art

VisualizaçãO Existente

Gap Para Sinkra

01 / 11

Auto-Clarify

referência

fdarkaou/open-deep-research

sinal

formulário + parâmetros

gap

não mostra inferência de contexto como objeto auditável

02 / 11

Decompose

referência

btahir/open-deep-research

sinal

follow-up questions e branches

gap

não mostra sub-query JSON + estratégia parallel/sequential

03 / 11

Generate Prompt

referência

deep-agents-ui / Ylang UI

sinal

chat/assistant UI

gap

não trata `01-deep-research-prompt.md` como artefato versionado

04 / 11

Execute Search

referência

fdarkaou / btahir

sinal

progress tracking e results

gap

pouca visibilidade de tools, falhas, fallback e credibilidade

05 / 11

Deep Read

referência

RAG Lab

sinal

snippets e citações

gap

não está conectado à execução da pesquisa

06 / 11

Evaluate Coverage

referência

LangChain Open Deep Research

referência

benchmark/agent state parcial

gap

quase nenhum app mostra coverage_score, gaps e stopping rule

07 / 11

Compress Wave

gap

nenhum forte

sinal

sem equivalente direto

gap

oportunidade clara: wave summaries como checkpoints

08 / 11

Playwright Deep

referência

Cogpit/AgentMux/Tide

sinal

tool calls e browsers/exec

gap

falta visão de multi-LLM research como evidência comparável

09 / 11

Synthesize

referência

open-deep-research apps

sinal

relatório final

gap

pouca rastreabilidade claim → source → wave

10 / 11

Verify Citations

referência

RAG Lab / observability tools

sinal

snippets/citations

gap

falta integrity_score e claims verificados

11 / 11

Document

referência

btahir Knowledge Base

sinal

biblioteca de relatórios

gap

falta renderização filesystem-first de `docs/research/`

patterns

Padrões úteis

Timeline diagnóstica

turn → tool call → file write → phase result. Cogpit é a referência mais clara.

Grafo de pesquisa

query raiz → sub-queries → branches → consolidação. `btahir/open-deep-research` é a referência mais direta.

Phase rail

coluna fixa com fases, status, duração, outputs e erros. Bom para adaptar ao pipeline `Phase 0..5`.

Artifact-first workspace

cada arquivo gerado vira um card/nó com tipo, fase, timestamp e preview.

Source evidence drawer

painel lateral por fonte com URL, credibilidade, data, trechos usados e claims suportados.

Coverage cockpit

score total, breakdown, gaps, next_queries e stopping decision. Este parece pouco explorado no mercado.

O que ainda precisa ser decidido

Feche o mapa olhando para perguntas abertas e cobertura de artefatos. Se algo aqui estiver fraco, a próxima ação deve nascer na aba Ações.

open questions

Dúvidas que movem a próxima wave

6 P1

CQ-001

ACP (Agent Coordination Protocol) over stdio é estável o suficiente para wrap Claude Code + Codex CLI em produção em 2026?

Buscar spec ACP, exemplos reais em repos OSS além de VibeAround, e issues conhecidas.

CQ-003

Como o `agents-ui` (Ngxba/claude-code-cli-ui) expõe seu 'relationship graph' e 'visual workflow builder'? É reusable como biblioteca?

Spike técnico no repo — verificar arquitetura, dependências (provavelmente Nuxt/Vue, não React).

CQ-005

Qual é o trade-off real Tauri v2 vs Electron para um app que precisa de Mermaid + ReactFlow + markdown-it + filesystem watcher em 2026?

Spike de 2-4h: scaffold mínimo Tauri v2 + ReactFlow + 5 nodes. Medir bundle, latência, dev experience.

CQ-008

Devil's advocate: o usuário realmente precisa de UI visual ou um TUI rico (estilo `gum`, `charm`, `lazygit`) resolveria 90% do problema com 10% do esforço?

Curto experimento: rodar `/tech-research` com uma camada de TUI Rust (ratatui) que renderiza phase-map em tempo real. Comparar UX com mockup Tauri.

CQ-009

Langfuse deve ser excluído junto com LangChain ou pode ficar como observability opt-in?

Perguntar diretamente ao usuário.

CQ-010

Como o usuário quer rodar searches no MVP — diretamente do Tauri app (chamando API providers) ou só assistindo o que Claude Code/Codex já fez offline (post-run)?

Decisão do usuário/PM.

artifact index

Arquivos de suporte

21 fontes indexadas23 artefatos legíveismetrics.yaml presentepipeline-state.yaml presenteexecution-log.jsonl presentesources.yaml presente2 waves detectadas

Mapa da pesquisa

Aplicações visuais para deep research

Painel visual da pesquisa selecionada: score, fases, evidências, perguntas abertas e artefatos que sustentam a decisão.

Cobertura

Integridade

Fontes

Waves

Como a pesquisa chegou até aqui

Primeiro leia o caminho de execução: fases concluídas, eventos relevantes e cobertura alcançada. Isso responde se a pesquisa tem base suficiente para confiar no veredito.

pipeline

Fases e execução

9 fases · 12 eventos

Auto Clarify

auto_clarify

completed

Decompose

decompose

completed

Generate Prompt

generate_prompt

completed

Execute Research

execute_research

completed

Evaluate Coverage

evaluate_coverage

completed

Compress Wave

compress_wave

completed

Synthesize

synthesize

completed

Verify Citations

verify_citations

completed

Document

document

completed

2026-05-11 17:35:00

completed

0 Auto Clarify

Query reveals prior-art-search intent for visual deep research apps.

2026-05-11 17:36:00

completed

1 5 Decompose

7 orthogonal sub-queries across commercial DR apps, OSS agents, observability, workflow builders, UX patterns, comparison, academic skepticism.

2026-05-11 17:38:00

completed

2 Generate Prompt

v1 broad scope (15+ apps across 5 tiers).

2026-05-11 17:40:00

refinement

User Input

updated 01-deep-research-prompt.md to v2 with explicit LangChain exclusion list.

2026-05-11 17:42:00

completed

3 Execute Research Wave1

2026-05-11 17:45:00

refinement

User Input

shifted Wave 2 focus to local-first OSS + CLI wrappers + markdown live-render.

2026-05-11 17:48:00

completed

3 Execute Research Wave2

2026-05-11 17:50:00

completed

3 5 Evaluate Coverage

Coverage breakdown: fundamentals 92, implementation 82, comparison 88, best_practices 85, real_world 86, current_state 82.

coverage

Breakdown

88/100

Fundamentals92

Implementation84

Comparison88

Best Practices86

Real World88

Current State86

O que a descoberta revelou

Aqui ficam os aprendizados de produto: gaps, padrões e oportunidades que transformam dados brutos em decisão de design ou engenharia.

matrices

Matrizes

13 quadros

matriz principal

4. Matriz: Fase do `/tech-research` x Prior-Art

Linhas

Colunas

Fase Sinkra

Melhor Prior Art

VisualizaçãO Existente

Gap Para Sinkra

01 / 11

Auto-Clarify

referência

fdarkaou/open-deep-research

sinal

formulário + parâmetros

gap

não mostra inferência de contexto como objeto auditável

02 / 11

Decompose

referência

btahir/open-deep-research

sinal

follow-up questions e branches

gap

não mostra sub-query JSON + estratégia parallel/sequential

03 / 11

Generate Prompt

referência

deep-agents-ui / Ylang UI

sinal

chat/assistant UI

gap

não trata `01-deep-research-prompt.md` como artefato versionado

04 / 11

Execute Search

referência

fdarkaou / btahir

sinal

progress tracking e results

gap

pouca visibilidade de tools, falhas, fallback e credibilidade

05 / 11

Deep Read

referência

RAG Lab

sinal

snippets e citações

gap

não está conectado à execução da pesquisa

06 / 11

Evaluate Coverage

referência

LangChain Open Deep Research

referência

benchmark/agent state parcial

gap

quase nenhum app mostra coverage_score, gaps e stopping rule

07 / 11

Compress Wave

gap

nenhum forte

sinal

sem equivalente direto

gap

oportunidade clara: wave summaries como checkpoints

08 / 11

Playwright Deep

referência

Cogpit/AgentMux/Tide

sinal

tool calls e browsers/exec

gap

falta visão de multi-LLM research como evidência comparável

09 / 11

Synthesize

referência

open-deep-research apps

sinal

relatório final

gap

pouca rastreabilidade claim → source → wave

10 / 11

Verify Citations

referência

RAG Lab / observability tools

sinal

snippets/citations

gap

falta integrity_score e claims verificados

11 / 11

Document

referência

btahir Knowledge Base

sinal

biblioteca de relatórios

gap

falta renderização filesystem-first de `docs/research/`

patterns

Padrões úteis

Timeline diagnóstica

turn → tool call → file write → phase result. Cogpit é a referência mais clara.

Grafo de pesquisa

query raiz → sub-queries → branches → consolidação. `btahir/open-deep-research` é a referência mais direta.

Phase rail

coluna fixa com fases, status, duração, outputs e erros. Bom para adaptar ao pipeline `Phase 0..5`.

Artifact-first workspace

cada arquivo gerado vira um card/nó com tipo, fase, timestamp e preview.

Source evidence drawer

painel lateral por fonte com URL, credibilidade, data, trechos usados e claims suportados.

Coverage cockpit

score total, breakdown, gaps, next_queries e stopping decision. Este parece pouco explorado no mercado.

O que ainda precisa ser decidido

Feche o mapa olhando para perguntas abertas e cobertura de artefatos. Se algo aqui estiver fraco, a próxima ação deve nascer na aba Ações.

open questions

Dúvidas que movem a próxima wave

6 P1

CQ-001

ACP (Agent Coordination Protocol) over stdio é estável o suficiente para wrap Claude Code + Codex CLI em produção em 2026?

Buscar spec ACP, exemplos reais em repos OSS além de VibeAround, e issues conhecidas.

CQ-003

Como o `agents-ui` (Ngxba/claude-code-cli-ui) expõe seu 'relationship graph' e 'visual workflow builder'? É reusable como biblioteca?

Spike técnico no repo — verificar arquitetura, dependências (provavelmente Nuxt/Vue, não React).

CQ-005

Qual é o trade-off real Tauri v2 vs Electron para um app que precisa de Mermaid + ReactFlow + markdown-it + filesystem watcher em 2026?

Spike de 2-4h: scaffold mínimo Tauri v2 + ReactFlow + 5 nodes. Medir bundle, latência, dev experience.

CQ-008

Devil's advocate: o usuário realmente precisa de UI visual ou um TUI rico (estilo `gum`, `charm`, `lazygit`) resolveria 90% do problema com 10% do esforço?

Curto experimento: rodar `/tech-research` com uma camada de TUI Rust (ratatui) que renderiza phase-map em tempo real. Comparar UX com mockup Tauri.

CQ-009

Langfuse deve ser excluído junto com LangChain ou pode ficar como observability opt-in?

Perguntar diretamente ao usuário.

CQ-010

Como o usuário quer rodar searches no MVP — diretamente do Tauri app (chamando API providers) ou só assistindo o que Claude Code/Codex já fez offline (post-run)?

Decisão do usuário/PM.

artifact index

Arquivos de suporte

21 fontes indexadas23 artefatos legíveismetrics.yaml presentepipeline-state.yaml presenteexecution-log.jsonl presentesources.yaml presente2 waves detectadas