Raciocínio Além da Recuperação: Avaliando a Eficácia de Arquiteturas Generalistas vs. Fine-Tunes Especializados em Sistemas de Diálogo em Saúde Mental Baseados em RAG · Artigo de referência

Título original: Reasoning Over Recall: Evaluating the Efficacy of Generalist Architectures vs. Specialized Fine-Tunes in RAG-Based Mental Health Dialogue Systems. Pode sustentar que, nesse arranjo de RAG, modelos gener…

Como a literatura científica descreve e avalia o uso de sistemas conversacionais de IA generativa, especialmente modelos grandes de linguagem e chatbots baseados em LLMs, em funções de psicoterapia, aconselhamento, psicoeducação, autocuidado em saúde mental ou suporte emocional, e que evidências existem sobre contextos de uso, aceitabilidade, efeitos relatados, segurança, manejo de crise, limitações e salvaguardas?

A literatura disponível descreve usos delimitados de chatbots e IA generativa em saúde mental. No corpus público atual, há sinal baixo a moderado de aceitabilidade e de apoio pontual em contextos de baixo risco, sobretudo quando a tarefa é estruturada e a supervisão humana permanece. Isso não demonstra que esses sistemas “façam terapia” no sentido clínico, nem que sejam seguros em crise ou capazes de substituir psicoterapia humana

Força da evidência: baixa a moderada para apoio pontual, aceitabilidade e usos estruturados ou supervisionados de baixo risco; baixa para benefício clínico sustentado; insuficiente/não demonstrada para segurança em crise e para substituição de psicoterapia humana

Estado público: briefing público pos AR0438 v1

Título original: Reasoning Over Recall: Evaluating the Efficacy of Generalist Architectures vs. Specialized Fine-Tunes in RAG-Based Mental Health Dialogue Systems

O que este artigo pode sustentar: Pode sustentar que, nesse arranjo de RAG, modelos generalistas modernos superaram fine-tunes especializados em empatia percebida e uso do contexto recuperado

O que este artigo não pode sustentar: Não pode sustentar eficácia terapêutica, segurança clínica em pacientes reais, superioridade geral de arquiteturas generalistas ou uso autônomo em crise

Alerta metodológico: Sugere vantagem de raciocínio sobre especialização estreita em RAG, mas o teste é pequeno, sintético e depende de juiz LLM e anotadores leigos