Primeiros socorros psicológicos por IA: prova de conceito e desempenho comparativo do ChatGPT-4 e do Gemini em diferentes cenários de desastre. · Artigo de referência

Título original: Psychological First Aid by AI: Proof-of-Concept and Comparative Performance of ChatGPT-4 and Gemini in Different Disaster Scenarios. Pode sustentar plausibilidade técnica de respostas de PFA por texto e…

Como a literatura científica descreve e avalia o uso de sistemas conversacionais de IA generativa, especialmente modelos grandes de linguagem e chatbots baseados em LLMs, em funções de psicoterapia, aconselhamento, psicoeducação, autocuidado em saúde mental ou suporte emocional, e que evidências existem sobre contextos de uso, aceitabilidade, efeitos relatados, segurança, manejo de crise, limitações e salvaguardas?

A literatura disponível descreve usos delimitados de chatbots e IA generativa em saúde mental. No corpus público atual, há sinal baixo a moderado de aceitabilidade e de apoio pontual em contextos de baixo risco, sobretudo quando a tarefa é estruturada e a supervisão humana permanece. Isso não demonstra que esses sistemas “façam terapia” no sentido clínico, nem que sejam seguros em crise ou capazes de substituir psicoterapia humana.

Força da evidência: baixa a moderada para apoio pontual, aceitabilidade e usos estruturados ou supervisionados de baixo risco; baixa para benefício clínico sustentado; insuficiente/não demonstrada para segurança em crise e para substituição de psicoterapia humana

Título original: Psychological First Aid by AI: Proof-of-Concept and Comparative Performance of ChatGPT-4 and Gemini in Different Disaster Scenarios.

O que este artigo pode sustentar: Pode sustentar plausibilidade técnica de respostas de PFA por texto e diferença de desempenho/alucinação entre ChatGPT-4 e Gemini em cenários simulados

O que este artigo não pode sustentar: Não pode sustentar eficácia em sobreviventes reais, segurança autônoma em crise, equivalência à PFA humana nem benefício clínico

Alerta metodológico: Mostra que um modelo pode pontuar bem em PFA simulada e ainda alucinar com frequência relevante; útil para cautela, não para implantação clínica