Muitos estudos sobre IA generativa em saúde mental não viram prova de terapia · Matéria

Ter 385 artigos públicos ajuda a mapear o campo, mas não significa ter 385 provas de terapia digital segura e eficaz.

Um número grande de artigos pode dar impressão de resposta forte. Em uma revisão de escopo, porém, mapear muita literatura não é o mesmo que provar que chatbots fazem terapia. Esta matéria se baseia na revisão ScienceLayers sobre chatbots e IA generativa em saúde mental, que examinou evidência direta, estudos indiretos, simulações, contexto e limites metodológicos. Uma revisão de escopo não pesa todos os registros do mesmo jeito. Nesta versão, há 385 artigos públicos com crítica metodológica: 218 entram como estudos incluídos e 167 servem principalmente como contexto. O primeiro grupo pode sustentar a conclusão quando camada, qualidade e limites do artigo permitem. O segundo informa contexto, risco, método e governança, mas não sustenta sozinho efeito terapêutico. Essa separação evita inflar a resposta. O ensaio piloto que compara chatbot e linha telefônica de enfermagem tem peso alto, mas mesmo ele não sustenta equivalência clínica. Um estudo de simulações é central para risco, mas não mede dano real em pacientes. Um estudo com psicoterapeutas fala de aceitação profissional, não de eficácia em pacientes. Também há estudos importantes porque se aproximam de registros clínicos reais de possível dano. Ainda assim, eles não sustentam incidência, causalidade ou risco comparativo. E há evidências adjacentes, como satisfação imediata em aconselhamento informacional mediado por médico, que ajudam a compor o mapa sem provar terapia direta. A revisão também informa que 526 textos extraídos e avaliados formam um corpus operacional de auditoria, mas não sustentação pública integral. Parte desses registros foi excluída após texto completo ou permaneceu pendente, e por isso não deve sustentar a conclusão pública. O número grande, portanto, serve para mapear o campo, não para dar fo…