Projeto Stargate: O Embate Estatístico — Utts vs. Hyman

Ep. 2 da série especial: mesmos dados, conclusões opostas. Jessica Utts encontrou evidência estatística replicável de visão remota; Ray Hyman viu falhas metodológicas e viés. Quem decidiu qual verdade prevaleceria — e por quê?

Por R.A.A. · 10 de junho de 2026 · 12 min

Projeto Stargate: O Embate Estatístico — Utts vs. Hyman

No Episódio 1 — “Os Sucessos que a CIA Enterrou” — documentamos os casos operacionais verificados do Projeto Stargate: o avião espião localizado em 1976, o submarino soviético de 1979, os mísseis SCUD na Guerra do Golfo e a crise nuclear de Yongbyon. Estabelecemos o paradoxo central que atravessa esta série: por que um programa com sucessos documentados e financiamento contínuo por 23 anos foi encerrado com o veredito público de fracasso científico? A resposta começa nos números — e nas pessoas que os interpretaram.

INTRODUÇÃO

Em setembro de 1995, o American Institutes for Research (AIR) entregou à CIA um documento de 50 páginas que selaria o destino oficial do Projeto Stargate. Dentro desse relatório, duas análises independentes — conduzidas por dois especialistas de reputação impecável — apresentavam leituras radicalmente divergentes sobre o mesmo conjunto de dados. Jessica Utts, professora de estatística da Universidade da Califórnia em Davis, concluiu que os experimentos demonstravam efeitos replicáveis de percepção extrassensorial com significância estatística robusta. Ray Hyman, psicólogo da Universidade de Oregon e cético de carreira, argumentou que falhas metodológicas invalidavam qualquer conclusão positiva. Ambos assinaram o mesmo relatório. Ambos estavam corretos — dentro de seus próprios quadros de referência.

Essa divergência não é um detalhe acadêmico. É o mecanismo pelo qual a CIA justificou o encerramento de um programa de inteligência que havia operado por mais de duas décadas. A escolha de qual interpretação prevaleceria — a de Utts ou a de Hyman — não foi determinada exclusivamente pela matemática. Foi determinada por política institucional, pela pressão do chamado giggle factor e pela conveniência de uma narrativa que transformasse pesquisa controversa em fracasso facilmente descartável.

O que se segue é uma análise do embate que definiu como a ciência oficial lida com fenômenos que desafiam seus paradigmas — e como a mesma evidência estatística pode ser instrumentalizada para conclusões opostas dependendo de quem controla o enquadramento narrativo.

Jessica Utts e a Evidência que se recusa a desaparecer

Jessica Utts não era uma parapsicóloga. Era — e continua sendo — uma estatística de formação rigorosa, professora titular do Departamento de Estatística da UC Davis e, à época da avaliação do Stargate, presidente eleita do American Statistical Association. Quando o AIR a convidou para analisar os dados do programa, Utts aplicou os mesmos métodos que utilizaria para avaliar ensaios clínicos de medicamentos ou a eficácia de intervenções educacionais. Os números, segundo sua análise, eram inequívocos.

Utts examinou os resultados acumulados de mais de uma década de experimentos em visão remota conduzidos no Stanford Research Institute (SRI) e, posteriormente, na Science Applications International Corporation (SAIC) sob a direção de Edwin May. Sua análise estatística identificou tamanhos de efeito (effect sizes) na faixa de 0,2 a 0,385 — valores considerados pequenos a moderados na escala de Cohen, mas estatisticamente significativos e consistentes ao longo de múltiplas séries experimentais. Para contextualizar: tamanhos de efeito similares são rotineiramente aceitos como evidência suficiente em áreas como medicina preventiva e psicologia social.

Segundo Utts, os dados atendiam aos critérios que qualquer disciplina científica exigiria para considerar um efeito como real. Em sua análise publicada no Journal of Scientific Exploration em 1996, Utts argumentou que os resultados excediam significativamente o que seria esperado por acaso, que os efeitos eram replicáveis em diferentes laboratórios e com diferentes visualizadores experientes, e que os protocolos experimentais da SAIC — especificamente os estudos supervisionados por May — incorporavam controles rigorosos contra fraude e vazamento sensorial.

A afirmação mais contundente de Utts, e a que mais incomodou o establishment científico, foi sua comparação direta com outros campos aceitos. Utts argumentou que, se os mesmos critérios estatísticos aplicados a pesquisa médica fossem aplicados aos dados de visão remota, a conclusão seria de que o fenômeno existia. Segundo suas palavras, publicadas no relatório oficial: negar a evidência estatística equivaleria a negar o método estatístico em si — porque os mesmos procedimentos que validam tratamentos médicos e políticas públicas estavam validando a cognição anômala.

Ray Hyman e a anatomia da dúvida metódica

Ray Hyman era, em muitos aspectos, o contraponto perfeito para Jessica Utts. Psicólogo cognitivo na Universidade de Oregon, Hyman dedicou décadas à investigação de alegações paranormais e ao estudo de como vieses cognitivos — expectativa, confirmação, ancoragem — produzem ilusões de fenômenos inexistentes. Era membro do Committee for Skeptical Inquiry (CSI) e possuía reputação consolidada como o cético mais sofisticado e tecnicamente competente da comunidade científica americana. Ao contrário de céticos de divulgação popular, Hyman não descartava fenômenos com sarcasmo; desconstruía com precisão metodológica.

A crítica de Hyman ao Stargate não contestou diretamente os cálculos de Utts. Hyman não argumentou que Utts havia errado a matemática — um ponto frequentemente ignorado em relatos simplificados do embate. O que Hyman contestou foi a cadeia de inferências que conectava os números às conclusões. Segundo sua análise, também publicada no Journal of Scientific Exploration em 1996, os problemas residiam em camadas anteriores aos cálculos estatísticos.

Primeiro, Hyman apontou para o que chamou de file drawer problem — a possibilidade de que experimentos com resultados negativos tivessem sido sistematicamente não-publicados ou excluídos da base analisada por Utts, inflando artificialmente o tamanho de efeito aparente. Segundo Hyman, sem acesso ao universo completo de experimentos conduzidos ao longo de 23 anos, qualquer meta-análise era potencialmente enviesada na origem.

Segundo, Hyman questionou a consistência dos protocolos ao longo do tempo. O programa Stargate evoluiu de SCANATE (1972) para Grill Flame (1978), Center Lane (1983), Sun Streak (1985) e finalmente Stargate (1991). Cada transição envolveu mudanças de pessoal, metodologia e supervisão. Hyman argumentou que tratar dados coletados sob condições tão heterogêneas como um corpus unificado era metodologicamente problemático — equivalente a combinar ensaios clínicos com protocolos diferentes e declarar o resultado como uma única evidência.

Terceiro — e talvez mais significativo —, Hyman levantou a questão da replicação independente. Segundo sua análise, os resultados positivos concentravam-se em um número reduzido de visualizadores experientes (notadamente Joseph McMoneagle e Ingo Swann) e em laboratórios sob a direção de pesquisadores com vínculo emocional e profissional com o programa (Puthoff, Targ, May). Hyman argumentou que, para que os dados fossem convincentes, o efeito deveria ser demonstrável em laboratórios independentes, por pesquisadores sem afiliação ao programa, com visualizadores não treinados pelos mesmos protocolos — condição que, segundo ele, nunca foi plenamente satisfeita.

A posição de Hyman era, em essência, epistêmica: os dados poderiam ser estatisticamente significativos e, ainda assim, não constituir evidência suficiente para um fenômeno genuíno, porque as condições de produção desses dados estavam comprometidas por viés sistemático.

O paradoxo: mesmos dados, conclusões opostas

O confronto entre Utts e Hyman revela algo mais profundo do que uma discordância técnica entre dois acadêmicos. Revela como o enquadramento epistemológico — o conjunto de premissas que um cientista carrega antes de examinar os dados — pode determinar a conclusão tanto quanto os próprios dados.

Utts partiu de um quadro frequentista clássico: se os dados produzem valores de p abaixo do limiar convencional (p < 0,05), se os tamanhos de efeito são consistentes, e se há replicação em múltiplas séries, então o efeito é real até prova em contrário. Hyman partiu de um quadro bayesiano implícito: dado que a probabilidade prévia (prior) de que cognição anômala exista é extremamente baixa segundo o paradigma materialista vigente, a evidência estatística precisaria ser extraordinariamente robusta para superar essa improbabilidade a priori — e, segundo Hyman, os dados do Stargate não atingiam esse limiar.

Esse é o cerne do paradoxo. Utts e Hyman não discordavam fundamentalmente sobre o que os números diziam. Discordavam sobre o que os números significavam. E essa discordância é irreconciliável dentro dos marcos epistemológicos em que cada um opera, porque a questão de “quanta evidência é suficiente” não é uma pergunta estatística — é uma pergunta filosófica.

O relatório AIR, ao apresentar ambas as análises lado a lado, criou a aparência de equilíbrio. Porém, a recomendação final — encerrar o programa — alinhou-se exclusivamente com a interpretação de Hyman. A CIA não adotou uma posição intermediária (como recomendar pesquisa adicional para resolver as divergências). Adotou a conclusão mais conveniente politicamente: os efeitos laboratoriais, mesmo se reais, não se traduziam em inteligência operacional útil.

O que essa escolha institucional revela é que, em contextos onde ciência e política se intersectam, a questão determinante não é “o que os dados mostram?” — é “qual interpretação serve aos interesses da instituição que financia a pergunta?”

O que significa significância: estatística na fronteira da ciência

Para compreender por que o embate Utts-Hyman permanece irresolvido três décadas depois, é necessário entender o que a estatística pode — e não pode — fazer quando aplicada a fenômenos de fronteira.

A significância estatística, medida convencionalmente pelo valor de p (p-value), indica a probabilidade de que um resultado observado tenha ocorrido por acaso, assumindo que não existe efeito real. Quando p < 0,05, a convenção científica declara o resultado “significativo” — ou seja, improvável o suficiente sob a hipótese nula para justificar investigação adicional. Os dados do Stargate, segundo Utts, apresentaram valores de p consistentemente abaixo desse limiar, em alguns casos muito abaixo.

Porém, a significância estatística não equivale a significância prática. Um efeito pode ser estatisticamente real e, ao mesmo tempo, tão pequeno que não produz resultados úteis fora do laboratório. Os tamanhos de efeito reportados por Utts (d ≈ 0,2 a 0,385) são comparáveis, segundo ela, aos encontrados em estudos sobre a eficácia da aspirina na prevenção de infartos — um efeito aceito pela medicina como clinicamente relevante apesar de sua magnitude modesta. Hyman contestou essa analogia, argumentando que a aspirina opera dentro de mecanismos fisiológicos conhecidos, enquanto a visão remota carece de qualquer modelo causal plausível.

Há, ainda, o problema da replicação — a crise que assola a psicologia e outras ciências desde a década de 2010. Se os efeitos do Stargate eram reais, por que não foram robustamente replicados por laboratórios independentes? Defensores argumentam que a visão remota é dependente de habilidade individual (assim como talento musical) e que replicação com sujeitos aleatórios é inapropriada. Céticos respondem que qualquer fenômeno genuíno deve ser demonstrável de forma independente do talento do praticante — caso contrário, é indistinguível de desempenho por acaso em populações amplas.

O debate permanece sem resolução consensual. A parapsicologia produz meta-análises com efeitos estatisticamente significativos; o mainstream científico questiona as condições de produção desses dados. Nenhum dos lados convenceu o outro. E foi nessa zona cinzenta que a CIA encontrou espaço para encerrar o Stargate sem precisar responder à pergunta mais difícil: e se os efeitos forem reais?

“Os resultados dos experimentos de visão remota são suficientemente consistentes para que, se o fenômeno estivesse sob avaliação em qualquer outro contexto — por exemplo, a eficácia de uma droga ou a validade de um teste psicológico —, a conclusão seria de que o efeito foi estabelecido.”
— Jessica Utts, An Assessment of the Evidence for Psychic Functioning, Journal of Scientific Exploration, v. 10, n. 1, 1996.

Caixa de contexto: conceitos estatísticos essenciais para compreender o debate

Valor de p (p-value) — Probabilidade de observar um resultado tão extremo quanto o obtido, assumindo que o efeito investigado não existe (hipótese nula). Convenção: p < 0,05 = estatisticamente significativo. No Stargate, Utts reportou p-values consistentemente abaixo de 0,05 em múltiplas séries experimentais.

Tamanho de efeito (effect size) — Medida da magnitude de um fenômeno observado. A escala de Cohen classifica d = 0,2 como pequeno, d = 0,5 como moderado e d = 0,8 como grande. Os dados do Stargate apresentaram d ≈ 0,2 a 0,385, na faixa pequeno-moderado — comparável a efeitos aceitos em medicina e psicologia.

Problema da gaveta (file drawer problem) — Viés de publicação: estudos com resultados negativos tendem a não ser publicados, inflando a proporção aparente de resultados positivos na literatura. Hyman argumentou que o Stargate poderia estar contaminado por esse viés.

Prior bayesiano (probabilidade a priori) — A estimativa da probabilidade de um fenômeno ser real antes de examinar os dados. Se a probabilidade prévia é muito baixa (como céticos atribuem à cognição anômala), mesmo evidências estatisticamente significativas podem ser insuficientes para alterar a conclusão.

Replicação independente — Capacidade de reproduzir um resultado em condições controladas, por pesquisadores diferentes, em locais diferentes. Considerada o padrão-ouro da ciência empírica. A questão de se os efeitos do Stargate foram independentemente replicados permanece em disputa.

Conclusão: a pergunta que os números não respondem

O embate entre Jessica Utts e Ray Hyman não foi resolvido em 1995. Não foi resolvido nas publicações subsequentes de ambos. E não será resolvido enquanto a comunidade científica não confrontar uma questão que transcende a estatística: qual é o custo de investigar um fenômeno que, se confirmado, reescreve pressupostos fundamentais sobre a natureza da consciência humana?

Os dados do Stargate permanecem públicos, acessíveis e analisáveis. As conclusões de Utts nunca foram refutadas matematicamente — foram contornadas epistemologicamente. As críticas de Hyman nunca foram invalidadas logicamente — foram consideradas insuficientes por quem acreditava que os números falavam por si.

O que a CIA fez em 1995 foi essencialmente uma operação de enquadramento narrativo: apresentar o programa como cientificamente inconclusivo, politicamente inconveniente e operacionalmente dispensável. Essa narrativa prevaleceu não porque era a única leitura possível dos dados — mas porque era a mais útil para a instituição que a produziu.

Mas os números permanecem. E os números contam histórias que não dependem de quem está ouvindo.

No próximo episódio — “A Doutrina da Guerra Psíquica: O General Stubblebine e a Militarização do Paranormal” — saímos do laboratório e entramos no campo de batalha. Investigaremos como o Exército americano transformou pesquisa de fronteira em doutrina operacional, o papel do controverso General Albert Stubblebine no INSCOM, a influência do “Projeto Jedi” e do conceito First Earth Battalion — e como a visão remota deixou de ser experimento científico para se tornar ferramenta militar. A pergunta muda: não mais “os efeitos são reais?”, mas “o que acontece quando um general acredita que são?”

Referências

AMERICAN INSTITUTES FOR RESEARCH. An Evaluation of Remote Viewing: Research and Applications. Relatório final para a Central Intelligence Agency, 1995. Disponível em: irp.fas.org/program/collect/air1995.pdf. Acesso em: jun. 2026.
UNIVERSITY OF CALIFORNIA, DAVIS. Department of Statistics. Faculty Profile: Jessica Utts. Disponível em: stat.ucdavis.edu. Acesso em: jun. 2026.
UTTS, J. M. “An Assessment of the Evidence for Psychic Functioning”. Journal of Scientific Exploration, v. 10, n. 1, p. 3-30, 1996.
UTTS, J. M. “An Assessment of the Evidence for Psychic Functioning”. Journal of Scientific Exploration, v. 10, n. 1, p. 3-30, 1996. (Seção sobre replicabilidade e comparação com outros campos).
UTTS, J. M. “Replication and Meta-Analysis in Parapsychology”. Statistical Science, v. 6, n. 4, p. 363-403, 1991.
HYMAN, R. The Elusive Quarry: A Scientific Appraisal of Psychical Research. Buffalo: Prometheus Books, 1989.
HYMAN, R. “Evaluation of a Program on Anomalous Mental Phenomena”. Journal of Scientific Exploration, v. 10, n. 1, p. 31-58, 1996.
HYMAN, R. “Evaluation of a Program on Anomalous Mental Phenomena”. Journal of Scientific Exploration, v. 10, n. 1, p. 31-58, 1996. (Seção sobre viés de publicação e file drawer problem).
HYMAN, R. “Evaluation of a Program on Anomalous Mental Phenomena”. Journal of Scientific Exploration, v. 10, n. 1, p. 31-58, 1996. (Seção sobre heterogeneidade de protocolos).
HYMAN, R. “Evaluation of a Program on Anomalous Mental Phenomena”. Journal of Scientific Exploration, v. 10, n. 1, p. 31-58, 1996. (Seção sobre replicação independente).
UTTS, J. M.; HYMAN, R. “Reply and Counter-Reply”. Journal of Scientific Exploration, v. 10, n. 1, p. 59-78, 1996.
UNITED STATES CENTRAL INTELLIGENCE AGENCY. Statement on the Stargate Program, 1995. Disponível em: cia.gov/readingroom/collection/stargate.
MAY, E. C.; UTTS, J. M.; SPOTTISWOODE, S. J. P. “Decision Augmentation Theory: Applications to the Random Number Generator Experiments”. Journal of Scientific Exploration, v. 9, n. 4, p. 453-488, 1995.
UTTS, J. M. “An Assessment of the Evidence for Psychic Functioning”. Journal of Scientific Exploration, v. 10, n. 1, p. 3-30, 1996. (Comparação explícita com estudos sobre aspirina e prevenção cardiovascular).
HYMAN, R. “The Ganzfeld Psi Experiment: A Critical Appraisal”. Journal of Parapsychology, v. 49, p. 3-49, 1985.

ArcaVox · 10 de junho de 2026

Continuar lendo

Outros episódios — Projeto Stargate — Os Arquivos da Visão Remota

Projeto Stargate

Projeto Stargate: os sucessos que a CIA enterrou

Episódio 1 da série especial sobre o Projeto Stargate. Em 1995, a CIA desclassificou 23 anos de operações de visão remota e chamou o programa de fracasso. Os documentos contam outra história: avião soviético, submarino, mísseis SCUD, Yongby

R.A.A. · 09 de junho de 2026 · 9 min

Projeto Stargate

Projeto Stargate: General Stubblebine e a doutrina da guerra psíquica

Ep. 3 da série especial: como um general de duas estrelas do Exército americano tentou transformar a visão remota em doutrina militar — paredes, cabras e os ‘Guerreiros Jedi’ do INSCOM.

R.A.A. · 15 de junho de 2026 · 15 min

Projeto Stargate

Projeto Stargate: Cientologia, Ingo Swann e as conexões ocultas

Ep. 4 da série especial: Swann, Puthoff e Price eram cientologistas. Em 1973, Swann publicou em Praga um paper ligando técnicas da Cientologia à exploração psíquica. O que os documentos provam — e o que permanece inferência.

R.A.A. · 20 de junho de 2026 · 20 min