Literatura gris emergiendo de las sombras gracias a una búsqueda dirigida
Blog

Literatura gris en revisiones sistemáticas: cómo buscarla

Por qué incluir literatura gris reduce el sesgo de publicación y cómo buscarla en repositorios LATAM (BDTD, Cybertesis, La Referencia) y globales (OpenGrey, OSF, medRxiv).

By Equipo SynthIA12 min de lectura
literatura grisgrey literaturetesis no publicadaspreprints

Puntos clave

  • La literatura gris es toda producción científica que no se publica por canales comerciales tradicionales: tesis, informes técnicos, actas de congresos, preprints, registros de ensayos y documentos institucionales.
  • Su inclusión en una revisión sistemática reduce el sesgo de publicación, que tiende a sobreestimar los efectos positivos y subestimar los nulos o negativos.
  • LATAM y España tienen una infraestructura de repositorios institucionales y bibliográficos abiertos importante: BDTD Brasil, Cybertesis Chile y Perú, TESEO España, La Referencia, RedCLARA.
  • Globalmente, OpenGrey, ProQuest Dissertations, OSF Preprints, medRxiv y bioRxiv cubren la mayor parte del corpus de tesis doctorales, informes técnicos y preprints disponibles.
  • PRISMA 2020 ítem 7 exige declarar las fuentes consultadas y las estrategias usadas; documentar la búsqueda gris correctamente es lo que distingue una revisión rigurosa de una revisión incompleta.

Por qué la literatura gris importa

La literatura científica publicada en revistas indexadas no representa todo lo que se investiga: representa lo que se decide publicar. Los estudios con resultados positivos, estadísticamente significativos y con narrativas claras tienen probabilidades sistemáticamente mayores de ser publicados en revistas con factor de impacto que los estudios con resultados nulos, negativos o con conclusiones más matizadas. Este fenómeno se llama sesgo de publicación, y su consecuencia operativa es que una revisión sistemática que solo busca en bases bibliográficas comerciales tiende a sobreestimar la magnitud de los efectos.

La literatura gris atenúa este sesgo. Las tesis doctorales, los informes técnicos de gobierno, las actas de congresos y los preprints incluyen una proporción significativamente mayor de resultados nulos o no significativos. Incluirlos en la búsqueda exhaustiva acerca la síntesis a la realidad subyacente.

Qué se entiende por literatura gris

La definición operativa más usada proviene de la Conferencia Internacional sobre Literatura Gris de Nueva York (1997, revisada en Praga 2004): "literatura producida en todos los niveles de gobierno, academia, negocios e industria, en formato impreso y electrónico, pero que no es controlada por los editores comerciales". La frase clave es "no controlada por los editores comerciales": no hay un proceso de revisión por pares centralizado y la circulación es más limitada.

Categorías principales de literatura gris relevantes para revisiones sistemáticas:

  • Tesis doctorales y de maestría, especialmente las no publicadas como artículos posteriores.
  • Informes técnicos de organismos gubernamentales, agencias internacionales y centros de investigación.
  • Actas de congresos y resúmenes ampliados de comunicaciones científicas.
  • Preprints, manuscritos publicados antes de revisión por pares en repositorios abiertos.
  • Registros de ensayos clínicos, especialmente ensayos completados pero no publicados.
  • Documentos de política pública y guías de práctica clínica.
  • Comunicaciones y resúmenes en sociedades científicas.
  • Working papers de centros de investigación económica y social.

El problema del sesgo de publicación cuantificado

La magnitud del sesgo de publicación se ha estudiado durante décadas. Algunos datos consolidados de la literatura metodológica:

  • Estudios con resultados significativos tienen entre 2 y 3 veces más probabilidades de ser publicados que estudios con resultados no significativos.
  • El tiempo desde la finalización del estudio hasta la publicación es aproximadamente 1 a 2 años mayor para resultados no significativos.
  • Hasta el 40 por ciento de los ensayos clínicos registrados nunca se publican en revistas indexadas, y la proporción es mayor para ensayos con financiamiento privado.
  • Las tesis doctorales suelen contener al menos un capítulo con resultados que no llegan a publicarse como artículo independiente.

Incluir literatura gris en una revisión sistemática no elimina el sesgo de publicación pero lo reduce. Si la búsqueda gris se documenta correctamente, los revisores y lectores pueden evaluar qué tan probable es que el sesgo residual haya influido en las conclusiones. Esto se complementa con técnicas estadísticas como el funnel plot y el test de Egger para detección de asimetría en meta-análisis.

Para situar la búsqueda gris en el flujo completo de la revisión, conviene revisar la estrategia de búsqueda para revisión sistemática, que cubre el diseño de cadenas booleanas, sinónimos y bloques temáticos aplicables también a las fuentes grises.


Repositorios LATAM y España

América Latina y España tienen una infraestructura de repositorios académicos abiertos que en muchas áreas supera a la de regiones de mayor producción comercial. Conocer estos repositorios es indispensable para una revisión rigurosa en temas regionales o multilingües.

La Referencia

La Referencia es una red federada de repositorios institucionales de nueve países latinoamericanos. Indexa más de 4 millones de documentos provenientes de tesis, artículos, informes y actas. Es el punto de entrada más eficiente para una búsqueda gris en LATAM porque agrega los repositorios institucionales nacionales en una interfaz única. URL: lareferencia.info.

BDTD (Biblioteca Digital Brasileira de Teses e Dissertações)

BDTD agrega las tesis de maestría y doctorado de las principales universidades brasileñas. Brasil produce más tesis doctorales que cualquier otro país de LATAM (más de 25 mil al año), y BDTD es el repositorio central. Para revisiones que incluyen literatura en portugués o que cubren temas con producción importante en Brasil (salud pública, ciencias agrarias, ciencias sociales), BDTD es obligatorio. URL: bdtd.ibict.br.

Cybertesis Chile y Cybertesis Perú

Las redes Cybertesis agregan tesis de universidades chilenas y peruanas respectivamente. Cybertesis Chile cubre Universidad de Chile, Pontificia Universidad Católica de Chile y otras universidades principales. Cybertesis Perú agrega Universidad Mayor de San Marcos, UPCH y otras. Para revisiones en temas regionales o con foco geográfico, son fuentes obligatorias.

TESEO (España)

TESEO es la base de datos oficial de tesis doctorales defendidas en universidades españolas, gestionada por el Ministerio de Universidades. Indexa todas las tesis doctorales españolas desde 1976. Es la fuente más exhaustiva para producción doctoral en España. URL: teseo.mecd.es.

Otros repositorios institucionales relevantes

  • SciELO — aunque indexa principalmente revistas, incluye colecciones nacionales con artículos no necesariamente indexados en bases internacionales.
  • RedALyC — red de revistas científicas de América Latina, Caribe, España y Portugal.
  • Dialnet — portal de difusión de la producción científica hispana, fuerte en ciencias sociales y humanidades.
  • RedCLARA — red latinoamericana de redes académicas avanzadas, agrega varios repositorios técnicos.
  • Repositorios universitarios individuales — la mayoría de las universidades de LATAM y España tienen repositorios institucionales DSpace o similares.

Tabla resumen de repositorios LATAM/España

RepositorioCoberturaTipo de contenidoIdiomasBúsqueda
La ReferenciaRegional (9 países)Tesis, artículos, informesEspañol, portuguésWeb, OAI-PMH
BDTDBrasilTesis doctorales y maestríaPortuguésWeb, OAI-PMH
Cybertesis ChileChileTesisEspañolWeb
Cybertesis PerúPerúTesisEspañolWeb
TESEOEspañaTesis doctoralesEspañol, catalán, otrosWeb
SciELORegionalArtículos en revistas indexadasEspañol, portugués, inglésWeb, API
RedALyCIberoaméricaArtículos científicosEspañol, portugués, inglésWeb
DialnetEspaña, IberoaméricaArtículos, tesis, librosEspañolWeb

Repositorios globales

A la infraestructura regional se suman repositorios globales que cubren la producción científica internacional en literatura gris.

ProQuest Dissertations and Theses Global

ProQuest Dissertations indexa más de 5 millones de tesis doctorales y de maestría a nivel global, con cobertura fuerte en Estados Unidos, Reino Unido, Canadá y Australia. Es la base más completa de tesis a nivel internacional, pero requiere suscripción institucional (la mayoría de las universidades grandes tienen acceso). El subconjunto Open Access es accesible sin suscripción.

OpenGrey (cerrado, pero archivo accesible)

OpenGrey fue durante años el repositorio europeo de literatura gris, gestionado por INIST-CNRS. Cerró su operación activa en 2020, pero su archivo histórico (1980-2020) sigue siendo accesible y útil para revisiones que cubren periodos previos. Cubre informes técnicos, tesis y actas de congresos europeos.

OSF Preprints y servicios de preprints especializados

Open Science Framework (OSF) agrega múltiples servicios de preprints: PsyArXiv (psicología), SocArXiv (ciencias sociales), AfricArXiv, INA-Rxiv (Indonesia) y muchos otros. Para temas multidisciplinares, OSF es el punto de entrada más eficiente.

Repositorios de preprints especializados de alto uso:

  • medRxiv — preprints en ciencias de la salud y medicina clínica.
  • bioRxiv — preprints en biología y ciencias de la vida.
  • arXiv — preprints en física, matemáticas, computación, economía cuantitativa.
  • SSRN — preprints en economía, derecho, ciencias sociales aplicadas.
  • ChemRxiv — preprints en química.
  • EarthArXiv — preprints en ciencias de la Tierra.

Registros de ensayos clínicos

Los registros de ensayos son una fuente crítica de literatura gris en revisiones de efectividad clínica. Cubren ensayos en curso, completados y cancelados, muchos de los cuales nunca llegan a publicación.

  • ClinicalTrials.gov — registro estadounidense, el más grande globalmente.
  • EU Clinical Trials Register — registro europeo de ensayos.
  • WHO International Clinical Trials Registry Platform (ICTRP) — meta-registro que agrega registros nacionales de todo el mundo.
  • REBEC — registro brasileño de ensayos clínicos.
  • ReeC (Chile), REPEC (Perú) — registros nacionales latinoamericanos.

Repositorios de informes técnicos y organismos internacionales

  • WHO IRIS — repositorio institucional de la Organización Mundial de la Salud.
  • PAHO IRIS — repositorio de la Organización Panamericana de la Salud (importante para temas LATAM).
  • World Bank Open Knowledge Repository — informes técnicos del Banco Mundial.
  • OECD iLibrary — publicaciones e informes de la OCDE.
  • CEPAL repositorio digital — publicaciones de la Comisión Económica para América Latina.

Tabla resumen de repositorios globales

RepositorioCoberturaTipo de contenidoAcceso
ProQuest DissertationsGlobal, fuerte en NorteaméricaTesis doctorales y maestríaSuscripción, subset OA
OpenGrey (archivo)Europa, 1980-2020Informes, tesis, actasAbierto
OSF PreprintsMultidisciplinar globalPreprints en muchas áreasAbierto
medRxivSalud y medicina clínicaPreprintsAbierto
bioRxivBiología y ciencias de la vidaPreprintsAbierto
arXivFísica, matemáticas, computaciónPreprintsAbierto
SSRNEconomía, derecho, ciencias socialesPreprintsAbierto
ClinicalTrials.govEnsayos clínicos globalesRegistros y resultadosAbierto
WHO ICTRPEnsayos clínicos globalesMeta-registroAbierto

Las bases bibliográficas tradicionales también merecen una comparación específica para revisiones sistemáticas: la diferencia entre OpenAlex y PubMed influye en qué proporción de literatura gris ya está indexada en el corpus principal y qué proporción requiere búsqueda específica en repositorios.


Cómo diseñar la búsqueda gris

La búsqueda gris exige un diseño distinto al de la búsqueda en bases bibliográficas tradicionales. Las plataformas grises suelen tener motores de búsqueda menos sofisticados, sin soporte completo para sintaxis booleana avanzada ni descriptores controlados. Algunas recomendaciones prácticas.

Paso 1 — Adaptar la estrategia booleana

La estrategia de búsqueda diseñada para MEDLINE o Embase suele ser demasiado compleja para repositorios grises. Conviene simplificarla a los dos o tres bloques temáticos más importantes con sinónimos clave, sin operadores anidados profundos.

Paso 2 — Buscar en idioma local

Las tesis y los informes técnicos están en el idioma local. Para repositorios LATAM y españoles, hay que adaptar los términos al español y, cuando aplique, al portugués. La traducción no es directa: hay que considerar variantes regionales (por ejemplo, "diabetes mellitus" funciona pero "azúcar alta" no).

Paso 3 — Documentar fecha de consulta

Los repositorios grises pueden cambiar entre consultas. PRISMA 2020 ítem 7 exige declarar la fecha de cada búsqueda. Como las bases pueden actualizarse y reorganizarse, la fecha precisa de consulta es crítica para la reproducibilidad.

Paso 4 — Capturar los resultados

A diferencia de PubMed, donde es trivial exportar miles de registros, los repositorios grises a menudo no permiten exportación masiva. Hay que documentar manualmente los resultados, capturar pantallas si es necesario y mantener un log estructurado de cada búsqueda con: repositorio, cadena de búsqueda, número de resultados, fecha, decisiones de inclusión preliminares.

Paso 5 — Búsqueda complementaria por citación

Una práctica útil en literatura gris es el snowballing: revisar las listas de referencias de las tesis y los informes incluidos para identificar más documentos grises. Los autores de tesis suelen citar otras tesis y informes técnicos no indexados en bases comerciales.

Paso 6 — Contacto directo con autores

En temas con producción gris importante, contactar directamente a autores clave del campo para preguntarles si tienen estudios no publicados, tesis dirigidas o informes recientes puede revelar literatura que ningún repositorio indexa. Esta práctica es laboriosa pero metodológicamente valiosa.


Cómo documentar la búsqueda gris según PRISMA 2020

El ítem 7 de PRISMA 2020 exige declarar todas las fuentes de información consultadas y la fecha de la última búsqueda. Los ítems 8 y 9 cubren la estrategia de búsqueda completa y los procesos automatizados u manuales usados para identificar estudios relevantes. Aplicado a literatura gris, esto implica documentar al menos:

ElementoContenido
Repositorios consultadosListado completo con URL y fecha
Estrategia de búsquedaCadena o cadenas usadas en cada repositorio
Idiomas consideradosJustificación de idiomas incluidos y excluidos
Número de registros recuperadosPor repositorio y total
Búsqueda manualTipos de búsqueda manual (snowballing, contacto con autores)
LimitacionesRepositorios consultados con limitaciones (búsqueda limitada, exportación parcial)

Esta documentación suele incluirse en un apéndice del manuscrito, no en el cuerpo principal. El cuerpo principal describe el método de forma resumida y remite al apéndice para los detalles operativos.

Plantilla mínima de log de búsqueda gris

RepositorioURLCadena de búsquedaFiltrosFechaResultadosIncluidos preliminares
La Referencialareferencia.info"salud digital" AND "Chile"tesis, 2018-20252026-03-15478
BDTDbdtd.ibict.br"telessaúde"doctorado, todos los años2026-03-1513422
TESEOteseo.mecd.es"telesalud" OR "telemedicina"todos2026-03-168114
OSF Preprintsosf.io/preprints"digital health" AND "Latin America"sin filtro2026-03-17235

Errores frecuentes en búsqueda gris

No declarar la búsqueda gris en el manuscrito. Muchos manuscritos mencionan "se consultó literatura gris" sin especificar qué repositorios. PRISMA 2020 exige declarar las fuentes específicas.

Buscar solo en inglés en repositorios LATAM. Los términos en inglés no recuperan tesis en español o portugués. La búsqueda en repositorios regionales debe adaptar el idioma.

Confundir preprint con publicación final. Si un estudio inicialmente publicado como preprint termina apareciendo en una revista indexada, hay que decidir cuál versión se incluye en la revisión y declarar la decisión.

No actualizar las búsquedas grises. Cuando se actualiza la búsqueda en bases bibliográficas tradicionales antes de la publicación, hay que actualizar también las búsquedas grises. Es una de las partes más frecuentemente omitidas.

Ignorar registros de ensayos clínicos. En revisiones de efectividad clínica, omitir ClinicalTrials.gov y WHO ICTRP es una omisión importante: muchos ensayos completados pero no publicados están en los registros.

Asumir cobertura completa de OpenAlex. Aunque OpenAlex indexa preprints y algunos informes, no cubre todos los repositorios institucionales LATAM. La búsqueda directa en BDTD, Cybertesis y TESEO sigue siendo necesaria.


Cuánta literatura gris debe incluirse

No hay una proporción objetivo. Lo que debe declararse es el esfuerzo realizado y el resultado obtenido. Un patrón típico en revisiones bien hechas en temas de salud o ciencias sociales con producción regional importante:

Tipo de fuenteProporción típica de incluidos
Bases bibliográficas tradicionales70 a 85 por ciento
Tesis y disertaciones5 a 15 por ciento
Informes técnicos y de organismos2 a 8 por ciento
Preprints2 a 10 por ciento
Actas de congresos1 a 5 por ciento
Registros de ensayos1 a 5 por ciento

Cuando la literatura gris es una proporción muy alta (más del 30 por ciento), suele ser un signo de que el campo es emergente o tiene barreras estructurales para publicación tradicional, y conviene comentarlo en la discusión.

Cuando la literatura gris es muy baja (menos del 3 por ciento), conviene preguntarse si la búsqueda gris fue suficientemente exhaustiva o si la decisión de excluir resultados grises fue justificada.


Keep reading

More blog articles

Literatura gris en revisiones sistemáticas: cómo buscarla | Blog SynthIA