Puntos clave
- Ninguna base de datos cubre la totalidad de la literatura científica: Cochrane recomienda buscar en al menos dos fuentes para cualquier revisión sistemática.
- PubMed es la referencia en biomedicina y ofrece el vocabulario controlado MeSH, pero no cubre literatura de ciencias sociales, educación ni ingeniería de forma suficiente.
- OpenAlex indexa más de 250 millones de obras académicas de todas las disciplinas, es completamente gratuito y tiene una API que permite integración directa en flujos de trabajo de revisión.
- Scopus y Web of Science ofrecen métricas bibliométricas superiores y cobertura curada, pero su coste puede ser prohibitivo para investigadores sin acceso institucional.
- La estrategia óptima depende de la disciplina, la pregunta de investigación y los recursos disponibles: no existe una única combinación correcta para todas las revisiones.
El problema de la base de datos única: por qué la cobertura importa
Uno de los errores más frecuentes en revisiones sistemáticas noveles es buscar únicamente en una base de datos —generalmente PubMed— y presentar los resultados como si fueran representativos de toda la literatura disponible. Este error no es solo metodológico: tiene consecuencias directas en las conclusiones de la revisión, porque los estudios que no se encuentran no pueden incluirse, y los estudios perdidos no son una muestra aleatoria de la literatura: tienen características sistemáticas.
Las bases de datos académicas no son repositorios universales. Cada una tiene su propio proceso de indexación, sus propias prioridades disciplinarias y sus propios criterios de inclusión de revistas. Una base de datos que indexa 35 millones de artículos no contiene los mismos 35 millones que otra base de datos de tamaño similar: los solapamientos son parciales y los estudios exclusivos de cada fuente pueden ser precisamente los más relevantes para tu revisión.
Sesgo de cobertura y estudios perdidos
El sesgo de cobertura ocurre cuando la muestra de estudios incluida en la revisión no es representativa de todos los estudios realizados sobre el tema. Este sesgo puede operar en varias dimensiones: sesgo de idioma (los estudios en inglés se encuentran más fácilmente), sesgo de acceso abierto (los estudios con acceso libre son más visibles en algunas bases de datos), sesgo disciplinario (una base de datos centrada en biomedicina perderá estudios relevantes publicados en revistas de ciencias sociales o enfermería) y sesgo de novedad (los estudios muy recientes pueden no estar aún indexados con todos sus metadatos).
El impacto del sesgo de cobertura varía según el tema. Para una pregunta muy específica en farmacología clínica, la búsqueda en PubMed y Embase puede ser suficiente porque la literatura relevante está altamente concentrada en esas bases de datos. Para una pregunta sobre factores sociales determinantes de una condición de salud, la misma estrategia dejará fuera estudios clave publicados en revistas de sociología, trabajo social o ciencias de la educación que no están indexadas en las bases de datos biomédicas.
Las recomendaciones de Cochrane sobre fuentes múltiples
El manual Cochrane (training.cochrane.org/handbook/current/chapter-04) establece que las revisiones sistemáticas deben buscar en múltiples fuentes para minimizar el sesgo de cobertura. La recomendación mínima para revisiones Cochrane es buscar en MEDLINE, Embase y el Registro Central Cochrane de Ensayos Controlados (CENTRAL), más las bases de datos específicas de la disciplina cuando corresponda. Para disciplinas con literatura dispersa, se recomiendan adicionalmente búsquedas manuales en revistas clave, registros de ensayos y literatura gris.
Esta recomendación de fuentes múltiples tiene una consecuencia práctica importante: el volumen total de registros a cribar se multiplica, especialmente cuando las bases de datos tienen bajo solapamiento. Un metaestudio publicado en Research Synthesis Methods (doi.org/10.1002/jrsm.1237) documentó que el solapamiento entre PubMed y Embase varía entre el 30 % y el 60 % según la disciplina, lo que significa que entre el 40 % y el 70 % de los registros de cada base de datos son exclusivos de esa fuente.
PubMed / MEDLINE: fortalezas y límites
PubMed es el motor de búsqueda de acceso público que da acceso a MEDLINE, la base de datos de la Biblioteca Nacional de Medicina de Estados Unidos (NLM). Es la referencia en biomedicina y ciencias de la salud, con acceso completamente gratuito y una interfaz de búsqueda avanzada que permite usar el vocabulario controlado MeSH.
Qué cubre PubMed
MEDLINE indexa más de 36 millones de citas de artículos de más de 5.200 revistas biomédicas en todo el mundo. La cobertura es especialmente sólida en medicina clínica, farmacología, enfermería, odontología, medicina veterinaria, salud pública y ciencias básicas relacionadas con la salud. La mayoría de los artículos se indexan con un desfase de uno a tres meses desde la publicación, y existe un componente "In-Process" que permite acceder a artículos recientes que aún no tienen todos sus metadatos MeSH asignados.
PubMed también ofrece acceso a PubMed Central (PMC), el repositorio de acceso abierto de artículos de texto completo. Esta distinción es importante: PubMed contiene citas bibliográficas (metadatos) de todos los artículos indexados, mientras que PMC ofrece texto completo solo de los artículos publicados en acceso abierto o de los autores que han depositado su artículo.
Los términos MeSH: ventaja y limitación
Los Medical Subject Headings (MeSH) son el vocabulario controlado que la NLM asigna a cada artículo indexado en MEDLINE. Un artículo sobre "myocardial infarction" recibirá el término MeSH correspondiente independientemente de que el autor lo haya llamado "heart attack", "cardiac infarction" o "MI" en el texto. Esto hace que las búsquedas MeSH capturen estudios con terminología variada sin necesidad de listar todos los sinónimos posibles.
Sin embargo, los términos MeSH tienen dos limitaciones importantes. Primero, su asignación tarda entre seis y doce meses desde la publicación del artículo, lo que significa que los artículos más recientes no están cubiertos por las búsquedas MeSH y deben buscarse complementariamente con términos libres. Segundo, los MeSH están organizados jerárquicamente y la expansión automática puede ser demasiado amplia para algunos términos, captando artículos que no son relevantes para la pregunta específica.
Limitaciones de PubMed para revisiones multidisciplinarias
PubMed tiene cobertura limitada en ciencias sociales, educación, psicología (donde PsycINFO es preferible), economía de la salud, ingeniería biomédica e informática. Para revisiones sobre temas que cruzan la biomedicina con disciplinas sociales —como intervenciones comunitarias, salud pública de base poblacional o tecnologías digitales en salud— PubMed solo captura la fracción biomédica de la literatura y puede perder estudios igualmente relevantes publicados en revistas de otras disciplinas.
También carece de cobertura de literatura gris (informes técnicos, tesis doctorales, informes de agencias gubernamentales) que en muchas revisiones sistemáticas contiene evidencia importante, especialmente estudios con resultados negativos que no llegaron a publicarse en revistas peer-reviewed.
OpenAlex: el índice académico abierto que está cambiando la investigación
OpenAlex es una base de datos de literatura científica de acceso completamente abierto, desarrollada como sucesora del proyecto Microsoft Academic Graph. Fue lanzada en 2022 por OurResearch, una organización sin fines de lucro dedicada a la ciencia abierta, y se describe a sí misma como "el grafo del conocimiento académico más grande del mundo". Más información en openalex.org/about.
Origen y cobertura (250M+ obras)
OpenAlex indexa más de 250 millones de obras académicas, incluyendo artículos de revistas, libros, capítulos, actas de congresos, preprints, tesis y disertaciones. Esta cobertura supera en tamaño a cualquier base de datos de pago y abarca todas las disciplinas académicas sin excepción: ciencias naturales, ciencias sociales, humanidades, ciencias de la salud, ingeniería y arte.
La cobertura histórica de OpenAlex se extiende hasta el siglo XVII para algunas publicaciones históricas digitalizadas, aunque la cobertura sistemática y confiable comienza aproximadamente en la década de 1960 para la mayoría de las disciplinas. Para publicaciones recientes, el desfase de indexación es mínimo: la mayoría de los artículos aparecen en OpenAlex en días o semanas desde su publicación, mucho más rápido que en PubMed para artículos sin DOI previo.
Ventajas: gratuito, API, todas las disciplinas
La principal ventaja de OpenAlex para revisiones sistemáticas es el acceso completamente gratuito sin restricciones. No requiere suscripción institucional, no tiene límite de descargas y su API (interfaz de programación de aplicaciones) permite acceder a los datos de forma programática para integrarlos directamente en flujos de trabajo automatizados.
La API de OpenAlex permite filtrar por campo disciplinario (concept), año de publicación, tipo de obra, institución, país, acceso abierto y muchas otras dimensiones. Esto facilita construir estrategias de búsqueda más precisas que las que permiten las interfaces web de muchas bases de datos de pago. La cobertura multidisciplinaria hace que OpenAlex sea especialmente valioso para revisiones que cruzan varias disciplinas o que buscan literatura en ciencias sociales, educación y áreas a menudo subrepresentadas en las bases de datos biomédicas tradicionales.
Limitaciones a considerar
OpenAlex tiene limitaciones que es importante conocer antes de usarlo como fuente única. La asignación de "concepts" (categorías temáticas) es algorítmica y puede ser imprecisa para términos especializados o emergentes: un artículo sobre "aprendizaje automático en diagnóstico clínico" puede clasificarse bajo "informática" o bajo "medicina" de forma inconsistente. Esto afecta a las búsquedas por concepto pero no a las búsquedas por texto libre.
La calidad del dato de texto completo es variable: OpenAlex enlaza a las fuentes de texto completo cuando están disponibles, pero no garantiza acceso al texto completo de todos los artículos. Para el cribado a texto completo en la fase de elegibilidad, seguirás necesitando acceso institucional o solicitar artículos a los autores.
Scopus y Web of Science: ¿cuándo justifican su coste?
Scopus (Elsevier) y Web of Science (Clarivate) son las dos grandes bases de datos de pago con cobertura multidisciplinaria y herramientas bibliométricas avanzadas. Scopus indexa más de 25.000 revistas y Web of Science más de 21.000, ambas con procesos de selección de revistas más curados que OpenAlex.
La principal ventaja de estas bases de datos sobre OpenAlex no es la cobertura bruta —que OpenAlex supera ampliamente— sino la calidad del proceso de curación: las revistas incluidas en Scopus y Web of Science han pasado un proceso de evaluación editorial, lo que puede ser relevante para revisiones donde la calidad de la fuente es un criterio de elegibilidad. Las herramientas de análisis bibliométrico (Factor de impacto, índice h, visualizaciones de cocitación) son también superiores en estas plataformas.
El coste, sin embargo, es significativo. La suscripción institucional a Scopus o Web of Science puede superar los 50.000 dólares anuales para universidades medianas. Para investigadores en instituciones sin acceso o en países con recursos limitados, estas bases de datos simplemente no son una opción viable, lo que hace de OpenAlex una alternativa de valor incalculable para democratizar el acceso a la síntesis de evidencia.
Tabla comparativa: OpenAlex vs PubMed vs Scopus vs Web of Science
| Dimensión | OpenAlex | PubMed/MEDLINE | Scopus | Web of Science |
|---|---|---|---|---|
| Coste | Gratuito | Gratuito | Pago (institucional) | Pago (institucional) |
| Cobertura total | 250M+ obras | 36M citas | 25.000+ revistas | 21.000+ revistas |
| Disciplinas | Todas | Biomedicina y salud | Multidisciplinaria | Multidisciplinaria |
| Vocabulario controlado | No (concepts algorítmicos) | Sí (MeSH) | No | No |
| API gratuita | Sí, completa | Sí (E-utilities) | No (requiere licencia) | No (requiere licencia) |
| Literatura gris | Parcial (preprints) | No | No | No |
| Cobertura histórica | Desde ~1960 (sistemática) | Desde 1966 | Desde 1996 | Variable por colección |
| Acceso abierto integrado | Sí, etiquetado | Parcial (PMC) | Parcial | Parcial |
| Herramientas bibliométricas | Básicas | Básicas | Avanzadas | Avanzadas |
| Desfase de indexación | Días/semanas | 1-3 meses | Variable | Variable |
| Integración con herramientas | API excelente | Sí (PubMed API) | Limitada | Limitada |
Estrategia recomendada por tipo de revisión
Revisión en biomedicina o salud clínica
Para revisiones en medicina clínica, farmacología, cirugía o especialidades médicas, la combinación recomendada es PubMed (con términos MeSH y términos libres) más Embase (especialmente si la pregunta incluye farmacología o medicina europea), complementada con el Registro Central Cochrane si se buscan ensayos. OpenAlex puede añadirse para capturar preprints recientes y literatura no indexada en las bases biomédicas tradicionales.
Si no tienes acceso a Embase, OpenAlex es una alternativa válida para complementar PubMed, especialmente en las áreas donde Embase tiene cobertura adicional (farmacología, congresos médicos europeos).
Revisión en ciencias sociales o educación
Para revisiones en educación, psicología, trabajo social o ciencias de la comunicación, la combinación más efectiva incluye OpenAlex (por su cobertura multidisciplinaria), PsycINFO para psicología (si tienes acceso) y ERIC para educación (gratuito). PubMed en este contexto tiene valor limitado salvo que la pregunta tenga una dimensión de salud mental clínica.
Revisión multidisciplinaria
Para revisiones que cruzan varias disciplinas —como tecnologías digitales en salud, determinantes sociales de la salud o intervenciones educativas con outcomes de salud— OpenAlex es la fuente más eficiente porque indexa todas las disciplinas relevantes en una sola búsqueda. El complemento natural es PubMed para asegurar la cobertura biomédica con la profundidad que OpenAlex no garantiza para esa área específica.
Revisión con recursos limitados
Para investigadores sin acceso institucional a bases de datos de pago, la combinación OpenAlex más PubMed cubre la mayoría de las necesidades con cero coste. OpenAlex en particular ha democratizado el acceso a la síntesis de evidencia para grupos de investigación en países de ingresos medios y bajos, donde el coste de las bases de datos de pago es una barrera real para la producción científica de calidad.
Cómo integrar OpenAlex directamente en tu flujo de revisión sistemática
La integración de OpenAlex en el flujo de revisión va más allá de usarlo como una base de datos adicional donde ejecutas búsquedas manualmente. La API de OpenAlex permite conectar directamente la búsqueda con las herramientas de cribado, eliminando los pasos de exportación e importación de registros que en las bases de datos tradicionales son fuente frecuente de errores.
El flujo manual sin integración requiere: ejecutar la búsqueda, exportar los resultados en formato RIS o BibTeX, importar el archivo en la herramienta de cribado, verificar que ningún registro se perdió en la exportación y repetir el proceso por cada base de datos. Cada paso de exportación/importación introduce el riesgo de pérdida de registros, especialmente con volúmenes grandes. Para entender el proceso de búsqueda dentro de una revisión sistemática con PRISMA 2020 y cómo se conecta con el cribado, consulta la guía completa del proceso.
Construcción de la cadena de búsqueda en OpenAlex vs PubMed
La cadena de búsqueda para OpenAlex y PubMed tiene la misma estructura lógica —combinación de grupos de sinónimos con operadores booleanos— pero diferencias técnicas importantes en la implementación.
En PubMed, cada término puede buscarse como MeSH (con el sufijo [MeSH Terms]) o como texto libre en título y resumen (con [Title/Abstract]). La cadena típica combina ambos: (término MeSH OR "sinónimo 1"[Title/Abstract] OR "sinónimo 2"[Title/Abstract]) para cada componente del PICO, con grupos unidos por AND.
En OpenAlex, la búsqueda de texto libre usa el campo title_and_abstract.search que busca en título y resumen de forma integrada. No existe vocabulario controlado, por lo que la lista de sinónimos debe ser más exhaustiva. Sin embargo, la API de OpenAlex permite filtros adicionales muy potentes: por tipo de obra (solo artículos de revistas, excluyendo preprints si se prefiere), por rango de años, por acceso abierto, por institución o por campo disciplinario (concept).
La clave para los criterios de elegibilidad que guían tu estrategia de búsqueda es que cada término de la cadena debe corresponder a alguno de los criterios pre-especificados. Una cadena de búsqueda bien construida no solo maximiza la sensibilidad: también es auditada por los revisores de la revista como parte de la evaluación de la transparencia metodológica.



