Estrategia de búsqueda con operadores booleanos para revisión sistemática
Blog

Cómo escribir la estrategia de búsqueda para una revisión sistemática

Cómo construir la estrategia de búsqueda de tu revisión sistemática: operadores booleanos, términos MeSH, truncamiento, cadenas por base de datos y errores frecuentes.

By Equipo SynthIA11 min de lectura
estrategia de búsquedarevisión sistemáticaoperadores booleanosMeSHPRISMA 2020OpenAlex

Puntos clave

  • La estrategia de búsqueda es el conjunto de términos, operadores y filtros que define qué artículos recupera cada base de datos. Una estrategia mal construida es la causa más frecuente de sesgo de cobertura en revisiones sistemáticas.
  • La sensibilidad (recuperar todos los artículos relevantes) y la especificidad (evitar recuperar artículos irrelevantes) están en tensión: una estrategia más amplia recupera más artículos pero genera más trabajo de cribado.
  • PRISMA 2020 exige reportar la cadena de búsqueda completa para al menos una base de datos, preferiblemente para todas (ítem 7 del checklist).
  • Los operadores booleanos AND, OR y NOT son la base de cualquier estrategia; los términos MeSH de PubMed y los descriptores DeCS de SciELO son vocabularios controlados que complementan la búsqueda por términos libres.
  • OpenAlex permite búsquedas por palabras clave con cobertura de más de 250 millones de obras sin necesidad de vocabulario controlado, lo que simplifica la estrategia para revisiones multidisciplinarias.

Por qué la estrategia de búsqueda define la calidad de tu revisión

Una revisión sistemática es tan buena como los artículos que encuentra. Si la estrategia de búsqueda es demasiado restrictiva, excluye estudios relevantes y las conclusiones de la revisión reflejan solo una parte de la evidencia disponible. Si es demasiado amplia, genera miles de artículos irrelevantes que el equipo debe revisar manualmente, aumentando el costo y el tiempo del proceso sin mejorar las conclusiones.

El sesgo de cobertura — artículos relevantes que no fueron recuperados porque la estrategia no los captó — no es visible en el artículo final. Un revisor externo no puede saber qué artículos faltaron porque no estaban ahí para ser examinados. Esta asimetría hace que la estrategia de búsqueda sea una de las decisiones más críticas y, paradójicamente, una de las menos auditables del proceso.

Un metaestudio publicado en Systematic Reviews (doi.org/10.1186/s13643-021-01629-x) documentó que el 43% de las revisiones sistemáticas publicadas en 2019 tenían estrategias de búsqueda con errores detectables: términos importantes omitidos, operadores mal usados o ausencia de búsqueda en fuentes complementarias.


Los componentes de una estrategia de búsqueda

1. Términos derivados del PICO

El primer paso es traducir cada componente del PICO en términos de búsqueda. Cada componente genera un bloque de términos conectados por OR (sinónimos), y los bloques se conectan entre sí con AND.

Ejemplo para una revisión sobre ejercicio aeróbico en diabetes tipo 2:

  • Bloque P (población): diabetes mellitus type 2 OR type 2 diabetes OR T2DM OR non-insulin-dependent diabetes
  • Bloque I (intervención): aerobic exercise OR physical activity OR endurance training OR cardiorespiratory training
  • Bloque O (outcome): glycemic control OR HbA1c OR hemoglobin A1c OR blood glucose

Cadena combinada: (Bloque P) AND (Bloque I) AND (Bloque O)

La decisión de incluir o no el componente O en la estrategia depende de cuánto se quiere estrechar la búsqueda. Incluirlo reduce el volumen pero puede excluir artículos que midieron el outcome sin nombrarlo explícitamente en el título o resumen.

2. Sinónimos y variantes terminológicas

Para cada término principal hay que identificar sinónimos, acrónimos, variantes de escritura (americana vs británica) y términos relacionados usados en la literatura. Esta es la parte más laboriosa de construir una estrategia y donde la consulta con un bibliotecario especializado aporta más valor.

Herramientas útiles para identificar sinónimos:

  • MeSH Browser de la NLM (meshb.nlm.nih.gov) — vocabulario controlado de PubMed con árbol jerárquico y sinónimos de entrada
  • DeCS del BIREME (decs.bvsalud.org) — equivalente para SciELO y bases de datos de América Latina
  • Thesaurus de ERIC para educación
  • Revisiones sistemáticas previas sobre el mismo tema — sus estrategias son una referencia valiosa

3. Operadores booleanos

Los tres operadores booleanos son el vocabulario fundamental de las bases de datos:

  • AND — recupera documentos que contienen todos los términos conectados. Restringe la búsqueda.
  • OR — recupera documentos que contienen cualquiera de los términos conectados. Amplía la búsqueda.
  • NOT — excluye documentos que contienen el término posterior. Úsalo con precaución: puede excluir artículos relevantes que mencionan el término excluido en otro contexto.

El error más frecuente es aplicar AND donde debería ir OR dentro de un bloque de sinónimos, o viceversa. Una cadena como diabetes AND type 2 diabetes es redundante; diabetes mellitus type 2 OR T2DM OR type 2 diabetes es correcta.

4. Truncamiento y comodines

El truncamiento permite recuperar variantes de una misma raíz léxica con un solo término. El símbolo más común es el asterisco (*):

  • exercis* recupera: exercise, exercises, exercising, exercised
  • diabet* recupera: diabetes, diabetic, diabetics, diabetology

El comodín (?) sustituye un solo carácter: wom?n recupera woman y women.

No todos los operadores funcionan igual en todas las bases de datos. PubMed usa * para truncamiento; Embase acepta * y $; OpenAlex tiene su propio sistema de búsqueda por relevancia semántica. Verificar la sintaxis específica de cada plataforma antes de aplicar la estrategia.

5. Filtros y limitadores

Los filtros restringen la búsqueda por características de los documentos sin modificar los términos de búsqueda:

  • Tipo de estudio: ensayos clínicos, estudios observacionales, revisiones
  • Idioma: solo inglés, o incluir otros idiomas
  • Fecha de publicación: desde un año determinado
  • Especie: solo humanos (en bases de datos biomédicas)

PRISMA 2020 recomienda no aplicar filtros de idioma ni de fecha sin justificación explícita en el protocolo, ya que pueden introducir sesgo de cobertura sistemático.


Estrategia por base de datos: adaptaciones necesarias

La misma cadena conceptual debe traducirse a la sintaxis específica de cada base de datos. Esto no significa cambiar los términos, sino adaptarlos al vocabulario controlado y los operadores de cada plataforma.

PubMed / MEDLINE

PubMed combina términos libres con términos MeSH. La estrategia óptima usa ambos para capturar artículos ya indexados con MeSH y artículos recientes que aún no tienen MeSH asignado:

("diabetes mellitus, type 2"[MeSH] OR "type 2 diabetes"[tiab] OR "T2DM"[tiab])
AND
("exercise"[MeSH] OR "aerobic exercise"[tiab] OR "physical activity"[tiab])
AND
("glycated hemoglobin"[MeSH] OR "HbA1c"[tiab] OR "glycemic control"[tiab])

El sufijo [tiab] limita la búsqueda a título y resumen; [MeSH] aplica el término controlado con sus subcategorías. El operador [MeSH:noexp] aplica el término sin expandir a subcategorías cuando se quiere mayor especificidad.

OpenAlex

OpenAlex no usa vocabulario controlado MeSH ni DeCS. La búsqueda se hace por relevancia semántica o por términos en metadatos. La ventaja es la simplicidad; la desventaja es menor control sobre la especificidad. Para revisiones multidisciplinarias donde la cobertura de OpenAlex (250+ millones de obras) es más importante que el control del vocabulario, OpenAlex es una fuente primaria excelente.

SynthIA integra la búsqueda en OpenAlex directamente desde la plataforma, sin necesidad de exportar ni importar archivos. Los resultados pasan automáticamente al proceso de cribado con deduplicación integrada.


Cómo documentar y reportar la estrategia

PRISMA 2020 (ítem 7) exige presentar la estrategia de búsqueda completa para al menos una base de datos. La práctica recomendada es reportarla para todas las bases de datos consultadas, idealmente en material suplementario si la longitud no cabe en el cuerpo del artículo.

La cadena de búsqueda debe incluir:

  • El nombre exacto de la base de datos y la fecha de la búsqueda
  • La cadena de términos con operadores y filtros exactamente como se ingresó
  • El número de registros recuperados por esa búsqueda

Algunos journals exigen que la estrategia haya sido revisada por un bibliotecario especializado en información biomédica (Peer Review of Electronic Search Strategies — PRESS checklist).


Errores frecuentes en la estrategia de búsqueda

Usar solo términos MeSH sin términos libres Los términos MeSH tardan entre 6 y 12 meses en asignarse a artículos nuevos. Una búsqueda solo por MeSH perderá los artículos más recientes.

No incluir sinónimos relevantes "Myocardial infarction" en PubMed captura artículos que usan ese término, pero "heart attack" en texto libre los capturaría también. Sin el sinónimo, se pierden artículos.

Aplicar filtros de idioma por defecto Excluir artículos en español, portugués o chino introduce sesgo de publicación sistemático para temas con literatura relevante en esos idiomas.

No adaptar la cadena a cada base de datos Copiar exactamente la misma cadena de PubMed a Embase o Scopus puede generar errores de sintaxis o búsquedas incompletas porque cada plataforma tiene sus propios operadores y vocabularios.


Recursos relacionados

Keep reading

More blog articles

Cómo escribir la estrategia de búsqueda para una revisión sistemática | Blog SynthIA