Operadores booleanos AND, OR y NOT representados con diagramas de Venn
Blog

Operadores booleanos: guía para búsquedas en PubMed y OpenAlex

Cómo usar AND, OR, NOT, truncamiento y frases exactas en PubMed, OpenAlex, Scopus y Web of Science, con 5 ecuaciones de ejemplo listas para copiar.

By Equipo SynthIA11 min de lectura
operadores booleanosbúsqueda bibliográficaPubMedOpenAlexestrategia de búsqueda

Puntos clave

  • AND restringe resultados (intersección), OR los amplía (unión), NOT excluye (resta). La combinación correcta de los tres define la sensibilidad y especificidad de la búsqueda.
  • El truncamiento con asterisco (cancer*) recupera variantes morfológicas; las comillas dobles ("breast cancer") fuerzan frase exacta y son obligatorias para términos multipalabra.
  • PubMed, OpenAlex, Scopus y Web of Science usan sintaxis parecida pero no idéntica. Las diferencias en wildcard, campos y agrupación causan la mayoría de los errores al traducir una ecuación entre bases.
  • El error más caro es un NOT mal aplicado: un solo término genérico en la cláusula NOT puede borrar miles de papers relevantes silenciosamente.
  • Una buena ecuación de búsqueda combina términos controlados (MeSH, DeCS) con texto libre, agrupados con paréntesis explícitos.

Qué son los operadores booleanos y por qué importan

Los operadores booleanos son símbolos de lógica que combinan términos de búsqueda. Provienen del álgebra de Boole (1854) y se aplicaron a bases de datos bibliográficas desde los años 60. Hoy son la columna vertebral de toda búsqueda en PubMed, OpenAlex, Scopus, Web of Science, Embase y cualquier base científica indexada.

En una revisión sistemática, la calidad de la búsqueda determina la calidad de la evidencia que se va a sintetizar. Si la ecuación es demasiado amplia, el equipo termina cribando decenas de miles de registros irrelevantes. Si es demasiado estrecha, se pierden papers clave y la revisión queda con un riesgo serio de sesgo de selección. Los operadores booleanos son el lenguaje con el que se afina ese equilibrio.


Los tres operadores fundamentales

AND: intersección

AND devuelve solo los registros que contienen todos los términos conectados. Es el operador que restringe.

Ejemplo en diagrama de Venn (representación textual):

A = papers sobre "diabetes"        → 800.000 resultados
B = papers sobre "metformina"      → 60.000 resultados
A AND B = ambos términos presentes → 25.000 resultados

Cada AND agregado reduce el conjunto. Una ecuación con cuatro conceptos conectados con AND (población AND intervención AND comparador AND outcome) suele dar un conjunto manejable, salvo que algún concepto sea raro y elimine todo.

OR: unión

OR devuelve los registros que contienen al menos uno de los términos conectados. Es el operador que amplía.

A = papers sobre "depression"          → 400.000 resultados
B = papers sobre "depressive disorder" → 280.000 resultados
A OR B = uno u otro (o ambos)          → 510.000 resultados (no es la suma porque hay solapamiento)

OR se usa dentro de cada concepto PICO, para capturar sinónimos, variantes ortográficas y términos relacionados. Sin OR, una búsqueda perderá la mitad de los papers relevantes solo porque los autores usaron sinónimos.

NOT: exclusión

NOT excluye los registros que contienen el término señalado, incluso si también contienen otros términos relevantes. Es el operador más peligroso.

A = papers sobre "cancer"              → 4.000.000 resultados
B = papers sobre "lung cancer"         → 350.000 resultados
A NOT B = cancer pero no lung cancer   → 3.650.000 resultados

El problema: si un paper relevante sobre cáncer de mama menciona "lung cancer" en una frase comparativa, NOT lo elimina. Por eso la recomendación general es evitar NOT y, cuando se use, restringir el alcance con paréntesis o campos específicos (NOT solo en el título, por ejemplo).


Truncamiento, comodines y frases exactas

Truncamiento con asterisco

El asterisco al final de una raíz recupera todas las variantes morfológicas:

  • cancer* → cancer, cancers, cancerous
  • child* → child, children, childhood, childcare
  • random* → random, randomized, randomization, randomisation

PubMed limita el truncamiento a las primeras 600 variantes que encuentra. Si una raíz muy corta excede ese límite, devuelve un error y hay que extender la raíz. Por ejemplo, bio* no funciona; biolog* sí.

Comodín de carácter

Algunas bases aceptan el signo de pregunta para reemplazar un carácter:

  • wom?n → woman, women
  • colo?r → color, colour

OpenAlex no soporta comodín de carácter; PubMed sí en algunas variantes; Web of Science lo soporta con ? (un carácter) y * (cero o más caracteres).

Frases exactas con comillas

Las comillas dobles fuerzan que los términos se busquen juntos en ese orden:

  • "randomized controlled trial" → solo papers donde aparezcan las tres palabras consecutivas.
  • Sin comillas, randomized controlled trial se interpreta en muchas bases como randomized AND controlled AND trial, lo que devuelve resultados donde las palabras aparecen separadas en el texto.

Para términos de dos o más palabras (machine learning, breast cancer, public health), las comillas son obligatorias.


Paréntesis: el operador silencioso

Los paréntesis controlan el orden de evaluación. Sin paréntesis explícitos, la mayoría de las bases evalúan AND antes que OR, lo que cambia el sentido de la ecuación.

Sin paréntesis:

diabetes OR hypertension AND metformin

Esto se evalúa como:

diabetes OR (hypertension AND metformin)

Resultado: todos los papers sobre diabetes (independiente de metformina), más los que tengan hipertensión Y metformina. Probablemente no es lo que el autor quería.

Con paréntesis explícitos:

(diabetes OR hypertension) AND metformin

Esto recupera papers donde metformina aparezca junto con diabetes o hipertensión. Esto sí es probablemente lo deseado.

Regla operativa: agrupar siempre los sinónimos de un concepto entre paréntesis antes de combinarlos con AND con otros conceptos.


Sintaxis comparada: PubMed, OpenAlex, Scopus, Web of Science

Aunque la lógica booleana es universal, cada base tiene su sintaxis propia. La siguiente tabla resume las diferencias clave.

FuncionalidadPubMedOpenAlexScopusWeb of Science
AND, OR, NOTSí, en mayúsculasSí, en mayúsculasAND, OR, AND NOTAND, OR, NOT
TruncamientoAsterisco al finalAsterisco al finalAsterisco al finalAsterisco al final y al medio
Comodín de carácterNo estándarNoSigno de preguntaSigno de pregunta
Frase exactaComillas doblesComillas doblesLlaves para frase literal, comillas para variantesComillas dobles
Campo específico[ti], [ab], [mh], etc.filter en URL: title.search, abstract.searchTITLE(), ABS(), KEY()TI=, AB=, TS=
Búsqueda en MeSH[MeSH Terms] o [mh]No tiene vocabulario controlado propioSí, vía MEDLINETagging temático propio
ProximidadNo estándarNoW/n (n palabras de distancia)NEAR/n
Límite de términosSin límite oficialSin límite oficialSin límiteSin límite

Ejemplo: la misma ecuación en cuatro bases

Concepto: ensayos aleatorizados sobre metformina en diabetes tipo 2.

PubMed:

("type 2 diabetes mellitus"[MeSH] OR "type 2 diabetes"[tiab])
AND ("metformin"[MeSH] OR metformin[tiab])
AND ("randomized controlled trial"[Publication Type] OR "randomized"[tiab])

OpenAlex (filtros en la URL del API):

search=(("type 2 diabetes" OR T2DM) AND metformin AND ("randomized controlled trial" OR randomized))
filter=type:article

Scopus:

TITLE-ABS-KEY(("type 2 diabetes" OR T2DM) AND metformin AND ("randomized controlled trial" OR randomized))
AND DOCTYPE(ar)

Web of Science:

TS=(("type 2 diabetes" OR T2DM) AND metformin AND ("randomized controlled trial" OR randomized))

Si querés profundizar en cómo se compara la cobertura entre las bases, acá comparamos OpenAlex con PubMed para revisiones sistemáticas.


Cinco ecuaciones de ejemplo listas para copiar

Las siguientes ecuaciones usan sintaxis PubMed. Adaptá los campos según la base de destino.

1. Salud pública: vacunación COVID-19 y duda vacunal en LATAM

("COVID-19 Vaccines"[MeSH] OR "covid vaccine"[tiab] OR "SARS-CoV-2 vaccin*"[tiab])
AND ("vaccine hesitancy"[MeSH] OR "vaccine hesitanc*"[tiab] OR "vaccination refusal"[tiab])
AND ("Latin America"[MeSH] OR "Latin Americ*"[tiab] OR Brazil[tiab] OR Mexico[tiab] OR Argentin*[tiab] OR Chile[tiab])

2. Educación: educación a distancia y rendimiento académico en universitarios

("Education, Distance"[MeSH] OR "distance learning"[tiab] OR "online learning"[tiab] OR "e-learning"[tiab])
AND ("Academic Performance"[MeSH] OR "academic performance"[tiab] OR "academic achievement"[tiab])
AND (universit*[tiab] OR "higher education"[tiab] OR undergraduat*[tiab])

3. Clínica: terapia cognitivo-conductual en depresión adolescente

("Cognitive Behavioral Therapy"[MeSH] OR "cognitive behavioral therapy"[tiab] OR "cognitive behaviour therapy"[tiab] OR CBT[tiab])
AND ("Depressive Disorder"[MeSH] OR depression[tiab] OR depressive[tiab])
AND (adolescen*[tiab] OR teen*[tiab] OR youth[tiab] OR "young people"[tiab])
AND ("randomized controlled trial"[Publication Type] OR "randomized"[tiab] OR "randomised"[tiab])

4. Tecnología: machine learning en detección de cáncer de mama

("Machine Learning"[MeSH] OR "machine learning"[tiab] OR "deep learning"[tiab] OR "artificial intelligence"[tiab] OR "neural network*"[tiab])
AND ("Breast Neoplasms"[MeSH] OR "breast cancer"[tiab] OR "breast neoplasm*"[tiab])
AND (detect*[tiab] OR diagnos*[tiab] OR screen*[tiab])

5. Enfermería: prevención de úlceras por presión en cuidados intensivos

("Pressure Ulcer/prevention and control"[MeSH] OR "pressure ulcer*"[tiab] OR "bedsore*"[tiab] OR "decubitus ulcer*"[tiab])
AND ("Intensive Care Units"[MeSH] OR "intensive care"[tiab] OR ICU[tiab] OR "critical care"[tiab])
AND (prevent*[tiab] OR "risk assessment"[tiab])

Para construir tus propias ecuaciones, conviene partir de una guía estructurada como esta de estrategias de búsqueda para revisiones sistemáticas.


Errores frecuentes y cómo evitarlos

Paréntesis mal cerrados

El error más común y silencioso. Una ecuación con paréntesis desbalanceados puede ejecutarse sin error y devolver un resultado erróneo. PubMed cierra paréntesis automáticamente en algunos casos, lo que esconde el problema.

Solución: copiar la ecuación a un editor de texto que resalte paréntesis pareados o contar paréntesis abiertos y cerrados antes de ejecutar.

NOT que excluye demasiado

Aplicar NOT a un término común elimina cientos o miles de papers relevantes. Por ejemplo, cancer NOT animal en PubMed parece razonable para excluir estudios en animales, pero excluye todo paper que mencione modelos animales en la introducción aunque sea un estudio clínico.

Solución: en lugar de NOT, usar filtros estructurados (filtro de especie humana, filtro de tipo de estudio) o limitar NOT a campos específicos (NOT animal[ti]).

Sinónimos olvidados

Usar solo el término académico sin variantes coloquiales o sinónimos pierde papers. "Heart attack" recupera papers distintos a "myocardial infarction" aunque sean el mismo concepto.

Solución: antes de armar la ecuación, hacer una lista de sinónimos consultando un thesaurus (MeSH, DeCS, EMTREE) y revisando títulos de papers seminales sobre el tema.

Mezclar términos controlados y texto libre sin estructura

Combinar "Diabetes Mellitus, Type 2"[MeSH] con type 2 diabetes[tiab] es correcto y aumenta sensibilidad. Combinarlos sin paréntesis y conectarlos mal con AND/OR genera resultados impredecibles.

Solución: estructura típica por concepto:

(Término_MeSH[MeSH] OR variante1[tiab] OR variante2[tiab] OR variante3[tiab])

Truncamiento demasiado corto

heart* recupera heart, hearts, heartburn, heartbeat, heartworm. Algunos de esos términos pueden ser ruido.

Solución: hacer el truncamiento lo más largo posible para minimizar variantes irrelevantes. heartfailure* es más preciso si lo que se busca es insuficiencia cardíaca.

Mayúsculas vs minúsculas

PubMed, OpenAlex y Web of Science son case-insensitive para los términos, pero los operadores AND, OR, NOT deben estar en mayúsculas. Escribir diabetes and metformin en PubMed busca el término literal "and" como palabra, no aplica el operador.


Cómo iterar la búsqueda

Una primera ecuación rara vez es la definitiva. El flujo típico:

  1. Versión 1: cobertura amplia. Usar muchos sinónimos por concepto y agrupar con OR. Verificar que recupera los papers seminales conocidos del campo (gold standard set).
  2. Refinar términos. Si la ecuación devuelve muy pocos resultados, agregar más sinónimos por concepto. Si devuelve demasiados, agregar un concepto adicional con AND o restringir a títulos y abstracts.
  3. Validar con papers conocidos. Asegurarse que entre 5 y 10 papers que el equipo sabe que son relevantes aparecen en los resultados.
  4. Documentar. Guardar la ecuación final con fecha de búsqueda, número de resultados y base. PRISMA 2020 (ítem 7) exige reportar la búsqueda completa, no solo la base.

Recursos relacionados

Keep reading

More blog articles

Operadores booleanos: guía para búsquedas en PubMed y OpenAlex | Blog SynthIA