Puntos clave
- RoB 2 (Risk of Bias 2) es la herramienta estándar de Cochrane para evaluar el riesgo de sesgo en ensayos controlados aleatorizados (ECA) en revisiones sistemáticas.
- Evalúa el riesgo de sesgo en 5 dominios: proceso de aleatorización, desviaciones de la intervención, datos de outcome perdidos, medición del outcome y selección del resultado reportado.
- El juicio final para cada dominio y para el estudio completo es: bajo riesgo, algunas preocupaciones, o alto riesgo.
- PRISMA 2020 (ítem 13) exige describir el método de evaluación del riesgo de sesgo; el ítem 22 exige presentar los resultados para cada estudio incluido.
- Para estudios observacionales (no ECA), las herramientas apropiadas son ROBINS-I, Newcastle-Ottawa Scale o CASP, no RoB 2.
¿Qué es el riesgo de sesgo y por qué evaluarlo?
El riesgo de sesgo en un ensayo clínico es la probabilidad de que el diseño, la conducción o el reporte del estudio produzcan estimados del efecto sistemáticamente alejados del valor verdadero. Un estudio puede tener un resultado estadísticamente significativo y un intervalo de confianza estrecho — aparentando alta precisión — pero si su proceso de aleatorización fue defectuoso, si los participantes sabían a qué grupo pertenecían y modificaron su comportamiento, o si los autores solo reportaron los outcomes donde encontraron diferencias significativas, el estimado del efecto no refleja la realidad clínica.
La evaluación del riesgo de sesgo es uno de los elementos que distingue una revisión sistemática rigurosa de una revisión narrativa. Sin ella, combinar estudios de calidad variable produce un estimado combinado que refleja el promedio de sesgos individuales, no el efecto real de la intervención.
Un análisis de Cochrane publicado en The BMJ (doi.org/10.1136/bmj.i4919) documentó que los ECA con alto riesgo de sesgo sobreestiman el efecto del tratamiento en promedio un 30% respecto a los ECA con bajo riesgo de sesgo sobre la misma pregunta.
RoB 2: los 5 dominios de evaluación
RoB 2 organiza la evaluación en 5 dominios, cada uno correspondiente a una fuente específica de sesgo. Para cada dominio, el evaluador responde una serie de preguntas señal que llevan a un juicio: bajo riesgo, algunas preocupaciones, o alto riesgo.
Dominio 1 — Proceso de aleatorización (D1)
Evalúa si la secuencia de aleatorización fue generada de forma apropiada y si la asignación a grupos fue ocultada adecuadamente hasta la inclusión del participante.
Preguntas señal clave:
- ¿Se generó la secuencia de aleatorización con un método robusto? (tabla de números aleatorios, software, generador de números pseudoaleatorios — sí; métodos como fecha de nacimiento o número de historia clínica — no)
- ¿Se ocultó la asignación a quienes enrolaron a los participantes hasta el momento de la asignación?
Alto riesgo cuando: La asignación predecible permite que quienes enrolan elijan o excluyan participantes en función del grupo al que irán.
Dominio 2 — Desviaciones de la intervención asignada (D2)
Evalúa si hubo desviaciones de las intervenciones asignadas durante el ensayo y si esas desviaciones influyeron en los resultados de forma diferencial entre grupos.
Este dominio tiene dos versiones según el efecto que se quiere estimar:
- Efecto de la asignación (intention-to-treat): Si los participantes y el personal estaban cegados a la asignación.
- Efecto de adherirse a la intervención (per-protocol): Si el análisis por protocolo fue apropiado.
Alto riesgo cuando: El desenmascara-miento de los participantes llevó a cambios de comportamiento que afectaron el outcome de forma diferencial, o si hubo cambios de intervención relevantes que no fueron preadmitidos en el protocolo.
Dominio 3 — Datos de outcome perdidos (D3)
Evalúa si los datos incompletos — participantes que abandonaron el estudio, que no tuvieron seguimiento completo, o cuyos datos del outcome no están disponibles — fueron manejados de forma apropiada.
Preguntas señal clave:
- ¿Están disponibles los datos del outcome para todos o casi todos los participantes aleatorizados?
- Si hubo pérdidas, ¿se usó un método apropiado de imputación (LOCF, imputación múltiple) o análisis de sensibilidad que evalúe el impacto de las pérdidas?
Alto riesgo cuando: Las pérdidas son mayores al 20% o cuando las razones del abandono están relacionadas con el outcome (p. ej., participantes que abandonaron porque empeoraron).
Dominio 4 — Medición del outcome (D4)
Evalúa si el outcome fue medido de forma apropiada y si el conocimiento de la asignación pudo haber influenciado la medición.
Preguntas señal clave:
- ¿El método de medición del outcome fue apropiado?
- ¿Los evaluadores del outcome conocían la asignación a grupos?
- Si conocían la asignación, ¿pudo ese conocimiento haber influenciado la medición?
Este dominio es especialmente relevante para outcomes subjetivos (dolor percibido, calidad de vida autoreportada) donde el conocimiento de la asignación puede introducir sesgos de respuesta. Para outcomes objetivos como mortalidad o valores de laboratorio, el impacto del desenmascara-miento es generalmente menor.
Dominio 5 — Selección del resultado reportado (D5)
Evalúa si el resultado reportado en la publicación corresponde a lo pre-especificado en el protocolo, o si hay evidencia de outcome switching — reportar preferentemente los outcomes donde se encontraron resultados significativos.
Preguntas señal clave:
- ¿El ensayo estaba registrado en un registro de ensayos (ClinicalTrials.gov, ISRCTN) antes de iniciar el reclutamiento?
- ¿Los outcomes reportados corresponden a los pre-especificados, con las mismas medidas y tiempos de seguimiento?
Alto riesgo cuando: Los outcomes reportados difieren de los pre-especificados sin justificación, o cuando el análisis reportado fue seleccionado a posteriori entre múltiples análisis realizados.
El juicio global de riesgo de sesgo
Después de evaluar los 5 dominios, se emite un juicio global para cada estudio:
- Bajo riesgo de sesgo global: Todos los dominios son de bajo riesgo.
- Algunas preocupaciones: Al menos un dominio presenta "algunas preocupaciones" pero ninguno es de alto riesgo.
- Alto riesgo de sesgo global: Al menos un dominio es de alto riesgo, o múltiples dominios presentan "algunas preocupaciones" que juntos socavan la confianza en el estudio.
Cómo aplicar RoB 2 en la práctica
Herramienta oficial
Cochrane proporciona la plantilla oficial de RoB 2 en Excel y en formato web a través de Covidence. La plantilla incluye las preguntas señal, las opciones de respuesta y la lógica de clasificación automatizada.
Proceso recomendado
- Dos evaluadores independientes completan la evaluación RoB 2 para cada estudio sin conocer la evaluación del otro, igual que en el cribado.
- Los evaluadores comparan sus juicios y discuten las discrepancias.
- Un tercer revisor árbitro resuelve las discrepancias que no puedan resolverse mediante discusión.
- Los resultados se presentan en un semáforo de riesgo de sesgo (risk of bias traffic light plot) que muestra el juicio por dominio para cada estudio.
Cuántos estudios necesitan evaluación
RoB 2 debe aplicarse a todos los estudios incluidos, no solo a una muestra. Evaluar solo los estudios que parecen tener resultados favorables o desfavorables introduce un sesgo en la evaluación del riesgo de sesgo.
Cómo reportar los resultados de RoB 2
PRISMA 2020 (ítems 13 y 22) exige:
- Describir el método usado para evaluar el riesgo de sesgo (qué herramienta, cuántos evaluadores, cómo se resolvieron discrepancias)
- Presentar los resultados por dominio para cada estudio incluido
La presentación estándar usa dos visualizaciones complementarias:
- Traffic light plot: Tabla con un símbolo de color por dominio por estudio (verde = bajo riesgo, amarillo = algunas preocupaciones, rojo = alto riesgo)
- Summary plot: Gráfico de barras que muestra qué porcentaje de estudios tiene cada nivel de riesgo en cada dominio
Qué usar para estudios no aleatorios
RoB 2 aplica exclusivamente a ECA. Para otros diseños:
| Tipo de estudio | Herramienta recomendada |
|---|---|
| Estudios observacionales de intervenciones | ROBINS-I |
| Cohortes y casos-controles | Newcastle-Ottawa Scale |
| Estudios transversales | JBI Critical Appraisal Checklist |
| Estudios cualitativos | CASP Qualitative Checklist |
| Estudios de diagnóstico | QUADAS-2 |



