Claude Fable 5 evita preguntas básicas de biología
Anthropic presentó Fable 5 como su modelo más potente, destacando sus capacidades en biología. Sin embargo, el modelo rechaza consultas elementales de esa misma materia.
Anthropic lanzó Claude Fable 5 el pasado 10 de junio presentándolo como el modelo más potente que ha puesto a disposición general hasta la fecha. Entre las capacidades que destacó en su comunicación oficial figuraba, explícitamente, el razonamiento científico avanzado, con la biología como uno de los campos de ejemplo. Días después, The Verge documentó que el modelo se niega a responder preguntas de biología del nivel que esperaríamos de un estudiante de bachillerato.
No se trata de preguntas sobre síntesis de patógenos ni sobre modificación genética controvertida. Son el tipo de consultas que cualquier libro de texto de secundaria resuelve en dos párrafos. Cuando el usuario formula ese tipo de pregunta a Fable 5, el modelo no responde: deriva la consulta a Claude Opus 4.8, el anterior buque insignia, que sí la contesta sin problemas.
Qué está ocurriendo exactamente
El comportamiento descrito apunta a un filtro de contenido aplicado de forma demasiado amplia en Fable 5. El modelo parece haber heredado —o recibido de forma nueva— restricciones pensadas para bloquear información sensible en ciencias de la vida, pero el umbral de activación está calibrado tan bajo que dispara falsos positivos ante terminología biológica completamente ordinaria.
El detalle más llamativo es el mecanismo de fallback: en lugar de responder o de informar al usuario de que no puede hacerlo, Fable 5 transfiere silenciosamente la consulta a Opus 4.8. Esto tiene consecuencias prácticas para quien paga por acceder al modelo más reciente esperando sus supuestas capacidades científicas mejoradas, y también plantea una pregunta incómoda sobre transparencia: ¿el usuario sabe en qué momento está hablando con un modelo distinto del que contrató?
Por qué importa más allá de la anécdota
Este tipo de incidentes no es nuevo en el sector, pero resulta especialmente llamativo en este caso por el contexto de lanzamiento. Anthropic no eligió la biología como ejemplo menor: la citó como una de las áreas donde Fable 5 supone un salto cualitativo. Que el modelo bloquee preguntas elementales de esa misma área sugiere una desconexión notable entre el proceso de evaluación interno y el comportamiento real del modelo en producción.
Para los equipos que integran Claude en aplicaciones educativas, de investigación o de soporte técnico científico, este comportamiento es directamente problemático. Un asistente que deriva consultas sin avisar introduce una capa de opacidad difícil de gestionar: los pipelines que dependen de las capacidades de Fable 5 pueden estar recibiendo respuestas de un modelo con un perfil de rendimiento distinto sin que haya ninguna señal explícita de ello.
También afecta a quienes usan la API directamente y han parametrizado sus llamadas para apuntar a Fable 5. Si el fallback a Opus 4.8 se produce a nivel de producto y no está documentado en la API, el desarrollador pierde control sobre qué modelo está ejecutando su lógica en cada momento.
La tensión entre seguridad y utilidad
El problema de fondo no es que Anthropic aplique restricciones en ciencias de la vida. Es razonable que lo haga, y el escenario de riesgos en biología sintética es real. El problema es la granularidad de esos filtros.
Un modelo que bloquea la síntesis de toxinas y uno que bloquea la explicación del ciclo de Krebs están tomando decisiones de seguridad en planos completamente distintos. Confundir ambos no protege a nadie; simplemente degrada la utilidad del producto para el usuario legítimo mientras probablemente no desincentiva nada a quien tenga intenciones reales de obtener información peligrosa, que encontrará otras vías.
Anthropid ha tenido históricamente una comunicación más cuidadosa que otros actores del sector sobre estos equilibrios. Por eso este caso llama más la atención: el desajuste entre el discurso de lanzamiento y el comportamiento observado es difícil de ignorar.
---
Opinión EP: Que un modelo presentado con capacidades científicas avanzadas no pueda resolver dudas de biología de bachillerato no es un problema menor de calibración; es un fallo de coherencia entre producto y comunicación. Esperamos que Anthropic documente el comportamiento de fallback y ajuste los umbrales antes de que el problema se instale como característica.
Fuentes
Seguir leyendo
Anthropic restringe sus modelos avanzados fuera de EE.UU.
El Gobierno de EE.UU. ha bloqueado el acceso internacional a los modelos más capaces de Anthropic. Qué cambia para usuarios y equipos fuera de Norteamérica.
Alguien dice haber sorteado los guardrails de Claude Fable 5
Un investigador afirma haber encontrado un método para eludir las restricciones de seguridad de Claude Fable 5. Lo que sabemos, lo que falta por demostrar y por qué importa.
Claude Fable 5 frustra a investigadores de ciberseguridad con sus restricciones
Investigadores de ciberseguridad denuncian que los guardarraíles de Claude Fable 5 son demasiado estrictos para trabajo legítimo de análisis de vulnerabilidades y red teaming.