El mismo modelo base, dos versiones con restricciones radicalmente distintas. Fable 5 es el acceso público con límites integrados; Mythos 5 queda reservado a un grupo reducido de ciberdefensores e investigadores. La razón: sus capacidades ofensivas son tan poderosas que Anthropic no se atreve a liberarlo abiertamente (Fuente Anthropic).
Anthropic resolvió de manera inédita el dilema entre capacidad y riesgo: lanzar el mismo modelo dos veces, con dos correas de diferente longitud. Fable 5 es la versión de acceso público, con límites duros incorporados; Mythos 5 permanece en manos de un grupo reducido de ciberdefensores y proveedores de infraestructura, junto a investigadores selectos en biología, con la coordinación de agencias del gobierno de EE.UU. como parte del despliegue.
El motivo de tanta cautela con Mythos 5 tiene base concreta. Desde abril, cuando una versión previa fue enviada a alrededor de 150 organizaciones bajo el proyecto Project Glasswing, los usuarios reportaron más de 10.000 fallas de seguridad críticas en sus propios sistemas. Esas mismas capacidades también podrían ser usadas por atacantes para vulnerar sistemas en lugar de parchearlos.
Fable 5 no es exactamente Mythos con algunas restricciones superficiales: el sistema de control es arquitecturalmente profundo. Técnicamente corre sobre el mismo modelo base que Mythos 5, pero con límites duros incorporados. Está diseñado para rechazar o redirigir una larga lista de solicitudes relacionadas con ciberseguridad, biología y química. Cuando esos filtros se activan, la consulta es redirigida silenciosamente al modelo anterior Claude Opus 4.8. Hay además una capa adicional de protección: Anthropic conectó Fable 5 para detectar intentos de destilación, donde un usuario intenta recolectar grandes volúmenes de respuestas para entrenar un modelo propio. Si el sistema detecta ese comportamiento, esas solicitudes también son redirigidas a Opus 4.8.
Los filtros están calibrados de forma deliberadamente conservadora. Diane Penn, jefa de gestión de productos de Anthropic, reconoció que algunas consultas inofensivas serán redirigidas al modelo más antiguo. La compañía dice que quiere refinar sus clasificadores con el tiempo, pero argumenta que este nivel de cautela es la única forma de justificar un lanzamiento más amplio en esta etapa.
El salto cualitativo más relevante de estos modelos no es solo su inteligencia, sino su autonomía. Fable y Mythos pueden ejecutarse «sin supervisión» durante períodos más largos que los modelos Claude anteriores, llevando a cabo secuencias de instrucciones sin supervisión constante. Esa capacidad de comportamiento agéntico amplifica enormemente su utilidad en ingeniería de software, pero también el riesgo si se usa de forma maliciosa.
Fable 5 y Mythos 5 cuestan 10 dólares por millón de tokens de entrada y 50 dólares por millón de tokens de salida, aproximadamente el doble que los otros modelos públicos de Anthropic, pero aún más económico que el Mythos Preview anterior.
El cofundador de Anthropic Jack Clark sintetizó con claridad el dilema de fondo que toda la industria enfrenta: «Querés tener la opción de levantar el pie del acelerador y ponerlo en el freno. Ahora mismo, es como si la industria de IA tuviera un pedal de acelerador, pero no tuviera freno.»

