Artículo 51 de la Ley de IA de la UE: cómo se clasifican los modelos de GPAI como de riesgo sistémico
El Artículo 51 clasifica los modelos de GPAI como de riesgo sistémico: presunción de 10²⁵ FLOP o decisión de la Comisión. En vigor desde el 2 de agosto de 2025. Multas de hasta 15 M€ o el 3 %.
Un modelo de IA de uso general no es automáticamente un modelo con riesgo sistémico. El Artículo 51 del Reglamento (UE) 2024/1689 establece exactamente cuándo se aplica esa clasificación — los criterios, la presunción jurídica y la facultad discrecional de la Comisión para ampliarla. Equivocarse importa: un proveedor que clasifique erróneamente su modelo por debajo del umbral de riesgo sistémico y omita las obligaciones del Artículo 55 se enfrenta a multas de hasta 15 millones de euros o el 3 % del volumen de negocios anual mundial total en virtud del Artículo 101.
Las normas sobre GPAI están en vigor desde el 2 de agosto de 2025. Esto no es un plazo futuro — está vigente ahora.
Esta guía abarca qué hace realmente el Artículo 51, cómo funcionan los criterios de clasificación, qué dice el Anexo XIII, cómo opera en la práctica la presunción de 10²⁵ FLOP y qué significa para el reducido número de empresas que son genuinamente proveedores de modelos de GPAI. Si usted desarrolla o distribuye software que utiliza un modelo fundacional de un tercero — lo que describe a la mayoría de las empresas dentro del ámbito de la Ley de IA de la UE —, el Artículo 51 casi con seguridad no se le aplica directamente. Ese contexto importa y se aborda más adelante.
Qué hace (y qué no hace) el Artículo 51
El Artículo 51 es un artículo de clasificación. Define las condiciones en las que un modelo de GPAI se designa como modelo con riesgo sistémico. Por sí solo no impone obligaciones: las obligaciones reales para los proveedores de GPAI de riesgo sistémico residen en el Artículo 55 (evaluaciones del modelo, pruebas adversarias, notificación de incidentes, medidas de ciberseguridad y notificación de eficiencia energética). El Artículo 52 establece el procedimiento de notificación una vez realizada la clasificación.
Esta distinción importa para leer con claridad el marco del capítulo V:
- Artículo 53 — obligaciones para todos los proveedores de modelos de GPAI (documentación técnica, información para los proveedores posteriores, una política de cumplimiento de los derechos de autor, un resumen de acceso público de los datos de entrenamiento).
- Artículo 51 — la puerta de entrada: qué modelos conllevan además riesgo sistémico.
- Artículo 55 — las obligaciones adicionales que se aplican una vez realizada la clasificación del Artículo 51.
Un proveedor sujeto únicamente al Artículo 53 tiene una carga más ligera. Una vez que se aplica el Artículo 51, el Artículo 55 se activa por encima de él.
Las dos vías hacia la clasificación de riesgo sistémico
El Artículo 51, apartado 1, establece dos fundamentos independientes para la clasificación.
Vía 1: capacidades de gran impacto
Un modelo de GPAI se clasifica como de riesgo sistémico si tiene capacidades de gran impacto, evaluadas sobre la base de herramientas técnicas, metodologías, indicadores y puntos de referencia adecuados. El Artículo no enumera esas herramientas — esa tarea corresponde a la Comisión y a los códigos de buenas prácticas elaborados en virtud del Artículo 56 — pero ancla la clasificación a la capacidad, no únicamente al tamaño de mercado o a la escala de despliegue.
La presunción técnica clave reside aquí: se presume que un modelo de GPAI tiene capacidades de gran impacto cuando la cantidad acumulada de cómputo utilizado para su entrenamiento, medida en operaciones de coma flotante (FLOP), es superior a 10²⁵. La presunción es rebatible. Un proveedor cuyo modelo cruce ese umbral puede argumentar ante la Comisión que el modelo no exhibe de hecho capacidades de gran impacto — pero la carga recae sobre el proveedor, no sobre el regulador.
¿Por qué el cómputo como aproximación? El cómputo de entrenamiento se correlaciona con las capacidades emergentes que son difíciles de evaluar directamente antes del despliegue. La cifra de 10²⁵ FLOP capta a grandes rasgos la frontera de los modelos que han demostrado comportamientos cualitativamente nuevos — razonamiento, planificación, seguimiento de instrucciones en varios pasos a gran escala — al tiempo que excluye a la inmensa mayoría de los modelos de uso comercial. Para dar una idea del orden de magnitud: GPT-3 (2020) utilizó aproximadamente 3,1 × 10²³ FLOP. Los modelos entrenados a 10²⁵ FLOP los producen, a fecha de 2025, un puñado de organizaciones en todo el mundo.
Vía 2: decisión de la Comisión
La segunda vía es discrecional. La Comisión puede decidir, ya sea por iniciativa propia o a raíz de una alerta cualificada del panel científico (el organismo científico independiente establecido en virtud del Artículo 68), que un modelo de GPAI tiene capacidades equivalentes a las descritas en la Vía 1, o tiene un impacto equivalente aunque la cifra de cómputo de entrenamiento esté formalmente por debajo del umbral.
La decisión de la Comisión por esta vía se basa en los criterios del Anexo XIII. Este es el mecanismo que prepara la clasificación para el futuro: si un nuevo enfoque arquitectónico produce capacidades de gran impacto con menos cómputo, la Comisión puede capturarlo sin esperar a una modificación legislativa.
Anexo XIII: los criterios de clasificación
El Anexo XIII enumera los factores que la Comisión utiliza al evaluar si un modelo de GPAI tiene — o cabe esperar razonablemente que tenga — capacidades de gran impacto, particularmente para la decisión discrecional de la Vía 2. Los criterios incluyen:
- Número de parámetros del modelo.
- Calidad y tamaño del conjunto de datos de entrenamiento, incluido si abarca múltiples modalidades (texto, imagen, código, audio, vídeo).
- Cómputo utilizado para el entrenamiento (la misma métrica que la presunción de la Vía 1, pero aquí como uno de varios factores y no como un umbral binario).
- Modalidades de entrada y de salida — un modelo multimodal que razona sobre texto, visión y audio presenta perfiles de riesgo distintos de los de un modelo de una sola modalidad.
- Puntos de referencia y evaluaciones sobre tareas de capacidad general y específica, en particular las que miden el razonamiento, la planificación, la autonomía o la capacidad de asistir en actividades peligrosas.
- Alcance del modelo, incluido el número de usuarios profesionales y usuarios finales registrados en la UE. Un modelo utilizado por millones de residentes de la UE en sectores críticos tiene un perfil de riesgo distinto del de uno desplegado en un entorno industrial controlado.
- Arquitectura del modelo y el grado en que el modelo puede ajustarse o adaptarse para usos posteriores.
- Efectos sistémicos ya observados, como la dependencia de servicios críticos respecto de un único modelo.
La lista no es exhaustiva. El Anexo XIII refleja el estado de la comprensión técnica en el momento de la adopción; la Comisión puede adoptar actos delegados en virtud del Artículo 51, apartado 3, para modificar los umbrales, los indicadores y los puntos de referencia a la luz de la evolución tecnológica. Este es el mecanismo legislativo para ajustar la cifra de 10²⁵ FLOP al alza o a la baja sin reabrir todo el Reglamento.
Cómo funciona en la práctica la presunción de 10²⁵ FLOP
Un ejemplo práctico ilustra cómo opera el umbral.
Un proveedor de modelos de frontera con sede en EE. UU. entrena un gran modelo multimodal. Los registros de entrenamiento internos muestran un cómputo acumulado de aproximadamente 8 × 10²⁵ FLOP — muy por encima del umbral. El modelo se ofrece a través de una API a clientes empresariales de todo el mundo, incluidos varios miles de usuarios profesionales registrados en la UE.
Con arreglo al Artículo 51, apartado 1, letra a), se presume que el modelo tiene capacidades de gran impacto. El proveedor tiene dos opciones:
-
Aceptar la clasificación y proceder a notificarlo a la Comisión en virtud del Artículo 52, y luego cumplir las obligaciones del Artículo 55: realizar evaluaciones del modelo y pruebas adversarias antes del lanzamiento y, como mínimo, anualmente a partir de entonces; identificar y mitigar los riesgos sistémicos; notificar los incidentes graves y los fallos de funcionamiento a la Oficina de IA; implantar medidas de ciberseguridad; y notificar el consumo de energía.
-
Rebatir la presunción facilitando a la Comisión pruebas de que el modelo, pese a superar el umbral de cómputo, no exhibe capacidades de gran impacto. En la práctica, dado dónde se sitúa el nivel de 10²⁵ en la distribución de capacidades actual, una refutación lograda exigiría demostrar capacidades estrechas o restringidas incompatibles con la definición de riesgo sistémico — una tarea cuesta arriba para un gran modelo multimodal.
El proveedor no puede limitarse a ignorar el umbral. El Artículo 52, apartado 1, exige a los proveedores de modelos de GPAI que notifiquen a la Comisión cuando su modelo cumpla los criterios del Artículo 51. La notificación desencadena la revisión de la Comisión, no una autocertificación.
Considérese ahora un segundo escenario: un instituto europeo de investigación en IA entrena un modelo utilizando únicamente 4 × 10²⁴ FLOP — por debajo del umbral de presunción. El modelo, sin embargo, muestra un rendimiento inusualmente fuerte en una serie de evaluaciones de capacidad, incluidas tareas de planificación autónoma. El panel científico revisa los puntos de referencia públicos y emite una alerta cualificada a la Comisión en virtud del Artículo 90. La Comisión abre una evaluación discrecional en virtud del Artículo 51, apartado 1, letra b), aplicando los criterios del Anexo XIII. Si la evaluación concluye que el modelo tiene capacidades equivalentes a las de un modelo en el umbral o por encima de él, emite una decisión que clasifica el modelo como de riesgo sistémico — y las obligaciones del Artículo 55 se aplican a partir de ese momento.
A quién se aplica realmente esto
El Artículo 51 se dirige a los proveedores de modelos de GPAI — las organizaciones que entrenan e introducen modelos de IA de uso general en el mercado o los ponen en servicio bajo su propio nombre o marca comercial, según se define en el Artículo 3, apartado 3. En la estructura de mercado actual, se trata de un reducido número de organizaciones: los laboratorios de frontera que entrenan grandes modelos lingüísticos, grandes modelos multimodales y sistemas equivalentes a gran escala.
Si usted es una empresa que:
- integra una API de un tercero (OpenAI, Google, Mistral, etc.) en su producto,
- ajusta un modelo de pesos abiertos existente para un caso de uso específico,
- desarrolla una aplicación o un flujo de trabajo sobre un modelo fundacional,
entonces es casi con seguridad un proveedor posterior o un responsable del despliegue, no un proveedor de modelos de GPAI en virtud del Artículo 53, y la maquinaria de clasificación del Artículo 51 no se le aplica. Sus obligaciones como proveedor posterior se rigen por los Artículos 16 y 26 (y, si su sistema es de alto riesgo, por los Artículos 9 a 15). Usted no está clasificando el modelo de GPAI subyacente — esa es responsabilidad del proveedor aguas arriba.
La cuestión crítica de cumplimiento para la mayoría de las empresas es si han documentado adecuadamente el modelo o los modelos de GPAI en los que se apoyan, su relación con esos modelos y si esos modelos aguas arriba han notificado a la Comisión su condición de riesgo sistémico. Esa relación — qué modelo de GPAI sustenta qué sistema registrado — es un hecho documentado que conviene mantener en su inventario de IA.
El calendario del capítulo V: ya en vigor
Las normas sobre GPAI (capítulo V, Artículos 51 a 56) se aplican desde el 2 de agosto de 2025. Esto es distinto del calendario de alto riesgo:
- 2 de agosto de 2025 — obligaciones de GPAI en vigor, incluidos los criterios de clasificación del Artículo 51, el procedimiento de notificación del Artículo 52, las obligaciones generales de los proveedores de GPAI del Artículo 53 y las obligaciones de riesgo sistémico del Artículo 55.
- 2 de diciembre de 2027 — sistemas de IA de alto riesgo autónomos (lista del Anexo III: selección de personal, crédito, biometría, etc.) en virtud del Ómnibus Digital acordado en mayo de 2026.
- 2 de agosto de 2028 — IA de alto riesgo como componentes de seguridad en productos regulados (Anexo I).
Los proveedores de modelos de frontera que cruzaron el umbral de 10²⁵ FLOP antes del 2 de agosto de 2025 ya deberían haberlo notificado a la Comisión. Los proveedores que lo crucen después de esa fecha deben notificarlo en virtud del Artículo 52 sin demora.
El Artículo 51 en el marco más amplio de la GPAI
Resulta útil ver cómo se conecta el Artículo 51 con los artículos circundantes:
El Artículo 53 (todos los proveedores de GPAI) exige, con independencia del riesgo sistémico: un paquete de documentación técnica (conforme a los Anexos XI y XII), información a los proveedores posteriores sobre las capacidades y limitaciones, una política de cumplimiento de la legislación de la UE sobre derechos de autor y un resumen de acceso público de los datos de entrenamiento. Estas obligaciones se aplican a todos los proveedores de modelos de GPAI — no solo a los que superan el umbral de 10²⁵ FLOP.
El Artículo 51 plantea entonces la siguiente cuestión: ¿tiene este modelo, además, capacidades de gran impacto? En caso afirmativo, se aplica la clasificación de riesgo sistémico.
El Artículo 52 es la consecuencia procedimental: el proveedor debe notificarlo a la Comisión, que puede entonces realizar su propia evaluación y emitir una decisión formal de clasificación.
El Artículo 55 es donde recae la carga adicional sustantiva: evaluaciones del modelo (incluidas pruebas adversarias), identificación y mitigación de riesgos en virtud del Anexo XIII, notificación de incidentes graves a la Oficina de IA, medidas de ciberseguridad adecuadas al perfil de riesgo del modelo y notificación anual de eficiencia energética.
El Artículo 56 establece los códigos de buenas prácticas mediante los cuales los proveedores, en cooperación con la Oficina de IA, elaboran las metodologías, métricas y puntos de referencia detallados que concretan cómo se aplican en la práctica los Artículos 51 y 55.
La clasificación de riesgo sistémico del Artículo 51 no es, por tanto, un punto final — es la puerta de entrada que activa una vía de cumplimiento más rica y exigente.
Sanciones para los proveedores de GPAI
La ejecución específica de la GPAI se canaliza a través del Artículo 101, no del Artículo 99. La Comisión — actuando a través de la Oficina de IA — puede imponer a los proveedores de modelos de GPAI multas de hasta 15 millones de euros o el 3 % del volumen de negocios anual mundial total del ejercicio financiero anterior, si esta última cifra es mayor. Esto se aplica a los incumplimientos de las obligaciones de GPAI, incluidas las obligaciones de notificación del Artículo 51 y los requisitos sustantivos del Artículo 55.
Las sanciones del Artículo 99 (la vía de ejecución general utilizada por las autoridades nacionales) también se aplican cuando proceda — por ejemplo, si un modelo de GPAI está integrado en un sistema de alto riesgo y el proveedor ha incumplido los requisitos de los Artículos 16 a 27 en esa condición.
Los modelos de pesos abiertos y la cuestión del riesgo sistémico
El marco del Artículo 51 plantea una cuestión específica para los modelos de pesos abiertos — aquellos cuyos pesos se ponen a disposición del público y pueden descargarse, ejecutarse y ajustarse sin restricción. Si el modelo se entrenó utilizando más de 10²⁵ FLOP, la presunción de capacidades de gran impacto se aplica con independencia de cómo se distribuya el modelo.
La cuestión práctica es quién cuenta como el proveedor. Con arreglo al Artículo 3, apartado 3, un proveedor es la entidad que desarrolla e introduce un modelo de GPAI en el mercado o lo pone en servicio bajo su propio nombre o marca comercial. Una organización que publica pesos abiertos bajo su propio nombre — incluso sin cobrar por el acceso — está introduciendo el modelo en el mercado en el sentido de ponerlo a disposición de los usuarios. La publicación de pesos abiertos no disuelve las obligaciones del proveedor en virtud del capítulo V.
Lo que cambia es el panorama posterior. Una vez que una organización descarga y despliega pesos abiertos en su propio producto, puede aplicarse el Artículo 25: si modifica sustancialmente el modelo o lo despliega de un modo que cambia su finalidad prevista, puede pasar a ser proveedora de pleno derecho para ese caso de uso. Pero la organización de entrenamiento original conserva sus obligaciones del Artículo 53 y, si el cómputo de entrenamiento supera el umbral, también sus obligaciones del Artículo 55.
Se espera que los códigos de buenas prácticas elaborados en virtud del Artículo 56 aborden los retos específicos de implementación de las publicaciones de pesos abiertos — por ejemplo, cómo realizar pruebas adversarias posteriores a la publicación en un modelo que cualquiera puede descargar y ejecutar, o cómo notificar incidentes cuando la base de usuarios no tiene límites. La Oficina de IA de la Comisión ha indicado que esta es un área activa en el proceso de redacción.
El papel de los códigos de buenas prácticas en la definición de los puntos de referencia
El Artículo 56 exige a la Oficina de IA que facilite la elaboración de códigos de buenas prácticas para las obligaciones del capítulo V. Estos códigos no son una orientación opcional — son el mecanismo a través del cual se operativiza el detalle técnico de los Artículos 51 y 55. Se presume que un proveedor de modelos de GPAI que sigue un código de buenas prácticas completado y aprobado por la Comisión cumple las obligaciones correspondientes.
Para el Artículo 51 en concreto, se espera que los códigos desarrollen:
- Marcos de evaluación — los puntos de referencia y los protocolos de prueba concretos utilizados para evaluar si un modelo tiene capacidades de gran impacto más allá de la aproximación del FLOP. Esto importa porque el umbral de FLOP es una presunción, no una definición: la Comisión necesita metodologías acordadas para evaluar los modelos que rebaten la presunción o que quedan por debajo del umbral pero exhiben capacidades inesperadas.
- Descriptores de capacidad — definiciones de lo que significa «gran impacto» operativamente en distintas modalidades y contextos de uso. Un modelo capaz de planificación autónoma en varios pasos presenta riesgos distintos de los de uno que genera texto fluido sin capacidades de razonamiento.
- Normas de documentación — formatos normalizados para la información que los proveedores deben presentar en virtud del Artículo 52 y mantener en virtud del Artículo 55, lo que hace más manejable el proceso de revisión de la Comisión.
Los proveedores deben seguir el proceso de los códigos de buenas prácticas a través de los documentos de trabajo publicados por la Oficina de IA. Los primeros códigos se redactaron con aportaciones de los proveedores de modelos de frontera y de la sociedad civil durante 2025, mientras la Comisión los revisaba para comprobar su adecuación. Seguir un código completado no exime al proveedor de sus obligaciones jurídicas, pero proporciona una vía clara de puerto seguro.
Qué ocurre tras la notificación: el procedimiento del Artículo 52
Una vez que un proveedor concluye que se aplica el Artículo 51 — ya sea porque el modelo cruza el umbral de FLOP o porque la Comisión ha emitido una decisión —, debe notificarlo a la Comisión en virtud del Artículo 52. La notificación desencadena un proceso formal.
La Comisión revisa la notificación y puede solicitar información adicional. También puede iniciar su propia evaluación si considera que un modelo debería clasificarse como de riesgo sistémico aun en ausencia de una notificación. Tras la revisión, la Comisión emite una decisión que confirma o deniega la clasificación. Una clasificación confirmada activa plenamente el Artículo 55.
Los proveedores que no estén de acuerdo con una decisión de clasificación de la Comisión pueden impugnarla a través del proceso ordinario de revisión administrativa y judicial de la UE. El panel científico establecido en virtud del Artículo 68 puede emitir alertas cualificadas que desencadenan la evaluación de la Comisión, pero no toma por sí mismo decisiones de clasificación vinculantes — esa autoridad reside en la Comisión.
El requisito de notificación no es un registro del modelo en la base de datos de IA de la UE en el sentido del Artículo 49 (que rige el registro de los sistemas de IA de alto riesgo para los responsables del despliegue posteriores). Es un acto regulatorio distinto dirigido directamente a la Comisión, a través de la Oficina de IA.
Distinción entre la clasificación del Artículo 51 y el registro del Artículo 49
Una fuente persistente de confusión — incluida la versión original de este artículo — es confundir el Artículo 51 (clasificación de la GPAI por riesgo sistémico) con el Artículo 49 (registro en la base de datos de la UE de los sistemas de IA de alto riesgo). Son obligaciones enteramente distintas:
- El Artículo 49 exige a los proveedores y a los responsables del despliegue de sistemas de IA de alto riesgo (casos de uso del Anexo III: selección de personal, crédito, biometría, etc.) que registren esos sistemas en la base de datos pública de la UE antes de introducirlos en el mercado o ponerlos en servicio. Esto se aplica al sistema posterior concreto, no al modelo de GPAI subyacente.
- El Artículo 51 exige a la Comisión que clasifique si un propio modelo de GPAI cumple el umbral de riesgo sistémico. El proveedor lo notifica en virtud del Artículo 52; la Comisión evalúa y decide.
Un sistema que utiliza un modelo de GPAI en una aplicación del Anexo III puede desencadenar ambos: el proveedor posterior registra el sistema de IA de alto riesgo en virtud del Artículo 49, y el proveedor del modelo de GPAI aguas arriba puede haber notificado por separado a la Comisión en virtud del Artículo 52. Se trata de obligaciones que recaen sobre entidades distintas en puntos distintos de la cadena de suministro.
Qué registra Confir
Confir no evalúa si un modelo de GPAI aguas arriba cumple el umbral de riesgo sistémico del Artículo 51 — esa es una determinación que toma el proveedor del modelo de GPAI (o la Comisión por iniciativa propia). Lo que Confir rastrea es la relación de GPAI de los sistemas de IA registrados en su inventario: qué modelo fundacional sustenta un sistema determinado, si el proveedor aguas arriba tiene la condición de riesgo sistémico y cómo afecta esa relación a la postura de cumplimiento de sus sistemas registrados.
Esto resulta prácticamente útil para los proveedores posteriores y los responsables del despliegue que necesitan documentar la procedencia de las capacidades de IA de su pila tecnológica — parte del panorama de gobernanza más amplio que exige la documentación técnica del Artículo 11 / Anexo IV.
Una nota sobre el ámbito de aplicación para las empresas por debajo del umbral
La presunción de 10²⁵ FLOP se fija deliberadamente alta. La inmensa mayoría de los sistemas de IA de uso comercial — incluidos la mayoría de los modelos ajustados, las canalizaciones RAG, los sistemas de clasificación y los modelos específicos de dominio — se sitúan muchos órdenes de magnitud por debajo de él. Para esos sistemas, el Artículo 51 es informativo más que directamente accionable: comprender cómo funciona la clasificación le ayuda a entender la situación de cumplimiento de los modelos fundacionales de los que depende y le ayuda a responder a «¿cuál es la relación de GPAI de este sistema?» cuando surja en su documentación técnica.
El artículo al que conviene prestar más atención, para la mayoría de las empresas, es el Artículo 6 (clasificación de alto riesgo) y el Anexo III (la lista de casos de uso). Si su sistema de IA toca la selección de personal, la calificación crediticia, la identificación biométrica o las otras ocho categorías del Anexo III, ahí es donde se concentra su carga de cumplimiento — bajo un plazo del 2 de diciembre de 2027 para los sistemas autónomos.
Guías relacionadas
- gestión del inventario de sistemas de IA
- requisitos de clasificación de IA de alto riesgo
- requisitos de cumplimiento de la Ley de IA de la UE
- guía de requisitos de cumplimiento para empresas
- soluciones de software de cumplimiento de GPAI
- soluciones de software de gobernanza de la IA
Gestiona el cumplimiento de la Ley de IA de la UE en un solo lugar
Confir automatiza la clasificación de riesgo, la documentación técnica y los registros de auditoría para cualquier empresa. Sin consultores. Sin proyectos de seis meses. Prueba gratuita de 7 días.
Empieza la prueba gratuita →