Invarra
Menú

Informes de benchmark

Informes IPB

Los informes públicos IPB son artefactos de evidencia acotados, no lanzamientos sorpresa de rankings. El dominio actual es Enterprise Copilot Safety v0.2.

Enterprise Copilot Safety v0.2

La publicación pública está programada para el 22 de julio de 2026. Los informes incluirán hallazgos acotados, gráficos, salvedades, estado de respuesta de proveedores cuando corresponda y ejemplos públicos seguros. La generación viva de corpus, conjuntos retenidos y material futuro de prueba permanecen cerrados.

Publicación programada

Frontier Model Reports

El primer conjunto de informes frontier está acotado a IPB Enterprise Copilot Safety v0.2. La publicación pública queda condicionada a validación de evidencia, vista previa privada de proveedores, revisión de impugnaciones, redacción pública segura, revisión de salvedades y aprobación de publicación.

Puntuación principal del protocolo

22 de julio de 2026

Descarga disponible el 22 de julio de 2026

Corrección frente a estabilidad

22 de julio de 2026

Descarga disponible el 22 de julio de 2026

En preparación

Open-Weight Model Reports

La rama open-weight usará la misma metodología ECS v0.2 y los mismos límites de divulgación pública, con contexto adicional de reproducibilidad para configuraciones descargables cuando corresponda.

Puntuación principal del protocolo

22 de julio de 2026

Descarga disponible el 22 de julio de 2026

Corrección frente a estabilidad

22 de julio de 2026

Descarga disponible el 22 de julio de 2026

No-afirmaciones del informe

  • IPB no es un ranking universal de inteligencia.
  • IPB no afirma que un modelo sea globalmente seguro.
  • IPB no es certificación.
  • IPB no sustituye revisión legal, regulatoria, de seguridad, médica, financiera ni de cumplimiento.
  • Los resultados IPB están acotados al dominio, versión de protocolo, versión de corpus, identidad del modelo o sistema y configuración de ejecución declarados.
  • Comportamiento estable no significa automáticamente buen comportamiento; estable pero incorrecto es un fallo.
  • Las muestras públicas no divulgan material futuro de prueba.