Informes de benchmark
Informes IPB
Los informes públicos IPB son artefactos de evidencia acotados, no lanzamientos sorpresa de rankings. El dominio actual es Enterprise Copilot Safety v0.2.
Enterprise Copilot Safety v0.2
La publicación pública está programada para el 22 de julio de 2026. Los informes incluirán hallazgos acotados, gráficos, salvedades, estado de respuesta de proveedores cuando corresponda y ejemplos públicos seguros. La generación viva de corpus, conjuntos retenidos y material futuro de prueba permanecen cerrados.
Publicación programada
Frontier Model Reports
El primer conjunto de informes frontier está acotado a IPB Enterprise Copilot Safety v0.2. La publicación pública queda condicionada a validación de evidencia, vista previa privada de proveedores, revisión de impugnaciones, redacción pública segura, revisión de salvedades y aprobación de publicación.
Puntuación principal del protocolo
22 de julio de 2026
Descarga disponible el 22 de julio de 2026
Corrección frente a estabilidad
22 de julio de 2026
Descarga disponible el 22 de julio de 2026
En preparación
Open-Weight Model Reports
La rama open-weight usará la misma metodología ECS v0.2 y los mismos límites de divulgación pública, con contexto adicional de reproducibilidad para configuraciones descargables cuando corresponda.
Puntuación principal del protocolo
22 de julio de 2026
Descarga disponible el 22 de julio de 2026
Corrección frente a estabilidad
22 de julio de 2026
Descarga disponible el 22 de julio de 2026
No-afirmaciones del informe
- IPB no es un ranking universal de inteligencia.
- IPB no afirma que un modelo sea globalmente seguro.
- IPB no es certificación.
- IPB no sustituye revisión legal, regulatoria, de seguridad, médica, financiera ni de cumplimiento.
- Los resultados IPB están acotados al dominio, versión de protocolo, versión de corpus, identidad del modelo o sistema y configuración de ejecución declarados.
- Comportamiento estable no significa automáticamente buen comportamiento; estable pero incorrecto es un fallo.
- Las muestras públicas no divulgan material futuro de prueba.