Skip to content

Pilar 2 — Modelo Soberano

La tesis. Construir un modelo soberano sobre los datos propietarios del fideicomiso: primero inferencia en la región sobre pesos abiertos detrás de la misma costura de proveedor — los datos nunca salen de la jurisdicción —, después ajuste fino y destilación cuando el corpus lo justifique. Los hechos viven en RAG con citas deterministas; los pesos solo aprenden comportamiento. Nunca horneamos hechos en el modelo, porque romperíamos el foso de la procedencia.

Es el segundo pilar del ciclo: consume el corpus del fideicomiso (1 → 2) y alimenta tanto la gobernanza (2 → 3) como la inteligencia de frontera (2 → 4).

La soberanía es un toggle de proveedor, no una reescritura

El bucle del agente de chat está escrito en la Anthropic Messages API (system + cache_control + tool_use). La resolución de proveedor vive en un solo lugar — server/chat/provider.ts — y selecciona por primera coincidencia:

  1. SOVEREIGN_INFERENCE_URL + SOVEREIGN_INFERENCE_KEY configurados → enruta a un endpoint autohospedado / en-región de pesos abiertos que habla la Messages API. Este es el modo soberano.
  2. OPENROUTER_API_KEY configurado → enruta vía OpenRouter (endpoint nativo Anthropic).
  3. ANTHROPIC_API_KEY configurado → llama a api.anthropic.com directamente.
  4. Ninguno → no configurado (el chat emite el evento not_configured).

La rama soberana es la costura de sovereignty del pilar: apunta el mismo bucle Messages a una pasarela en jurisdicción (LiteLLM/vLLM detrás de un shim Messages, sirviendo Llama, Qwen, DeepSeek o Mistral) de modo que el corpus y la consulta nunca dejan el host soberano. Solo cambia el baseURL — el bucle del agente, las herramientas y la disciplina de fundamentación son idénticos.

Por qué esto importa

La soberanía de datos no se consigue con una promesa contractual de "no miramos tus datos". Se consigue haciendo que los datos y la inferencia vivan físicamente dentro de la jurisdicción de la región. Como el bucle es idéntico entre proveedores, cambiar a soberano no degrada la lógica — solo cambia dónde ocurre el cómputo.

El badge "modo soberano" en el chat

activeProviderInfo() es la única fuente de verdad sobre la identidad del proveedor. Se serializa al cliente como el evento SSE provider, y la interfaz muestra un badge de "modo soberano" cuando sovereign: true — es decir, cuando la consulta y el corpus se quedan en un host en-región / autohospedado. El usuario ve, en cada respuesta, dónde corrió la inferencia. La garantía es visible, no una nota al pie.

La regla RAG-no-fine-tune: el foso de la procedencia

La decisión de arquitectura más importante del pilar: los hechos nunca se hornean en los pesos.

  • Los hechos viven en RAG. Cada figura que el modelo cita proviene del corpus recuperado en tiempo de consulta, ligada a un citation_id determinista. La respuesta es fundamentada y verificable contra la fuente primaria.
  • Los pesos solo aprenden comportamiento. El ajuste fino, cuando llegue, enseña cómo razonar y responder — no qué es cierto. Un peso no puede citar su fuente; un pasaje recuperado sí.

Hornear hechos en los pesos rompería el foso: un número generado desde los pesos no se puede rastrear hasta una fuente primaria, y la trazabilidad en dos clics es el contrato de toda la plataforma. Por eso el modelo por defecto (Sonnet en la ruta directa/OpenRouter) prioriza la disciplina de fundamentación — ligar el citation_id correcto a cada cifra y aflorar contradicciones entre fuentes — sobre la fluidez cruda.

El camino por fases

FaseQué
AhoraInferencia en la región sobre pesos abiertos detrás de la costura de proveedor. Calidad frontier como default hasta alcanzar paridad en las evaluaciones.
DespuésAjuste fino / destilación sobre el corpus del fideicomiso — con puerta: solo cuando el harness de evaluación (fidelidad / recuperación) demuestre que el corpus lo justifica.

El ajuste fino no es un objetivo por sí mismo. Está condicionado por el harness de evaluación existente: mientras un modelo abierto ajustado no iguale la fidelidad y la calidad de recuperación medidas, la calidad frontier sigue siendo el default. Se avanza cuando los números lo permiten, no antes.

Por qué el foso es el corpus, no los pesos base

Cualquiera puede descargar Llama o Qwen. Los pesos base son un commodity. Lo que no es un commodity es un corpus con procedencia verificada y licencia limpia de 25 países — construido por el fideicomiso, imposible de raspar, y ligado cifra por cifra a su fuente. El modelo soberano es valioso no porque sus pesos sean secretos, sino porque está fundamentado en datos que nadie más tiene y que puede citar de forma determinista.

Esto invierte la intuición habitual sobre modelos: el activo defendible no está adentro del modelo, está en el corpus que lo fundamenta y en la disciplina que garantiza que cada respuesta se remonta a él.

Verificación

Todo lo anterior se verifica contra server/chat/provider.ts (selección de proveedor, usingSovereign(), activeProviderInfo()). La disciplina de fundamentación y el harness de evaluación se detallan en la página del asistente y en metodología.

Superficies relacionadas

  • El asistente fundamentado vive en /sala y a lo largo de la plataforma.
  • El badge de proveedor aparece en cada respuesta del chat.

Sigue el ciclo: los resultados de este modelo sirven a la gobernanza democrática y a la inteligencia de frontera.

Cada cifra con su fuente — la trazabilidad es el contrato.