VETO — Motore di Verifica
Motore di verifica epistemica multi-modello che valida affermazioni scientifiche tramite deliberazione adattiva a giuria, con riduzione dei costi del 90% rispetto agli approcci brute-force.
Panoramica
Perché la Verifica è Fondamentale
Nell'era dei contenuti generati dall'AI, la capacità di verificare affermazioni scientifiche su larga scala non è più opzionale — è infrastruttura. VETO affronta questo problema fornendo una pipeline di verifica trasparente, cost-efficient e model-agnostic che tratta ogni asserzione come un'ipotesi da testare.
A differenza degli strumenti di fact-checking generici, VETO è progettato specificamente per domini scientifici e tecnici, dove sfumature, integrità delle citazioni e triangolazione multi-source sono essenziali.
Capacità Principali
- Cost Pyramid: triage intelligente delle affermazioni (SKIP → CITATION_ONLY → STANDARD → CRITICAL) che instrada il 90% dei claim attraverso verifiche leggere, riservando la deliberazione multi-modello costosa solo per le asserzioni ad alto rischio.
- Giuria Adattiva: parte con 3 giudici e scala in caso di disaccordo — non 9 modelli per default. Questo mantiene i costi prevedibili garantendo consenso rigoroso sui claim contestati.
- Source Fabric: motore di retrieval gerarchico capace di cercare tra oltre 10.000 fonti con deduplicazione e ranking semantico.
- Convergence Loop: deliberazione iterativa con 5 circuit breaker per prevenire costi fuori controllo e loop infiniti.
Specifiche tecniche
Architettura in Dettaglio
- ClaimClassifier: modello locale a 8 miliardi di parametri per il triage dei claim — zero costi API per la classificazione.
- CitationVerifier: modello DeBERTa NLI per la verifica delle citazioni — nessuna chiamata LLM necessaria per l'ancoraggio alle evidenze.
- HybridReflector: motore di ragionamento template-first che invoca gli LLM solo in caso di conflitto, riducendo il consumo di token fino all'80%.
- Governor: orchestratore budget-aware con tracking dei costi in tempo reale e policy di degradazione graduale.
- Storage: backend SQLite con integrazione completa CLI, SDK e API per deployment senza attriti.
Deployment e Integrazione
- Docker: Dockerfile multi-stage con docker-compose per deployment con un solo comando.
- CI/CD: workflow GitHub Actions con lint + test su Python 3.11/3.12.
- API: interfaccia REST basata su FastAPI per accesso programmatico.
- Estendibile: 6 connector per modelli (Anthropic, OpenAI, Google, Groq, DeepSeek, Mistral) con architettura plug-in per provider custom.
Quality Assurance
VETO viene distribuito con 1.053 test automatizzati che coprono 48 moduli, 8 rubric di verifica e tutti i percorsi di integrazione. La suite di benchmark include 50 claim seed per l'analisi di correlazione e il test di regressione.
Partner di progetto
Nessun partner indicato.
Cronologia
Motore di verifica core con Cost Pyramid e Giuria Adattiva
Source Fabric con retrieval gerarchico su 10K+ fonti
Deployment API e containerizzazione Docker
Benchmark con LLM reali e validazione della correlazione degli errori
Galleria
Nessun media disponibile.