
Il report di Anthropic sull'IA auto-migliorante, il restyling della memoria di OpenAI e aggiornamenti di settore
Anthropic pubblica un report sull'IA ricorsiva auto-migliorante, OpenAI introduce la memoria 'onirica' per ChatGPT, e i principali laboratori di IA si uniscono per affrontare i rischi delle armi biologiche. Inoltre, trattiamo la nuova garanzia di produttività di Cognition, il rilascio di Nemotron 3 Ultra di Nvidia e le nuove strategie nazionali per l'IA di Stati Uniti, Giappone e Canada.
Podcast В· 2 min
Anthropic traccia il percorso verso l'auto-miglioramento ricorsivo
Anthropic ha pubblicato un report intitolato 'Quando l'IA costruisce se stessa', che descrive lo stato attuale dei sistemi di auto-miglioramento ricorsivo (RSI). L'azienda ha rivelato che Claude sta già accelerando in modo significativo il suo sviluppo interno, con oltre l'80% del codice di produzione unito a maggio 2026 scritto dal modello. Gli ingegneri di Anthropic ora uniscono 8 volte più codice al giorno rispetto al 2024. Sebbene Anthropic sottolinei che l'auto-miglioramento completamente autonomo non è ancora inevitabile, i dati suggeriscono che i modelli stanno diventando sempre più capaci di gestire il livello esecutivo dello sviluppo dell'IA—scrivere codice, fare debug ed eseguire esperimenti. L'azienda sottolinea che, sebbene gli esseri umani mantengano il controllo sulla definizione della direzione e sul giudizio, il ciclo di feedback si sta stringendo. Questo sviluppo evidenzia un cambiamento nel modo in cui operano i laboratori di frontiera. Man mano che i modelli migliorano nell'esecuzione, il ruolo dei ricercatori umani si sta restringendo verso la strategia di alto livello e la verifica. Anthropic ha indicato la volontà di rallentare o fermare lo sviluppo se i laboratori peer si impegnano in una coordinazione simile, riconoscendo i potenziali rischi di sistemi che possono costruire i propri successori.
I laboratori di IA si uniscono per affrontare i rischi delle armi biologiche
I CEO di OpenAI, Anthropic, Google DeepMind e Microsoft hanno firmato una lettera aperta esortando il Congresso degli Stati Uniti a implementare regolamentazioni più severe per i venditori di DNA e RNA sintetico. I dirigenti avvertono che i sistemi di IA ora superano i virologi con dottorato di ricerca nelle procedure tecniche di laboratorio, creando il rischio che attori malintenzionati possano sfruttare l'IA per progettare armi biologiche. La lettera chiede lo screening obbligatorio degli ordini, la verifica dell'acquirente e la registrazione delle vendite per garantire che le sequenze biologiche pericolose rimangano tracciabili. I firmatari, tra cui Sam Altman, Dario Amodei, Mustafa Suleyman, Alexandr Wang e Demis Hassabis, sostengono che le barriere di conoscenza che storicamente impedivano la creazione di armi biologiche si stanno erodendo a causa dei progressi dell'IA. Questa rara dimostrazione di unità tra laboratori rivali sottolinea la crescente preoccupazione del settore riguardo alla duplice natura dei modelli di frontiera. La proposta riflette una spinta più ampia verso quadri legislativi in grado di tenere il passo con le capacità dell'IA, in particolare nei domini in cui il potenziale di danno è elevato.
OpenAI aggiorna ChatGPT con la memoria 'onirica'
OpenAI ha introdotto un nuovo sistema di memoria per ChatGPT incentrato sul 'sogno', un processo in background che sintetizza le interazioni passate in un profilo strutturato e categorizzato dell'utente. Questo aggiornamento sostituisce il precedente elenco di fatti isolati con un riepilogo in esecuzione, consentendo una personalizzazione più coerente e un contesto in evoluzione nel tempo. Gli utenti possono rivedere, correggere o eliminare memorie specifiche e istruire il modello a ignorare determinati argomenti. OpenAI riferisce che il richiamo fattuale è migliorato dal 41,5% all'82,8% durante le valutazioni, mentre il follow-up delle preferenze è passato dal 31,4% al 71,3%. La funzionalità è attualmente in fase di distribuzione per gli utenti Plus e Pro negli Stati Uniti, con un rilascio più ampio previsto nelle prossime settimane. Questa mossa fa parte di una strategia più ampia per aumentare l'attrattività delle piattaforme di IA. Creando un contesto continuo e proattivo, OpenAI mira ad approfondire il coinvolgimento degli utenti e a differenziare il proprio servizio dalla concorrenza, avvicinandosi alla visione di assistenti IA iper-personalizzati.
Cognition offre una garanzia di produttività IA da 10 milioni di dollari
Cognition ha lanciato una 'Garanzia di produttività IA' per i clienti aziendali che utilizzano il suo agente Devin. L'azienda promette che se Devin fornisce un valore ingegneristico inferiore al costo del servizio, Cognition finanzierà l'utilizzo fino a quando non lo farà, con un tetto massimo di 10 milioni di dollari. Il sistema di misurazione valuta se il lavoro dell'agente è stato utile e stima il tempo che un ingegnere umano avrebbe impiegato per le stesse attività. Questa iniziativa affronta una critica comune nel mercato dell'IA aziendale: la difficoltà di quantificare il ROI effettivo degli strumenti di IA oltre a metriche come token o messaggi. Legando il suo successo finanziario a risparmi di tempo tangibili, Cognition sta tentando di stabilire un nuovo standard di responsabilità nello spazio dell'IA agentica. Per i CFO aziendali e i responsabili dell'ingegneria, questo rappresenta un passaggio dall'adozione speculativa dell'IA all'approvvigionamento basato sulle prestazioni. Segnala che il mercato si sta muovendo verso una fase in cui i fornitori di IA devono dimostrare il proprio valore attraverso risultati concreti e misurabili.
Nvidia rilascia il modello aperto Nemotron 3 Ultra da 550B
Nvidia ha rilasciato Nemotron 3 Ultra, un modello di ragionamento completamente aperto con 550 miliardi di parametri, progettato specificamente per agenti a lunga durata. Il modello presenta una finestra di contesto di 1 milione di token ed è ottimizzato per un'inferenza più rapida, con Nvidia che afferma che funziona 5 volte più velocemente e fino al 30% più economico per attività agentiche rispetto alle iterazioni precedenti. Il rilascio è significativo per l'ecosistema open source, fornendo agli sviluppatori un'alternativa ad alte prestazioni ai modelli di frontiera proprietari. Concentrandosi sull'efficienza e sul ragionamento a lungo contesto, Nvidia mira ad abbassare la barriera per la creazione di agenti complessi e autonomi che richiedono prestazioni sostenute e affidabili. Ci si aspetta che questo modello sia un componente chiave per gli sviluppatori che creano flussi di lavoro agentici che necessitano di elaborare grandi quantità di dati senza fare affidamento esclusivamente su API closed-source, decentralizzando ulteriormente l'infrastruttura per le applicazioni IA avanzate.
Strategie nazionali per l'IA: la partnership USA-Giappone e 'IA per tutti' del Canada
Gli Stati Uniti e il Giappone hanno annunciato una partnership di ricerca sull'IA da 1 miliardo di dollari, segnando la prima collaborazione internazionale nell'ambito della Missione Genesis statunitense, che mira a raddoppiare la produzione scientifica utilizzando l'IA. Questo investimento sottolinea l'importanza strategica dell'IA nelle alleanze geopolitiche e nel progresso scientifico. Contemporaneamente, il Primo Ministro canadese Mark Carney ha lanciato 'IA per tutti', una strategia nazionale quinquennale che mira a 200 miliardi di dollari di crescita economica e alla creazione di 250.000 posti di lavoro legati all'IA. La strategia si concentra sull'integrazione dell'IA nell'economia canadese per aumentare la produttività e la competitività. Queste iniziative evidenziano una tendenza globale in cui le nazioni stanno formalizzando le loro politiche sull'IA per assicurarsi la leadership economica e tecnologica. Poiché l'IA diventa un motore critico del PIL, i governi stanno passando sempre più dall'osservazione passiva all'investimento attivo e alla pianificazione strategica.