ARM ha svelato i suoi design di CPU e GPU di nuova generazione e sta anche facendo un po’ di rebranding: incontriamo le CPU ARM C1 e le GPU G1, che formeranno il sottosistema di calcolo ARM Lumex (CSS). « Lumex » è il nuovo marchio che ARM utilizzerà per design focalizzati sui dispositivi mobili (per altri, sarà utilizzato « Niva » per PC, « Zena » per automotive e così via).
Questa generazione di design di CPU e GPU porta miglioramenti enormi per carichi di lavoro alla moda (AI, ray tracing), mentre fornisce anche solidi miglioramenti per carichi di lavoro meno appariscenti.
Si noti che ARM ha anche progettato un chipset interno, di cui parleremo in un post separato.
Iniziamo a esaminare le CPU e cominciamo con una tabella di riferimento per aiutarvi a tenere traccia del nuovo branding: Cortex-X e Cortex-A non esistono più!
- Cortex-X9xx → ARM C1-Ultra
- (Nuovo) ARM C1-Premium
- Cortex-A7xx → ARM C1-Pro
- Cortex-A5xx → ARM C1-Nano
Le nuove core C1 sono le prime a essere costruite sull’architettura ARMv9.3. Tutti supportano l’ARM Scalable Matrix Extension 2 (SME2), che accelera i carichi di lavoro di AI, ma migliora anche attività più routine: ad esempio, la decodifica di video HDR è più efficiente del 10% con SME2.
Il ARM C1-Ultra è focalizzato sul miglioramento delle Istruzioni per Ciclo (IPC). Nei compiti single-threaded, il C1-Ultra è fino al 25% più veloce del Cortex-X925.
ARM introduce anche un nuovo livello di core CPU, il ARM C1-Premium. Questo è destinato a design sub-flagship – ha un’area superficiale inferiore del 35% rispetto all’Ultra (il che significa che i chip con esso saranno più economici), offrendo la migliore efficienza areale della categoria (cioè prestazioni per mm² di silicio).
Il core ARM C1-Pro sarà utilizzato per carichi di lavoro prolungati in chip ad alte prestazioni e come core principale per design di fascia media. Rispetto al Cortex-A725, può offrire prestazioni superiori fino al 16% in attività come il gaming. In alternativa, può essere fino al 12% più efficiente dal punto di vista energetico per la riproduzione video, la navigazione web e i social media.
Le modifiche al ARM C1-Nano si concentrano quasi completamente sull’efficienza energetica: questo core minuscolo è fino al 26% più efficiente dal punto di vista energetico rispetto al Cortex-A520. Porta anche un modesto miglioramento delle prestazioni e ha un’area del core più piccola del 2%.
I core CPU saranno orchestrati dal nuovo C1-DynamIQ Shared Unit (DSU). Questo è responsabile di cose come la condivisione della cache L3 tra tutti i core, la gestione dell’energia per i core e altro. Il nuovo DSU consente risparmi energetici fino al 26% rispetto al precedente DSU-120.
Un cluster di CPU ARM C1 può essere configurato con un minimo di 1 core CPU e un massimo di 14 core. I progettisti di chipset possono mescolare e abbinare, combinando fino a tre tipi di core, scegliendo tra Ultra, Premium, Pro e Nano.
ARM afferma che per carichi di lavoro reali, un cluster di CPU C1 porta mediamente il 30% di prestazioni in più nei benchmark di settore e un aumento medio del 15% per attività come il gaming e lo streaming video. Inoltre, utilizza mediamente il 12% in meno di energia per attività come la riproduzione video, la navigazione web e i social media rispetto alle CPU di precedenti generazioni.
Come accennato sopra, i nuovi core C1 consentono miglioramenti enormi nelle prestazioni per l’AI attraverso l’estensione SME2. Parliamo di una latenza fino a 4,7 volte più bassa per Whisper Base (un modello di Riconoscimento Vocale Automatico, cioè da voce a testo), prestazioni AI maggiori fino a 4,7 volte per il modello Gemma 3 di Google e generazione audio più veloce di 2,8 volte per Stability AI (un modello da testo ad audio che può generare audio di sottofondo, musica e altro).
Gli sviluppatori di app otterranno le prestazioni migliorate « gratuitamente » sull’hardware di nuova generazione poiché il supporto SME2 è integrato nei principali framework di AI di ARM stesso, Google, Microsoft, Alibaba e Meta.
Secondo un recente studio, un incredibile 83% dei giocatori gioca su mobile. È un affare lucrativo, sia in termini di giochi stessi che di hardware. ARM afferma di aver spedito oltre 12 miliardi di GPU fino ad oggi – e queste sono le più potenti che abbia mai progettato.
Il ARM Mali G1-Ultra introduce una seconda generazione di Ray Tracing Unit (RTUv2), che raddoppia le prestazioni di ray tracing rispetto a quella all’interno della GPU Immortalis-G925.
È importante notare che ci sono più cose nel rendering di una scena di gioco oltre al ray tracing, quindi ci si può aspettare un aumento del 40% del frame rate nei giochi che utilizzano il ray tracing hardware. Inoltre, l’RTUv2 è ora un modulo separato e porta una serie di ottimizzazioni per l’efficienza energetica, inclusa una semplice – può andare in standby quando il sistema è inattivo.
A parte il ray tracing, il Mali G1-Ultra può offrire prestazioni raster superiori del 20% rispetto al G925 nei benchmark di settore. Può anche essere più efficiente dal punto di vista energetico del 9%. Le GPU possono essere utilizzate anche per l’AI e grazie a un nuovo percorso di calcolo matriciale GP16, il G1-Ultra è più veloce del 20% nel ragionamento AI.
Ecco alcuni numeri più concreti su giochi popolari:
| Arena Breakout | +25% |
| Honkai Star Rail | +19% |
| Genshin Impact | +17% |
| Fortnite | +11% |
| Demo di gioco interno di ARM (Mori) | +26% |
Le GPU ARM Mali-G1 possono essere configurate con un numero compreso tra 1 e 24 core shader. Le GPU G1 supportano l’Accuracy Super Resolution (ASR) di ARM, che è la tecnologia di upscaling temporale dell’azienda (pensate a DLSS). Questo è già supportato da Unreal Engine 5 ed è integrato in Fortnite.
Certo, non hai ancora uno smartphone con CPU C1 e GPU G1. ARM afferma che l’hardware di nuova generazione sarà « neglie dispositivi di consumo in un futuro molto prossimo ».
Fonte 1 | Fonte 2