GPU integrate — Rob Labs

Per anni le GPU integrate sono state considerate la scelta di ripiego — abbastanza per guardare un video, insufficienti per qualsiasi cosa seria. Questa reputazione è diventata obsoleta. Le iGPU moderne sono motori di calcolo capaci, e in alcuni scenari competono con schede discrete di fascia media.

Le origini: video e basta

Le prime GPU integrate, come la Intel GMA degli anni 2000, erano progettate per un compito solo: decodificare video e gestire l'output sul monitor. Non avevano shader programmabili, non supportavano API grafiche moderne e consumavano memoria di sistema condivisa con la CPU in modo inefficiente.

La svolta arriva con Intel HD Graphics (2010) e poi con AMD APU della serie Fusion. Per la prima volta le iGPU supportano DirectX 11 e shader programmabili, aprendo la porta al gaming leggero e soprattutto al compute general-purpose.

OpenCL e il compute generale

OpenCL è il framework che ha trasformato le GPU da acceleratori grafici a processori paralleli generici. Qualsiasi GPU moderna — discreta o integrata — può essere usata per eseguire calcoli arbitrari in parallelo su migliaia di core, non solo per il rendering.

Per le iGPU questo è stato rivoluzionario: la stessa architettura usata per renderizzare l'interfaccia grafica può accelerare la codifica video, l'inferenza di modelli di intelligenza artificiale, la crittografia e molto altro.

Intel Arc, presente nei processori Meteor Lake e Arrow Lake come iGPU, supporta le stesse API hardware delle schede Arc discrete: DirectX 12 Ultimate, Vulkan, OpenCL e le estensioni XMX per l'accelerazione AI.

Intel Arc integrata: una discontinuità

Con Meteor Lake (2023) Intel ha smesso di usare la vecchia architettura Iris Xe e ha integrato un vero e proprio die grafico Arc nel package del processore. Non si tratta di una versione ridotta — è la stessa architettura Alchemist usata nelle schede discrete Arc A-series, con lo stesso supporto hardware per ray tracing, mesh shader e le unità XMX per il calcolo matriciale.

La differenza rispetto a una scheda discreta è la larghezza di banda di memoria: una scheda discrete ha GDDR6 dedicata con centinaia di GB/s, mentre l'iGPU condivide la RAM di sistema. Su piattaforme con LPDDR5X on-package la banda disponibile è comunque sufficiente per gaming leggero e per l'inferenza di modelli LLM di piccole dimensioni.

L'inferenza AI: il caso d'uso emergente

Le unità XMX (Xe Matrix Extensions) presenti in Intel Arc sono progettate per il calcolo matriciale — le operazioni fondamentali dei modelli di deep learning. Questo rende le iGPU Arc sorprendentemente capaci per l'inferenza locale di modelli linguistici di piccole e medie dimensioni.

Con i driver e il software giusto, un processore con iGPU Arc è in grado di eseguire modelli da 7 miliardi di parametri a velocità accettabili per uso interattivo — qualcosa di impensabile con le precedenti generazioni di grafica integrata.

Il futuro delle iGPU

La traiettoria è chiara: le iGPU diventano sempre più capaci e sempre più orientate al compute oltre che alla grafica. Con Battlemage (la nuova generazione Arc) e i processori Arrow Lake, Intel continua a investire nella qualità del driver e nell'ottimizzazione per i workload AI.

Per chi non ha bisogno di gaming pesante o rendering 3D professionale, una iGPU moderna è più che sufficiente — e per certi use case specifici come l'inferenza AI locale, è diventata una scelta attivamente preferibile a molte GPU discrete di fascia bassa.

GPU integrate: da acceleratori video a motori di calcolo generale

Le origini: video e basta

OpenCL e il compute generale

Intel Arc integrata: una discontinuità

L'inferenza AI: il caso d'uso emergente

Il futuro delle iGPU