Come funziona la GenAI?

📢 L’AI generativa oggi

Quando si parla di AI generativa in genere si fa riferimento ai cosiddetti “Large Language Models” (LLM), che sono un tipo di AI generativa che viene addestrata per comprendere il linguaggio naturale.

Nonostante sembrino davvero “intelligenti”, questi software di AI generativa in realtà sono enormi modelli statistici che ad ogni “input” (detto “prompt”) restituiscono un output.

<aside> ✅ Large Language Model (LLM) Viene chiamata così la più popolare famiglia di modelli di AI generativa, addestrati per comprendere il linguaggio ed eseguire i nostri comandi (”prompt”).

Nonostante i primi modelli fossero “text-only”, stiamo assistendo alla nascita di modelli che non solo comprendono (e generano) testo, ma anche immagini, audio, video, ecc.

Questi modelli sono detti “multi-modali”, Large Multimodal Models (LMM).

Ad esempio GPT4, Gemini e Claude: i modelli di punta di OpenAI, Google e Anthropic, sono multimodali. In genere si dice che un modello è “Large” quando supera i 50 miliardi di parametri (i “pesetti” numerici del modello statistico).

</aside>

Dove si “trovano” gli LLM❓

I modelli GenAI di linguaggio come GPT4 sono, in pratica, file che contengono ******numeri, ossia i valori dei “neuroni” del modello, rappresentati dalla rete neurale Transformer.

Spesso il file del modello contiene anche dei metadati che descrivono come questi numeri sono collegati fra di loro, dando informazioni sull’architettura del modello (quanti strati ha la rete, come sono collegati gli strati, ecc.).

Quindi nella pratica un modello di GenAI è un file unico, dal peso variabile (tra qualche centinaio di MB, a centinaia di GB per i modelli più grandi).

In genere sono ospitati nel Cloud, ovvero nei datacenter delle varie Big Tech.

Ad esempio i modelli di OpenAI sono ospitati in Azure, il cloud di Microsoft, Amazon ospita i suoi modelli su AWS, e così via.

Esistono anche tantissimi modelli open source, in genere di dimensioni più ridotte, che possono essere ospitati anche in locale, addirittura su pc portatili, o su altri dispositivi a bassa potenza.

In genere tutte le piattaforme cloud offrono la possibilità di ospitare propri modelli, e spesso ne forniscono centinaia di “già pronti”.

Come accediamo agli LLM❓