News

OpenAI Rivela GPT-4o: Innovazioni Multimediali e Polemiche sulla Voce ‘Sky’

Published

on

OpenAI ha lanciato ufficialmente GPT-4o, un avanzato chatbot che rappresenta un significativo passo avanti nell’intelligenza artificiale multimodale. A differenza delle versioni precedenti come GPT-4, che utilizzavano modelli separati per elaborare testo, audio, immagini e video, GPT-4o adotta un’architettura unificata che consente di gestire input combinati in modo integrato e coerente.

Una delle caratteristiche più promettenti di GPT-4o è la sua capacità di sostenere conversazioni vocali naturali e umane, segnalandosi per la voce denominata “Sky”. Tuttavia, l’entusiasmo iniziale è stato rapidamente sopraffatto da controversie riguardanti il timbro della voce, simile a quello dell’attrice Scarlett Johansson nel film “Her”. Nonostante il rifiuto dell’attrice di collaborare, OpenAI ha continuato a sviluppare una voce che molti hanno trovato troppo simile a quella di Johansson, suscitando preoccupazioni riguardo all’appropriazione non autorizzata della sua identità vocale.

Al di là di queste polemiche, GPT-4o offre una serie di funzionalità avanzate che vanno ben oltre il semplice testo:

  1. Generazione di Testo in Immagini: Rispetto alle versioni precedenti, GPT-4o eccelle nella generazione di testo integrato in immagini, mantenendo coerenza e precisione anche in contesti complessi come renderizzazioni 3D.
  2. Elaborazione dei Contenuti Video: GPT-4o supporta il caricamento e la sintesi video, fornendo trascrizioni complete e riepiloghi dei concetti chiave.
  3. Supporto Educativo: In collaborazione con Khan Academy, GPT-4o funge da tutor virtuale, offrendo spiegazioni dettagliate e personalizzate in diverse materie.
  4. Assistente per Riunioni di Lavoro: Utilizzato come assistente durante riunioni e call di gruppo, GPT-4o facilita la comunicazione e la sintesi delle discussioni.
  5. Ampio Supporto Linguistico: Oltre all’inglese, GPT-4o supporta efficacemente diverse lingue minori, migliorando l’accessibilità globale.
  6. Eccellenza nei Benchmark: GPT-4o ha dimostrato prestazioni eccezionali in benchmark di riferimento, superando i competitor sia proprietari che open source.

Inoltre, OpenAI ha reso alcune funzionalità di GPT-4o gratuite per tutti gli utenti, ampliando l’accesso ai GPT personalizzati che precedentemente erano disponibili solo a pagamento.

Nonostante le criticità iniziali, GPT-4o si conferma un passo significativo verso l’intelligenza artificiale multimodale, con applicazioni potenzialmente rivoluzionarie in vari settori, dall’istruzione alla comunicazione aziendale.

source

Le più Lette

Exit mobile version