Apple potenzierà l'assistenza vocale rilevando la posizione delle sorgenti sonore

22 Gennaio 2021 8

Una nuova ricerca mostra che Apple sta studiando come gli smart speaker o altri dispositivi con assistenza vocale integrata potrebbero utilizzare l'audio per stimare la distanza da un utente che parla, anche per identificare con maggior precisione i suoni intorno ad esso.

Allo stato attuale i dispositivi come HomePod, Google Home e le varie proposte con Alexa sono in grado di sentire abbastanza bene la voce anche quando si riproduce musica ad alto volume, ma due recenti domande di brevetto dimostrano che Apple vuole migliorare questa capacità di ascolto e portarla ad un nuovo livello.

Una delle due documentazioni parla di stimare la distanza basandosi sull'apprendimento e riguarda l' uso dell'audio non solo per riconoscere un utente ma anche per capire dove si trova. "Spesso è auspicabile che il dispositivo stimi la distanza dal dispositivo all'utente utilizzando il suo array di microfoni ", afferma la domanda di brevetto. "Ad esempio, il dispositivo può regolare il volume di riproduzione o la risposta di un dispositivo di assistenza intelligente in base alla distanza stimata dell'utente dal dispositivo."


Le implicazioni sono interessanti, ad esempio se un utente è molto vicino al dispositivo, la musica o il parlato potranno non venire riprodotti ad alto volume, o in alternativa, se l'utente è lontano la riproduzione multimediale o la risposta di un dispositivo assistente intelligente potranno essere tarate ad un volume maggiore. Un altro obiettivo collaterale che si pone il brevetto è migliorare il modo in cui un sistema di più assistenti installati in casa valuti correttamente quale attivare tra questi in caso di query.

Tra le soluzioni esposte per migliorare il riconoscimento, Apple propone semplici mappature dell'ambiente che portino alla creazione di una griglia di punti misurati, che permettano di approssimare la posizione in modo sempre più preciso. Ma questa metodologia potrebbe risultare inadeguata con soggetti in movimento, dunque si prende in considerazione anche la possibilità di triangolare la fonte con un sistema di microfoni creato ad hoc. Anche in questo caso ci troveremmo di fronte ad una limitazione di tipo hardware in caso di dispositivi a microfono singolo, pertanto si pensa anche ad una soluzione più complessa che coinvolga un sistema basato sull'apprendimento, come una rete neurale profonda (DNN) che non necessiti di dispositivi particolarmente avanzati.

In questo caso il sistema potrebbe essere allenato a distinguere la voce dai rumori di fondo, calcolando le informazioni relative a suoni attribuibili a semplici rumori di fondo e valutando meglio la propagazione diretta del segnale. Ed è su questo punto che si concentra la seconda domanda di brevetto, vengono infatti presi in considerazione diversi scenari d'utilizzo che allo stato attuale non possono essere gestiti efficacemente dai sistemi di comune utilizzo.

Ad esempio, i dispositivi del futuro potrebbero essere in grado di distinguere il suono di un campanello da quello di un allarme, causando risposte diverse a seconda del contesto. Al momento è difficili dire se sistemi simili verranno sviluppati e integrati in future tecnologie, Apple e molti altri colossi del tech sono soliti depositare un numero elevatissimo di brevetti e molti di essi non sono per forza destinati a tradursi in applicazioni reali.

Il meglio di OnePlus? OnePlus 9 Pro, in offerta oggi da Fc Web Store a 779 euro oppure da Amazon a 839 euro.

8

Commenti

Regolamento Commentando dichiaro di aver letto il regolamento e di essere a conoscenza delle informazioni e norme che regolano le discussioni sul sito. Clicca per info.
Caricamento in corso. Per commentare attendere...
PcPortingPlz

Mai usata un'assistenza vocale in vita mia, sebbene mi consideri piuttosto geek. Continuo a non vederne l'utilità, o meglio è utile come il frigo che ordina la roba in automatico quando si svuota, ovvero per trasformare gli umani in amebe che dipendono dalla tecnologia anche per tenere a mente 3 cose in croce.

Pistacchio
Rick Deckard®

Sull'assistente vocale Apple ha perso terreno. Praticamente ad oggi esistono solo assistant e alexa...
Secondo me è un grave gap perché rende i suoi indossabili poco utili e limita molto in ambito domotica

KenZen

Di che parli?
Saluti

Simone

Prima di potenziare Siri, sistemate la compatibilità di HomeKit con gli accessori di terze parti, salami.

daniele

Ahahhaha

J.A.R.V.I.S.
:D

daniele

Quale assistente vocale?

iPad Pro M1 tra rivoluzione, unificazione, marketing ed evoluzione

AirTag finalmente ufficiali: mai più oggetti smarriti. In Italia dal 23/4 a 35 euro

iPad Pro con Apple M1 è ufficiale: potente come un MacBook!

Apple TV 4K si rinnova con processore A12 Bionic, e c'è anche il nuovo telecomando