L'AI di DeepMind riconosce il labiale meglio degli umani professionisti

Caricamento in corso. Per commentare attendere...

Leox9124 Nov 2016 @ 05:51

Guarda ci lavoro da 2 anni quindi conosco abbastanza e, visto che vuoi fare flame, potresti spiegarmi dov'è il senso nel testare un NN su dati che ha già visto, grazie. :)

Zeph24 Nov 2016 @ 05:49

Non per fare flame ma... forse dovresti studiare un pò di machine learning e le principali tecniche di apprendimento

Leox9124 Nov 2016 @ 05:43

Bhe non è facile fare un esempio che sia alla portata di tutti, provaci tu se vuoi. Il punto è che loro hanno testato su dati utilizzati per trainare, quindi il fatto che abbiano diviso in 3 set non c'entra niente: hanno preso risultati usando dati già visti in precedenza.

istin24 Nov 2016 @ 05:41

C'è comunque training, validation e test set. Inoltre -non so se lo hai letto - sul pdf dicono chiaramente che le registrazioni usati sono di vario tipo e vanno dal 2010 al 2016, preservando così l'eterogeneità del campione anche in fase di test. Ovviamente c'è un bias, come in tutti i dataset d'altronde, ma è accettabilissimo e ciò rende il tuo paragone con i formaggi del tutto fuori luogo ;)

ErCipolla24 Nov 2016 @ 01:40

Idem a te, visto che non hai notato il ":D"

superfrenc24 Nov 2016 @ 01:33

Ironia, questa sconosciuta...

Emanuele Gori24 Nov 2016 @ 01:06

Certo, come no! Con la qualità dei video di allora e il fatto che le inquadrature non erano quasi mai dei primi piani durante le conversazioni sarà facilissimo per l'IA leggere le labbra!!!!

Roland24 Nov 2016 @ 12:34

Doppiaggio questo sconosciuto

Leox9124 Nov 2016 @ 12:28

Certo questo a tutti voi sembra un risultato importante.

Tuttavia vi invito a leggere fra le righe, la frase: "200 dei video della BBC ->usati per formare l'intelligenza artificiale<-". Questo significa che la rete neurale aveva GIA' VISTO precedentemente quei video, e quindo non ha GENERALIZZATO, ma ha usato il suo MODELLO sugli stessi dati che ha usato per MODELLARE! Non so se sono stato abbastanza chiaro: è come se noi giudicassimo un tipo di formaggio provando solo quelli che già conosciamo.

Attenzione a questi risultati, per quanto possano essere notevoli, non sempre sono davvero significativi: cosa succederebbe se ora IO andassi di fronte la telecamera e parlassi? Mi riconoscerebbe? Difficile, perché io mi DISCOSTO molto dal SUO MODELLO. Io non sono previsto nei suoi dati.

Esistono inoltre molte pubblicazioni che effettuano riconoscimento del labbiale, e con precisione maggiore, tuttavia su un training set minore, vi invito a cercarle.

Riconosco sempre i meriti, ma questo mi sembra un pò tirato.

M.5.0 il 24 Nov 2016 @ 12:04

Beh dipende...grandi o piccole?

boosook24 Nov 2016 @ 11:59

Spettacolare. Pensate all'utilita' che avrebbe per i non udenti in accoppiata con un paio di google glass (chissa' se mai li rivedremo...)

boosook24 Nov 2016 @ 11:57

Grandissima citazione, complimenti! :)

boosook24 Nov 2016 @ 11:57

Piu' che altro sara' divertente scoprire che magari dicevano parole a caso! :)

sardanus24 Nov 2016 @ 11:24

c'è qualcuno che fa ancora film muti? :D

24 Nov 2016 @ 11:20

Dove posso scaricare l'app?

Roland24 Nov 2016 @ 11:17

Azz..dovrò iniziare ad affiancare una bandana al cappello di stagnola

Peppol24 Nov 2016 @ 11:06

non dureremo molto google ha pronta la distruzione del genere umano

Tbrt24 Nov 2016 @ 11:05

serve per i suggerimenti senza voce (e/o frecciatine) :)

TeoCrysis24 Nov 2016 @ 11:03

https://uploads.disquscdn.com/...

Giovanni Vaccaro24 Nov 2016 @ 10:58

In quel caso ti registrano col microfono

ciro24 Nov 2016 @ 10:53

Cosa devo studiare per diventare lettore di labbra professionista? Non fate battute sulla parola labbra.

ErCipolla24 Nov 2016 @ 10:51

Francamente non penso sia l'ambito di applicazione principale sai :D

ErCipolla24 Nov 2016 @ 10:50

Stiamo arrivando ad avere abbastanza potenza di calcolo per cominciare ad ottenere risultati notevoli con le tecniche di machine learning, ma soprattutto per poter applicare questi risultati ai servizi "al pubblico" e non solo nei laboratori... negli anni a venire ho idea che ne vedremo delle belle.

Emanuele24 Nov 2016 @ 10:50

Aggiungere il sonoro ai film muti è proprio una priorità eh...

Tbrt24 Nov 2016 @ 10:48

Viva la fotocamera frontale del pc o del telefono! A parte gli scherzi può essere davvero un passo importante

Raffael 24 Nov 2016 @ 10:42

Impressionante!!!

L'AI di DeepMind riconosce il labiale meglio degli umani professionisti

Commenti