25 Novembre 2008

Il Netflix Prize ed il paradosso Napoleon Dynamite





Del Netflix Prize abbiamo avuto modo di parlare già in due occasioni: una volta per annunciare l’avvio delle iscrizioni a questo insolito quanto intrigante concorso, e una seconda volta per descrivere l’entusiasmo che si estese presto a tutta la comunità di appassionati (statistici, nerds, informatici, ecc.) che decisero di cimentarsi.
Ricordiamo in breve che Netflix è una nota azienda statunitense specializzata nel noleggio di film in dvd e videocassette, che per migliorare il proprio sistema di suggerimento dei titoli ha indetto un concorso il cui premio finale sarebbe consistito di una cifra pari ad 1 milione di dollari.
Il vincitore avrebbe dovuto sviluppare un algoritmo che meglio prevede quale film suggerire ad un cliente sulla base dello storico dei suoi acquisti.
Netflix mise così a disposizione un grande database di titoli e di voti ai film, assegnati nel passato dai propri clienti, e gratuitamente scaricabile da tutti i partecipanti.

Nonostante lo scorso 13 novembre sia stato proclamato un primo vincitore (il team KorBell) che ha intascato un premio di 50.000 dollari per aver sviluppato un algoritmo in grado di eseguire previsioni con un RMSE (Radice dell’Errore Quadratico Medio) pari a 0,8712, il concorso continua a generare discussioni su discussioni, a volte assai stimolanti.
L’ultima in ordine di tempo è quella descritta da un recente articolo del New York Times, in cui vengono illustrate le considerazioni di Len Bertoni, un informatico che si è iscritto al concorso, e che ha espresso serie perplessità sulla possibilità di superare l’attuale valore di RMSE (0,87).
Nella sostanza esso introduce una sorta di paradosso legato ad un particolare titolo della cinematografia statunitense: “Napoleon Dynamite”.

“Napoleon Dynamite”, per chi non lo conoscesse è un film cult, in cui vengono mischiati vari generi, dal comico al grottesco, dal sentimentale al drammatico. Un film, per certi versi “difficile da inquadrare” e da classificare in alcun modo.
Bertoni sostiene infatti di aver prodotto un numero di algoritmi di suggerimento, tutti quanti in grado di superare quota 8,8 di RMSE, ma tutti quanti soggetti pure ad un tasso d’errore elevatissimo lì dove le previsioni fossero eseguite su un campione contenente “Napoleon Dynamite”, o altri film cult quali “Lost in Translation”, “Le Avventure Acquatiche di Steve Zissou”, “Kill Bill” ed altri.
Nella sostanza Bertoni introduce una questione legata all’estrema peculiarità di alcuni soggetti, difficilmente inquadrabili attraverso qualsiasi sistema computerizzato di suggerimento.

Postato il 25/11/2008 10.19.21 in | Commenti (0) |
Scrivi |

Commenti


Inserisci il tuo commento

Stat Project è uno spazio aperto a vostra disposizione, è creato per confrontarsi direttamente. L'immediatezza della pubblicazione dei vostri commenti non permette filtri preventivi. L'utilità di Stat Project dipende dalla vostra collaborazione per questo motivo voi siete i reali ed unici responsabili del contenuto e delle sue sorti.

Avvertenze da leggere prima di intervenire su Stat Project

Non sono consentiti:
- messaggi anonimi (cioè senza nome e cognome)
- messaggi pubblicitari (a meno di autorizzazione volutamente espressa dall'amministratore del sito)
- messaggi con linguaggio offensivo
- messaggi che contengono turpiloquio
- messaggi con contenuto razzista o sessista
- messaggi il cui contenuto costituisce una violazione delle leggi italiane (istigazione a delinquere o alla violenza, diffamazione, ecc.)

Comunque l'amministratore del sito potrà in qualsiasi momento, a suo insindacabile giudizio, cancellare i messaggi.
In ogni caso l'amministratore del sito non potrà essere ritenuto responsabile per eventuali messaggi lesivi di diritti di terzi.




Si ricorda che saranno eliminati i messaggi anonimi (quindi privi di
nome e cognome reali)




Validazione Form*

Prima di inviare questo form, digitare le lettere visualizzate sopra:





* Campi obbligatori

Informativa art. 13 D.lgs. 196/2003
Desideriamo informarla che il D.lgs. n. 196/2003 prevede la tutela delle persone e di altri soggetti rispetto al trattamento dei dati personali.
Secondo la normativa indicata, tale trattamento sarà improntato ai principi di correttezza, liceità e trasparenza e di tutela della Sua riservatezza e dei Suoi diritti.
Ai sensi dell'art. 13 del D.lgs. n.196/2003, Le forniamo, quindi, le seguenti informazioni:
- I dati da Lei forniti verranno trattati esclusivamente per finalità concernenti l'attività informativa del sito
- Il conferimento dei dati è facoltativo e l'eventuale rifiuto a fornire tali dati non ha alcuna conseguenza.
- I dati da Lei forniti non saranno oggetto di diffusione.