25 Novembre 2008
Il Netflix Prize ed il paradosso Napoleon Dynamite

Del Netflix Prize abbiamo avuto modo di parlare già in due occasioni: una volta per annunciare l’avvio delle iscrizioni a questo insolito quanto intrigante concorso, e una seconda volta per descrivere l’entusiasmo che si estese presto a tutta la comunità di appassionati (statistici, nerds, informatici, ecc.) che decisero di cimentarsi.
Ricordiamo in breve che Netflix è una nota azienda statunitense specializzata nel noleggio di film in dvd e videocassette, che per migliorare il proprio sistema di suggerimento dei titoli ha indetto un concorso il cui premio finale sarebbe consistito di una cifra pari ad 1 milione di dollari.
Il vincitore avrebbe dovuto sviluppare un algoritmo che meglio prevede quale film suggerire ad un cliente sulla base dello storico dei suoi acquisti.
Netflix mise così a disposizione un grande database di titoli e di voti ai film, assegnati nel passato dai propri clienti, e gratuitamente scaricabile da tutti i partecipanti.
Nonostante lo scorso 13 novembre sia stato proclamato un primo vincitore (il team KorBell) che ha intascato un premio di 50.000 dollari per aver sviluppato un algoritmo in grado di eseguire previsioni con un RMSE (Radice dell’Errore Quadratico Medio) pari a 0,8712, il concorso continua a generare discussioni su discussioni, a volte assai stimolanti.
L’ultima in ordine di tempo è quella descritta da un recente articolo del New York Times, in cui vengono illustrate le considerazioni di Len Bertoni, un informatico che si è iscritto al concorso, e che ha espresso serie perplessità sulla possibilità di superare l’attuale valore di RMSE (0,87).
Nella sostanza esso introduce una sorta di paradosso legato ad un particolare titolo della cinematografia statunitense: “Napoleon Dynamite”.
“Napoleon Dynamite”, per chi non lo conoscesse è un film cult, in cui vengono mischiati vari generi, dal comico al grottesco, dal sentimentale al drammatico. Un film, per certi versi “difficile da inquadrare” e da classificare in alcun modo.
Bertoni sostiene infatti di aver prodotto un numero di algoritmi di suggerimento, tutti quanti in grado di superare quota 8,8 di RMSE, ma tutti quanti soggetti pure ad un tasso d’errore elevatissimo lì dove le previsioni fossero eseguite su un campione contenente “Napoleon Dynamite”, o altri film cult quali “Lost in Translation”, “Le Avventure Acquatiche di Steve Zissou”, “Kill Bill” ed altri.
Nella sostanza Bertoni introduce una questione legata all’estrema peculiarità di alcuni soggetti, difficilmente inquadrabili attraverso qualsiasi sistema computerizzato di suggerimento.
Postato il 25/11/2008 10.19.21 in Data mining |
Commenti (0)
|
Scrivi
|




