<?xml version="1.0" encoding="ISO-8859-1"?><rss version="0.91"><channel><title>Stat Project</title><description>Novità dal Mondo della Statistica</description><link>http://www.stat-project.com/</link><language>it</language><item><title><![CDATA[Statistica.ning si sta evolvendo]]></title><description><![CDATA[Posso dirmi ampiamente soddisfatto per come stanno procedendo le cose per <a href="http://statistica.ning.com/"><b>Statistica.ning (la Comunità Italiana dedicata alla Statistica)</b></a>. In un solo mese si sono registrati <a href="http://statistica.ning.com/profiles/members/"><b>36 membri</b></a>, sono stati creati <a href="http://statistica.ning.com/groups"><b>14 gruppi</b></a>, sono state aperte <a href="http://statistica.ning.com/forum"><b>4 discussioni nel forum</b></a>, ed infine sono stati pubblicati <a href="http://statistica.ning.com/profiles/blog/list"><b>7 post sul blog</b></a>.<br>
Nei prossimi cercherò di ampliare ulteriormente la gamma di servizi e contenuti offerti dalla piattaforma, contando nella collaborazione di tutti coloro che desiderano far parte integrante della comunità.<br><br>

Un saluto a tutti
DS]]></description><link><![CDATA[http://www.stat-project.com/commenti.asp?ID=629]]></link></item><item><title><![CDATA[Vinci “The Visual Display of…”  di Edward Tufte contribuendo ad arricchire la Comunità Statistica]]></title><description><![CDATA[Stat Project regala una copia di <a href="http://www.stat-project.com/commenti.asp?ID=384"><b>“The Visual Dislay of Quantitative Information” di Edward Tufte</b></a> a chiunque entro il 17 di Gennaio 2010 contribuirà in maggior misura ad arricchire i contenuti della <a href="http://statistica.ning.com/"><b>Comunità Statistica (statistica.ning.com)</b></a> attraverso:<br> L’inserimento di discussioni all’interno dei diversi <a href="http://statistica.ning.com/"><b>Gruppi</b></a><br> La risposta a domande inserite nei diversi <a href="http://statistica.ning.com/forum"><b>Forum</b></a><br> L’inserimento di post sul <a href="http://statistica.ning.com/profiles/blog/list"><b>Blog</b></a><br> Naturalmente lo spam nonché i contenuti ritenuti inutili, ricopiati da altre sorgenti o fuori tema non saranno considerati al fine dell’assegnazione del “premio”.<br><br> Accorrete numerosi!]]></description><link><![CDATA[http://www.stat-project.com/commenti.asp?ID=628]]></link></item><item><title><![CDATA[Siete tutti invitati a far parte della Comunità Statistica]]></title><description><![CDATA[In molti avrete notato come per almeno un paio di mesi, Stat Project sia stato aggiornato molto più sporadicamente. In realtà mi scuso con gli affezionati lettori del mio blog e con chiunque, abituato a vedere questo portale aggiornato almeno 3 volte alla settimana, abbia sofferto questa improvvisa “latitanza informativa”.<br> Spero però che il lavoro speso in questo periodo, e quindi sottratto a Stat Project, potrà essere di vs. gradimento. Mi sono infatti occupato della definizione di un vero e proprio Social Network su piattaforma Ning, a cui spero aderirete tutti al più presto.<br> Personalmente, dopo avere definito le impostazioni basilari di un <a href="http://statistica.ning.com/"><b>Social Network – chiamato semplicemente STATISTICA (http://statistica.ning.com/)</b></a> -, ho deciso di raccogliere poco a poco all’interno di esso tutti i post e le risorse da me postate su Stat Project in più di 3 anni di attività. Non trasferirò tutto il contenuto dei suoi database, bensì solo quanto riterrò indispensabile e veramente essenziale per qualunque appassionato di statistica.<br> Presto invierò a tutti gli iscritti alla <a href="http://www.stat-project.com/newsletter.asp"><b>Newsletter di Stat Project</b></a> un invito affinché possano registrarsi e costruirsi una propria pagina personale. Naturalmente chiunque è invitato a registrarsi e a partecipare anche se non invitato.<br> <b>In STATISTICA potrete creare Gruppi per gestirli come amministratori, aprire discussioni sui Forum, allacciare rapporti con altri appassionati, e molto altro. Spero utilizzerete questo Social Network come una sorta di Facebook dedicato alla statistica. Godetene e fruitene tutti, quindi</b>.<br> Io, da parte mia, cercherò di vestire i panni di semplice coordinatore, e magari proseguire con i miei propositi informativi.<br><br> Per cui godetevi <a href="http://statistica.ning.com/"><b>STATISTICA (http://statistica.ning.com/)</b></a>. Iscrivetevi e contribuite ad una reale condivisione della conoscenza.]]></description><link><![CDATA[http://www.stat-project.com/commenti.asp?ID=627]]></link></item><item><title><![CDATA[Com’è stato vinto il Netflix]]></title><description><![CDATA[Capitolo definitivamente chiuso per quanto riguarda il primo concorso a premi indetto da Netflix. L’obiettivo di ottenere un miglioramento del 10% dell’algoritmo alla base del sistema di raccomandazione e suggerimento della nota catena statunitense di noleggio DVD è stato raggiunto solo dopo che il <a href="http://www.research.att.com/~volinsky/netflix/"><b>Caos Pragmatico di Bellkor</b></a> e l’Ensemble, i team che sono giunti rispettivamente primo e secondo dopo la prima tornata della competizione, hanno unito le loro forze per offrire ognuno un proprio contributo significativo.<br> Invito tutti quanti siano interessati a sbirciare tra le <a href="http://www.netflixprize.com//community/viewtopic.php?id=1537"<b>documentazioni allegate ai lavori di ricerca ed ospitate sul forum dedicato al concorso</b></a>.<br> L’immagine che potete osservare sopra è l’equazione documentata da Yehuda Koren, che ha consentito ai primi due team di vincere il premio.<br> In definitiva, secondo quanto dichiarato dai vincitori gli aspetti che è stato necessario considerare per ottenere il maggior miglioramento possibile dell’algoritmo sono stati molteplici. Prima di tutto è stato osservato che <b>le modalità di giudizio dei clienti di Netflix invitati a dare una valutazione sui film noleggiati differisce notevolmente a seconda che il film sia stato visto recentemente o molto tempo fa</b>. Dopodiché è stato rilevato come <b>i giudizi espressi al Venerdì presentassero delle differenze sistematiche rispetto ai giudizi espressi al Lunedì, e come certi clienti fossero maggiormente propensi a fornire voti più positivi in giorni festivi come la Domenica</b>.<br> Potete trovare altre notizie sul Netflix<br> <a href="http://www.stat-project.com/commenti.asp?ID=60"><b>Qui</b></a><br> <a href="http://www.stat-project.com/commenti.asp?ID=279"><b>Qui</b></a><br> <a href="http://www.stat-project.com/commenti.asp?ID=297"><b>Qui</b></a><br> E <a href="http://www.stat-project.com/commenti.asp?ID=510"><b>qui</b></a><br><br>
]]></description><link><![CDATA[http://www.stat-project.com/commenti.asp?ID=626]]></link></item><item><title><![CDATA[Blog: Statistica con R]]></title><description><![CDATA[<a href="http://statisticaconr.blogspot.com/"><b>Esercizi di statistica descrittiva e di verifica delle ipotesi risolti e commentati con R</b></a>. Questo il sottotitolo di un blog scritto in italiano ed esaustivo in ognuna delle spiegazioni pubblicate sull’utilizzo di R.<br> L’<a href="http://statisticaconr.blogspot.com/2008/11/indice-degli-esercizi-svolti.html"><b>Indice degli esercizi</b></a> può risultare molto utile soprattutto per gli utenti meno esperti che desiderano ottenere immediatamente un aiuto. Estremamente utili sono i due manuali segnalati nella sezione link:<br> <a href="http://cran.r-project.org/doc/contrib/Frascati-FormularioStatisticaR.pdf"><b>Formulario di statistica con R</b></a>, realizzato da Fabio Frascati, ed<br> <a href="http://cran.r-project.org/doc/contrib/DellOmodarme-esercitazioni-R.pdf"><b>Esercitazioni di statistica biomedica</b></a>, realizzato da Matteo Dell’Omodarme.]]></description><link><![CDATA[http://www.stat-project.com/commenti.asp?ID=625]]></link></item><item><title><![CDATA[La prossima soluzione di Data Mining che verrà acquisita entro un anno]]></title><description><![CDATA[Brillante <a href="http://www.kdnuggets.com/polls/2009/analytics-data-mining-company-acquired-next.htm"><b>idea quella di Gregory Piatetsky-Shapiro di fare un sondaggio</b></a> su quale delle soluzioni/società di data mining verrà acquisita secondo i lettori di <a href="http://www.kdnuggets.com/index.html?lg"><b>KDnuggets</b></a> nei prossimi 12 mesi.<br> Nella sostanza la corsa delle big company ad accaparrarsi questo tipo di strumenti è tale da far pensare che tra breve qualcun altro si possa muovere per acquisire qualcuno dei pochi “gioielli” ancora rimasti invenduti (ricordiamo che è da poco avvenuta l’<a href="http://www.stat-project.com/commenti.asp?ID=615"><b>acquisizione di SPSS da parte di IBM</b></a>).<br><br> Secondo i lettori di KDnuggets, la prossima compagnia che verrà venduta a qualche grosso big (Oracle? Microsoft? Adobe?) entro un anno sarà <a href="http://www.stat-project.com/software_statistico.asp?ID=22&soft=KXEN"><b>KXEN</b></a>.<br> La cosa curiosa però è rappresentata dal commento aggiunto da Piatetsky-Shapiro circa rumori su un possibile interessamento di SAP nei confronti di Tibco. In questo caso si tratterebbe di una sorta di rivalsa di SAP nei confronti di IBM, in quanto dopo anni durante i quali <a href="http://www.stat-project.com/commenti.asp?ID=136"><b>SAP ha cercato di sviluppare integrazioni efficaci con SPSS</b></a>, potrebbe aver deciso di acquisire indirettamente una soluzione concorrente.<br> Ricordiamo infatti che nel giugno dello scorso anno <a href="http://www.stat-project.com/commenti.asp?ID=439"><b>Tibco ha acquisito S-PLUS per 25 milioni di dollari</b></a>.]]></description><link><![CDATA[http://www.stat-project.com/commenti.asp?ID=624]]></link></item><item><title><![CDATA[Un Suggerimento a tutti gli Istituti di Credito che vogliono dotarsi di un Sistema di Analisi Predittiva]]></title><description><![CDATA[Siete gli analisti di un istituto di credito? Desiderate dotarvi di uno strumento che vi consenta ad esempio di prevedere se un cliente sarà in grado di restituire un prestito? Desiderate stabilire qual è il profilo di cliente più conveniente da un punto di vista economico sulla base dei suoi dati anagrafici e dello storico dei suoi movimenti bancari nonché sulla base delle disponibilità nel conto corrente personale? Desiderate prevedere quale sarà il tempo medio di esecuzione di un operazione bancaria presso uno qualsiasi dei vs sportelli?<br> Ebbene ciò che dovrete procuravi sarà uno strumento e/o un servizio di analisi. <br><br> Partendo dal presupposto che le vs. banche dati siano di grandi dimensioni, e che le problematiche da affrontare possano essere di diversa natura (segmentazione/classificazione, previsione, analisi delle serie storiche), è chiaro che dovrete ricorrere ad opportune tecniche di data mining, dalle più tradizionali alle ultime ritrovate.<br> Immagino tra l’altro lo spaesamento di chi, in mancanza di soluzioni analitiche interne, si trova a dover scegliere tra una schiera numerosissima di fornitori di soluzioni, di servizi e di prodotti. <br><br> Il mio modesto suggerimento è allora quello di fare la seguente cosa: fatevi suggerire da qualcuno più esperto di voi come strutturare una vostra base dati di cui disponete già tutti i valori, sia per le variabili indipendenti (predittori) che per le variabili dipendenti (si tratterà presumibilmente di dati storici). Dopodiché “oscurate” opportunamente i valori delle variabili dipendenti.<br><br> Una volta fatto ciò <b>sottoponete la base dati alle diverse aziende di consulenza o ai fornitori di soluzioni analitiche, invitandoli ad eseguire una previsione dei valori della variabile dipendente sulla base dello specifico obiettivo di analisi e sulla base ovviamente dei valori noti delle variabili indipendenti (predittori)</b>. <br> Una volta che tutti gli interpellati avranno eseguito la loro analisi sulla medesima base dati, non vi rimarrà che confrontare i valori previsti da ognuno con i valori della variabile dipendente noti SOLTANTO a voi. <br> (La procedura è semplice: ad esempio nel caso della classificazione si ricorrere ad una matrice di confusione per il confronto tra classificazioni attese e classificazioni osservate. In questo caso sarà sufficiente osservare i tassi di errata classificazione. Per quanto invece riguarda i problemi di previsione/regressione sarà sufficiente osservare l’andamento dei residui).<br> A questo punto, saranno i numeri a parlare e a suggerirvi chi o quale software ha prodotto la previsione migliore.<br><br> Diffidate sempre di chi si riempie la bocca di grandi parole e vanta collaborazioni od esperienze passate di grande prestigio. Basatevi sull’osservazione dei risultati concreti, ottenuti sui VOSTRI DATI, e giudicate l’accuratezza e l’esaustività delle spiegazioni ad essi allegati.]]></description><link><![CDATA[http://www.stat-project.com/commenti.asp?ID=623]]></link></item><item><title><![CDATA[Le vendite di rossetti aiutano a prevedere la recessione]]></title><description><![CDATA[Devo ringraziare il programma <a href="http://www.radio24.ilsole24ore.com/conduttori.php?id=5"><b>Focus economia di Radio24 condotto da Sebastiano Barisoni</b></a> per avermi messo a conoscenza di un’inattesa relazione temporale tra due elementi dell’economia apparentemente molto distanti.<br> In una trasmissione dedicata agli indicatori economici ed in particolare agli strumenti tradizionali – e non - utilizzati dagli economisti per la previsione dei cicli di espansione e recessione economica, è stata commentata non senza qualche ironia una relazione verificata tra vendite di rossetti e gli andamenti recessivi dell’economia.<br> Nella sostanza risulterebbe che <b>nei momenti di recessione, le vendite di rossetti registrano un aumento, addirittura a partire da un numero imprecisato di step temporali precedenti rispetto all’inizio della recessione</b>.<br> L’evidenza empirica di questo fenomeno è verificabile anche attraverso l’osservazione dei risultati di ricerca associati alle parole <b>lipstick</b> e <b>recession</b> cercate tramite Google. Nell’immagine sopra potete infatti osservare l’analisi comparativa compiuta tramite Google Trends.<br> In realtà esisterebbe un vero e proprio <a href="http://en.wikipedia.org/wiki/Lipstick_index"><b>Lipstick index</b></a>, coniato da Leonard Lauder, che secondo il suo inventore consentirebbe abbastanza agevolmente di descrivere l’incremento di vendite di rossetti durante i periodi di recessione successivi al 2001.]]></description><link><![CDATA[http://www.stat-project.com/commenti.asp?ID=622]]></link></item><item><title><![CDATA[Stata 11]]></title><description><![CDATA[StataCorp ha annunciato la release di Stata 11, che promette di essere probabilmente la versione dotata del maggior numero di miglioramenti.<br> Le caratteristiche di maggiore rilievo sono certamente:<br> 1. Il nuovo Do-file Editor<br> 2. Una nuova sintassi per le operazioni di unione<br> 3. L’introduzione del comando mi (multiple imputation)<br> 4. Una nuova gestione dei fattori-effetti principali e delle interazioni<br> Personalmente apprezzo che nell’ultima versione di Stata sia stata inclusa la <b>possibilità di analizzare via GMM sia modelli lineari che non-lineari. Nello stesso modo ho apprezzato la presenza della nuova suite per l’analisi degli effetti marginali e dei root test per l’analisi dei dati panel</b>.<br> Per gli appassionati di Serie Storiche è bene sapere che sono stati introdotti nuovi modelli spaziali così come nuovi modelli fattoriali dinamici ed un numero di nuovi elementi GARCH.<br><br> Per maggiori informazioni si visiti <a href="http://www.stata.com/stata11/">http://www.stata.com/stata11/</a>]]></description><link><![CDATA[http://www.stat-project.com/commenti.asp?ID=621]]></link></item><item><title><![CDATA[mloss.org: Importante archivio di software open source dedicati al machine learning ]]></title><description><![CDATA[<a href="http://mloss.org/software/"><b>mloss.org</b></a> è un archivio di software open source per l’esecuzione di algoritmi di apprendimento automatico (machine learning).<br> La quantità ospitata di algoritmi e software è smisurato, sia per obiettivo di analisi che per tipo di linguaggio utilizzato (C, C#, C++, Java, Matlab, Perl, Python, R, ecc.). Inoltre per facilitare la comprensione dei contenuti sono disponibili un <a href="http://mloss.org/community/forum/"><b>Forum</b></a>, un <a href="http://mloss.org/community/"><b>Blog</b></a>, nonché una serie di funzioni di ordinamento per giudizio espresso dagli utenti.<br> Apprezzabile inoltre la specificazione del tipo di licenza che caratterizza ogni progetto ospitato (Gpl, Lgpl, Gnu, Bsd, ecc.). <br><br> Risorsa squisita per chiunque si dedichi frequentemente al <a href="http://www.stat-project.com/sezione.asp?ID=13&sez=Data_mining"><b>data mining</b></a>.]]></description><link><![CDATA[http://www.stat-project.com/commenti.asp?ID=620]]></link></item></channel></rss>