Salve, ho un quesito da porvi circa un lavoro di ricerca che sto portando avanti e che potrebbe trarre vantaggi dal data mining.

Ho un ampio gruppo di soggetti eterogenei, accumunati da uno stesso fattore (es. dolore).

Per ciascun soggetto vengono registrate una serie di variabili, alcune delle quali vengono trattate.

Il gruppo viene così suddiviso in soggetti che presentano ancora il fattore in esame e soggetti privi di tale fattore.

La mia domanda è:

che tipo di tecnica di data mining è più corretto usare per detterminare una correlazione tra le variabili trattate e quindi eliminate e la scomparsa del fattore esaminato?

Esiste un programma più adatto rispetto ad altri... Qualche consiglio?

Grazie, Sergio

Visualizzazioni: 37

Risposte a questa discussione

Ciao Sergio,

leggendo il post ti consiglio le tecniche più semplice, decision tree o clustering supervisionato (un k-means classico), perchè sai già che vuoi due gruppi.

Sul software ti consiglio Weka se vuoi un'interfaccia grafica o se lo usi (o vuoi smanettare) ci sono gli algoritmi in R.

Spero di esserti stato utile.

Nico

RSS

Social

 

Gruppi

© 2017   Creato da Duccio Schiavon.   Tecnologia

Badge  |  Segnala un problema  |  Politica sulla privacy  |  Termini del servizio