Ciao a tutti gli utenti del forum. Volevo aprire una discussione riguardante l'analisi di dataset misti. Ho inserito questa discussione sul blog ma forse ho sbagliato. Quindi la inserisco anche qui che forse è più appropriato. Di seguito ciò che avevo postato sul blog: 

Ciao a tutti!! Sono nuovo su questo blog e sono felice di farne parte. Vorrei aprire una discussione e ricevere consigli, se possibile. Ho da poco fatto un corso di machine learning e al momento mi sto cimentando con un dataset che contiene attributi sia quantitativi che qualitativi (2 colonne di valori qualitativi da 0 a 3). La variabile target è quantitativa e continua. Durante il corso non mi sono mai trovato ad analizzare dataset mixati: nel caso di regressione lineare la target e gli attributi erano quantitativi, quando la target era qualitativa usavo la regressione logistica, ecc.

Per il momento ciò che ho fatto sul dataset è una statistica di base (statistica descrittiva, visualizzazione, prima interpretazione dei dati). Ho individuato le dipendenze forti tra i vari attributi e ora sto facento la selezione delle feature. Vorrei anche fare una analisi delle componenti principali e a tal proposito ho una domanda: Si può applicare un'analisi di PCA anche alle componenti qualitative? 

Dopo aver individuato le feacture fondamentali vorrei sviluppare un algoritmo di predittività (prima regressione lineare e poi polinomiale per vedere se l'efficienza migliora), ma non so se inserire gli attributi qualitativi (per questo volevo fare un pca per vedere se potrebbero essere fondamentali o no per il modello). 

E qui la mia seconda domanda: cosa posso fare con i dati qualitativi avendo una target quantitativa?

Spero di essere stata chiaro.

Grazie in anticipo a chi risponderà.

Ciao

Visualizzazioni: 18

Rispondi

Social

 

Gruppi

© 2017   Creato da Duccio Schiavon.   Tecnologia

Badge  |  Segnala un problema  |  Politica sulla privacy  |  Termini del servizio