SAS: logistic regression with unbalanced explanatory variable

Ciao a tutti!

Vi chiedo aiuto per un problema di dati sbilanciati in una variabile indipendente in una regressione logistica.

Allora ho testato le variabile da includere nel modello logistico prima con analisi univariata, ho ottenuto significative 2 continue, 14 dicotomiche e 1 a più livelli.

Una dicotomica di queste però mi ha creato subito un problema, con la logistica univariata non ho ottenuto l’OR sensato: Estimate >999.99 and the 95% Confidence Limits >999.999 - > 999.999, ma ho provato a calcolare l’OR con la proc freq e ho trovato questo risultato 1212.8991 and 95% Confidence Limits 1031.0208 1426.8618.

Con la regressione logistica multivariata, il problema si è ripetuto. È una variabile molto importante per cui non vorrei escluderla prima di aver provato tutti i modi per trattarla, il problema di fondo è che è molto sbilanciata: in una cella ho 147 osservazioni sulle 164000 osservazioni totali…

Ho provato a usare la correzione di firth, e a usare l’exact test nella proc logistic. Ho provato anche ad usare la proc glimmix, il risultato passa a <0.001 and the 95% Confidence Limits <0.001 – 0.001 con df= 165e3, ma forse non uso le opzioni corrette…

Quali tentativi mi consigliate?

Grazie !! 

Visualizzazioni: 20

Social

 

Gruppi

© 2017   Creato da Duccio Schiavon.   Tecnologia

Badge  |  Segnala un problema  |  Politica sulla privacy  |  Termini del servizio