Salve a tutti!

Ho una serie di dubbi riguardo una analisi della varianza che devo svolgere per la tesi. Per non inserire troppi punti di domanda vi evidenzio in rosso i passaggi di cui non sono sicuro di procedere nella maniera giusta.

Il disegno sperimentale è il seguente: 6 stazioni di campionamento all'interno della quale si fanno 4 repliche random e l'intero procedimento si ripete in 3 date. La variabile di risposta è la larghezza di granchi raccolti tramite una benna. Voglio vedere se c'è differenza di taglia tra i siti e le date di campionamento. Faccio quindi una ANOVA a due vie con il fattore "sito" composto da 6 livelli (6 stazioni) e fattore "data" composto da 3 livelli; i due fattori incrociati tra loro. Le stazioni sono sempre le stesse per ogni data, quindi è il fattore sito è un fattore fisso e le date in cui è avvenuto il campionamento non sono rappresentative di tutto l'anno poichè manca il campionamento estivo (sono state campionate ad ottobre, gennaio e maggio), quindi presumo sia anche il fattore data un fattore fisso. I campioni hanno grandezza diversa, poichè il numero di granchi raccolti per prendere le misure varia. In un sito non ho mai trovato nessun granchio, quindi non ho nessuna distribuzione di variabile per quel sito; in un altro sito in 3 date di campionamento (ognuno composto da 4 repliche) ho trovato solo 2 individui, mentre in tutti gli altri siti gli individui prelevati superano i 30. Quindi elimino il sito privo di granchi perchè mettendo una larghezza=0 (che non esiste) mi sballa tutto l'esperimento. A questo punto decido di eliminare anche il sito con soli 2 individui.

Procedo con i test per verificare le assunzioni dell'ANOVA eliminando i due siti; quindi il livelli del fattore sito sono ora 4.

- Assunzione di normalità: le distribuzione che vado a testare sono quelle che compongono un solo livello del fattore. Quindi per il fattore sito creo un vettore con tutte le osservazioni della 1° stazione e lo testo, poi un vettore di tutte le osservazioni della 2° stazione e lo testo e così via (è giusto così o devo testare l'intera e unica distribuzioni che comprende tutte le osservazioni, o le singole distribuzioni di ogni singola replica). A questo punto alcune distribuzioni sono distribuite normalmente, altre invece no. Stesso procedimento e stesso risultato con le 3 distribuzioni che compongono il fattore data. 

- omoschedasticità (varianze omogenee tra i livelli del fattore): faccio un test non parametrico (test di Levene su R)  e il risultato è che le 6 distribuzioni del fattore sito hanno varianza omogenea, così come le 3 distribuzioni del fattore data.

Che tipo di test devo fare quando non tutte le distribuzioni sono normali e l'omoschedasticità è rispettata? (3° quesito).

Poichè la violazione della normalità non ha gravi conseguenze sull'anova credo sia possibile procedere con l'analisi.

Mi è stato consigliato di svolgere una ANOVA a due vie su R utilizzando il comando gad disponibile sul pacchetto GAD. 

A questo punto devo caricare la matrice dati su R (e qui sorge un grande dubbio). Per ogni livello del fattore sito devo inserire tutte le osservazioni o solo le medie campionarie? Ad esempio, nel mio caso prendiamo la prima stazione di campionamento svolto ad ottobre. Questa è composta da 4 repliche (4 raccolte di granchi). Nella matrice che carico su R devo inserire tutte le osservazioni della variabile per ogni replica oppure una media per replica, o addirittura un singolo valore medio dell'intera distribuzione di quel livello? Teniamo conto che le distribuzioni per ogni replica e per ogni livello del fattore non hanno lo stesso numero di osservazioni (vedi allegato matrice dati larghezza).

Spero di esser stato chiaro nel esporvi l'esperimento e i dubbi da chiarire.

Vi ringrazio già in anticipo anche per il semplice interesse dimostrato nella lettura di questo problema!

Saluti a tutti! 

Angelo

Visualizzazioni: 398

Allegati:

Rispondi

Risposte a questa discussione

Ciao Angelo, sicuramente l'ANOVA a due vie con Sito fattore between e Tempo fattore within è il modo più semplice per rispondere alla tua domanda di ricerca. Tuttavia, rimane la questione di come derivare i valori di ogni sito in ogni momento del tempo dalle repliche. Calcolare la media, come hai fatto, è una procedura abbastanza comune, ma io sarei più per calcolare la mediana, in modo da proteggermi da eventuali outliers. Oppure potresti utilizzare le repliche come dati di livello2 e realizzare un linear mixed model che ti consentirebbe di impostare comunque i due fattori dell'ANOVA. In questo modo, il file che hai postato è già pronto per le analisi tranne il fatto che ogni cluster di repliche dovrebbe avere un identificativo diverso. Ad ogni modo, se non hai familiarità con questo tipo di analisi puoi procedere con l'ANOVA.

C. 

Ciao Carlo, e grazie per la risposta. Purtroppo non sono molto pratico ne nella procedura che mi hai consigliato ne nell' ANOVA stessa. Per lo meno, la conosco in modo teorico ma non l'ho mai praticata. Quindi per fare una ANOVA a due vie dovrei caricare su R una matrice con una singola osservazione per sito (risultato di una media delle medie delle 4 repliche in una data di campionamento)? Non conosco i termini fattore between e fattore within. Quel poco che conosco di questa procedura è che i fattori possono essere fissi o random, e fattoriali o gerarchizzati. Infatti il pacchetto GAD che uso per fare l'anova mi chiede solo di impostare la natura del fattore (fisso o random). Comunque per quanto riguarda le assunzioni, vanno bene le procedure che ho fatto?

Grazie

Angelo

Quindi per fare una ANOVA a due vie dovrei caricare su R una matrice con una singola osservazione per sito (risultato di una media delle medie delle 4 repliche in una data di campionamento)?

Se le repliche non costituiscono un fattore (che a quel punto sarebbe random) del quale vuoi indagare l'effetto sì.

Non conosco i termini fattore between e fattore within

Between = per gruppi indipendenti (nel tuo caso, il sito)

Within = per misure ripetute o appaiate (nel tuo caso, il momento del tempo)

Qui http://www.ateneonline.it/chiorri2e/STRUMENTI-INFORMATICI/Strumenti... puoi trovare un'introduzione ai modelli fattoriali di ANOVA. Vista l'analisi che hai intenzione di fare, ti interessa soprattutto il capitolo 3 - gli esempi sono con SPSS ma puoi facilmente replicarli in R.

Comunque per quanto riguarda le assunzioni, vanno bene le procedure che ho fatto?

Sì.

RSS

Social

 

Gruppi

© 2018   Creato da Duccio Schiavon.   Tecnologia

Badge  |  Segnala un problema  |  Politica sulla privacy  |  Termini del servizio