Buongiorno,

ho un dubbio riguardante l’analisi statistica dei dati sperimentali che non sono riuscito a risolvere consultando i manuali e tramite ricerche online. Ve lo espongo attraverso 2 esempi.

Esempio 1

Poniamo di sottoporre un numero N di campioni ad un certo trattamento variando per ognuno di essi un certo parametro (ad esempio la temperatura T alla quale viene eseguito il trattamento) e di voler indagare l’eventuale effetto di questo parametro sul modulo elastico. Supponiamo di voler ricavare il modulo elastico E degli N campioni tramite la loro frequenza naturale: per farlo occorre misurare la lunghezza L e la sezione A del campione, la sua massa m e la sua frequenza f di risonanza flessionale. Tutte queste misure sono inevitabilmente affette da incertezza, pertanto anche il valore di E (funzione di f, m, L e A) avrà una sua incertezza dE che è possibile ricavare tramite la propagazione degli errori.

Completate le misurazioni si avrà, per ognuno degli N campioni, un valore di E ed una relativa incertezza dE (l’errore propagato).

Se si vuole eseguire un’anova per determinare se esiste un effetto del parametro variato, come si devono utilizzare le incertezze dE?

Infatti se le incertezze sono molto alte, è più probabile che una differenza tra le misure sia dovuta solo all’errore casuale; come si deve tenere conto di ciò nell’anova?

Inoltre come si devono utilizzare le incertezze dE se si vuole valutare la bontà di una regressione lineare?

 

Esempio 2

Poniamo invece di voler indagare l’effetto di 2 parametri di processo A e B sulla durezza del materiale tramite un piano fattoriale (per semplicità supponiamo un piano di tipo 2^2) e avendo a disposizione una sola replicazione per ogni combinazione dei 2 fattori (pertanto si avranno il tutto 4 campioni, ognuno sottoposto ad una diversa combinazione dei parametri di processo). Su ognuno dei 4 campioni vengono eseguite p misure ripetute indipendenti di durezza: le p misure per ogni campione forniscono una stima della variabilità dello strumento di misura (o eventualmente anche dell’eterogeneità del materiale), ma non del trattamento in quando, come detto, si ha a disposizione un solo campione per ogni trattamento (cioè una sola replicazione per ogni punto del piano).

Perciò alla fine si avranno 4 x p misure di durezza; per l’analisi del piano fattoriale quale delle 2 seguenti procedure è quella corretta:

  1. si utilizzano tutte le 4 x p misure avendo quindi a disposizione 4 x (p - 1) GDL per la stima dell’errore casuale da utilizzare nell’anova;
  2. per ogni combinazione di parametri si utilizza la media delle p misure ripetute, ossia entrano nell’analisi solo 4 valori e pertanto non si avranno GDL per la stima dell’errore casuale (o meglio se ne può avere 1 assumendo che non vi sia interazione tra i 2 fattori).

 

Nel primo caso ho l’impressione che quei 4 x (p - 1) GDL siano “fittizi” essendo riferiti a misure ripetute sullo stesso campione e che dunque si corra il rischio di valutare come significativo l’effetto di uno dei fattori (o di entrambi) quando in realtà non lo è.

Nel secondo caso, che mi sembra più corretto, come si deve utilizzare l’informazione che deriva dalle p misure ripetute? Le p misure ripetute su ogni campione possono essere utilizzate per calcolare le relative deviazioni standard e utilizzare quest’ultime come incertezze di misura (ricadendo quindi nel caso dell’esempio 1)? Nei principali software statistici (ad esempio Minitab) come si trattano casi simili?

Ditemi se sono stato sufficientemente chiaro nell’esporre il problema, se necessario posterò un esempio con dei numeri.

Grazie

Visualizzazioni: 14

Rispondi

Social

 

Gruppi

© 2017   Creato da Duccio Schiavon.   Tecnologia

Badge  |  Segnala un problema  |  Politica sulla privacy  |  Termini del servizio