अध्याय-4 डेटा विश्लेषण की उन्नत तकनीकें
Synopsis
ANOVA का सैद्धांतिक आधार (Analysis of Variance)
ANOVA अर्थात् Analysis of Variance एक सांख्यिकीय तकनीक है जिसका मूल उद्देश्य विभिन्न समूहों के माध्यों (means) के बीच अंतर का परीक्षण करना है। इसका विकास मुख्यतः सर रोनाल्ड फिशर द्वारा किया गया था। ANOVA का सैद्धांतिक आधार इस विचार पर आधारित है कि कुल परिवर्तनशीलता (Total Variability) को विभिन्न घटकों में विभाजित किया जा सकता है—विशेषकर समूहों के बीच की परिवर्तनशीलता (Between-Group Variance) और समूहों के भीतर की परिवर्तनशीलता (Within-Group Variance)।
ANOVA का केंद्रीय सिद्धांत यह है कि यदि समूहों के माध्यों में वास्तविक अंतर है, तो समूहों के बीच की परिवर्तनशीलता समूहों के भीतर की परिवर्तनशीलता की तुलना में अधिक होगी। इसी तुलना के लिए F-अनुपात (F-ratio) का उपयोग किया जाता है:
F=Between Group VarianceWithin Group VarianceF=Between Group VarianceWithin Group Variance
यदि F का मान पर्याप्त रूप से बड़ा है और सांख्यिकीय रूप से महत्वपूर्ण है, तो शून्य परिकल्पना (कि सभी समूहों के माध्य समान हैं) अस्वीकृत कर दी जाती है।
ANOVA निम्नलिखित मान्यताओं (assumptions) पर आधारित है:
-
सामान्यता (Normality)
-
स्वतंत्रता (Independence of observations)
-
समान प्रसरण (Homogeneity of variance)
ANOVA विशेष रूप से तब उपयोगी है जब तीन या अधिक समूहों की तुलना करनी हो, क्योंकि कई t-परीक्षण करने से त्रुटि की संभावना (Type I error) बढ़ जाती है। इस प्रकार, ANOVA एक समेकित और नियंत्रित परीक्षण प्रदान करता है। सैद्धांतिक रूप से यह रैखिक मॉडल (Linear Model) का एक विशेष रूप है, जहाँ प्रत्याशित मानों को स्वतंत्र चर के प्रभाव के रूप में व्यक्त किया जाता है।
