विषय
ची-स्क्वार्ड, जिसे अधिक सही तरीके से पियर्सन ची-स्क्वायर टेस्ट के रूप में जाना जाता है, सांख्यिकीय आंकड़ों के मूल्यांकन का एक साधन है। इसका उपयोग तब किया जाता है जब नमूने से स्पष्ट डेटा की तुलना अपेक्षित या "सही" परिणामों से की जा रही हो। उदाहरण के लिए, यदि हम मानते हैं कि एक बिन में सभी जेली बीन्स का 50 प्रतिशत लाल होता है, तो उस बिन से 100 बीन्स का एक नमूना लगभग 50 होना चाहिए जो लाल हैं। यदि हमारी संख्या 50 से भिन्न है, तो पियर्सन परीक्षण हमें बताता है कि क्या हमारी 50 प्रतिशत धारणा संदिग्ध है, या यदि हम सामान्य यादृच्छिक भिन्नता के लिए देखा गया अंतर दिखा सकते हैं।
ची-स्क्वायर मानों की व्याख्या करना
अपने ची-स्क्वायर मूल्य की स्वतंत्रता की डिग्री निर्धारित करें। यदि आप एकल श्रेणियों के लिए परिणामों की कई श्रेणियों के साथ तुलना कर रहे हैं, तो स्वतंत्रता की डिग्री श्रेणियों की संख्या माइनस 1. उदाहरण के लिए, यदि आप जेलीबीन के जार में रंगों के वितरण का मूल्यांकन कर रहे थे और चार रंग थे, तो विस्तार की डिग्री स्वतंत्रता होगी 3. यदि आप सारणीबद्ध डेटा की तुलना कर रहे हैं तो स्वतंत्रता की डिग्री पंक्तियों की संख्या 1 के बराबर होती है 1 कॉलम की संख्या से गुणा 1।
महत्वपूर्ण पी मान निर्धारित करें जिसका उपयोग आप अपने डेटा का मूल्यांकन करने के लिए करेंगे। यह प्रतिशत संभावना (100 से विभाजित) है कि एक विशिष्ट ची-वर्ग मूल्य अकेले संयोग से प्राप्त किया गया था। पी के बारे में सोचने का एक और तरीका यह है कि यह संभावना है कि आपके देखे गए परिणाम उस राशि से अपेक्षित परिणामों से भटक गए हैं जो उन्होंने पूरी तरह से नमूना प्रक्रिया में यादृच्छिक भिन्नता के कारण किया था।
ची-स्क्वायर डिस्ट्रीब्यूशन टेबल का उपयोग करके अपने ची-स्क्वायर टेस्ट स्टेटिस्टिक से जुड़े पी वैल्यू को देखें। ऐसा करने के लिए, अपनी स्वतंत्रता की गणना की गई पंक्तियों के अनुरूप पंक्ति को देखें। इस पंक्ति में मान को अपने परीक्षण आँकड़ा के सबसे निकट पाते हैं। उस स्तंभ का अनुसरण करें जिसमें वह मान शीर्ष पंक्ति में ऊपर की ओर है और p मान से दूर है। यदि आपका परीक्षण आँकड़ा प्रारंभिक पंक्ति में दो मानों के बीच है, तो आप शीर्ष पंक्ति में दो p मानों के बीच अनुमानित p मान मध्यवर्ती को पढ़ सकते हैं।
पहले से तय किए गए महत्वपूर्ण पी मान के लिए तालिका से प्राप्त पी मूल्य की तुलना करें। यदि आपका सारणीबद्ध पी मान महत्वपूर्ण मूल्य से ऊपर है, तो आप निष्कर्ष निकालेंगे कि नमूना श्रेणी के मूल्यों और अपेक्षित मूल्यों के बीच कोई विचलन यादृच्छिक भिन्नता के कारण था और महत्वपूर्ण नहीं था। उदाहरण के लिए, यदि आपने 0.05 (या 5%) का महत्वपूर्ण पी मान चुना है और 0.20 का सारणीबद्ध मान प्राप्त किया है, तो आप निष्कर्ष निकालेंगे कि कोई महत्वपूर्ण भिन्नता नहीं थी।