विषय
- रेखीय प्रतिगमन, रैखिक संबंधों के लिए सीमित है
- रेखीय प्रतिगमन केवल आश्रित चर के माध्यम को देखता है
- रैखिक प्रतिगमन आउटलेर्स के लिए संवेदनशील है
- डेटा स्वतंत्र होना चाहिए
रेखीय प्रतिगमन एक आश्रित चर के बीच संबंधों की जांच करने के लिए एक सांख्यिकीय विधि है, जिसे निरूपित किया जाता है y, और एक या एक से अधिक स्वतंत्र चर, के रूप में चिह्नित एक्स। आश्रित चर निरंतर होना चाहिए, इसमें वह किसी भी मूल्य पर ले सकता है, या कम से कम निरंतर के करीब हो सकता है। स्वतंत्र चर किसी भी प्रकार के हो सकते हैं। यद्यपि लीनियर रिग्रेशन अपने आप में कारण नहीं दिखा सकता है, आश्रित चर आमतौर पर स्वतंत्र चर से प्रभावित होता है।
रेखीय प्रतिगमन, रैखिक संबंधों के लिए सीमित है
इसकी प्रकृति से, रैखिक प्रतिगमन केवल आश्रित और स्वतंत्र चर के बीच रैखिक संबंधों को देखता है। यही है, यह मानता है कि उनके बीच एक सीधा-सीधा संबंध है। कभी-कभी यह गलत है। उदाहरण के लिए, आय और उम्र के बीच संबंध घुमावदार है, यानी, आय वयस्कता के शुरुआती हिस्सों में बढ़ती है, बाद में वयस्कता में बाहर निकलती है और लोगों के रिटायर होने के बाद गिरावट आती है। आप बता सकते हैं कि क्या रिश्तों के चित्रमय प्रतिनिधित्व को देखकर यह समस्या है।
रेखीय प्रतिगमन केवल आश्रित चर के माध्यम को देखता है
रैखिक प्रतिगमन निर्भर चर और स्वतंत्र चर के माध्य के बीच एक संबंध को देखता है। उदाहरण के लिए, यदि आप शिशुओं और मातृत्व विशेषताओं के जन्म के वजन, जैसे कि उम्र, के संबंध को देखते हैं, तो रेखीय प्रतिगमन अलग-अलग उम्र की माताओं से पैदा होने वाले शिशुओं के औसत वजन पर दिखेगा। हालांकि, कभी-कभी आपको आश्रित चर के चरम पर देखने की जरूरत होती है, उदाहरण के लिए, शिशुओं का जोखिम तब होता है जब उनका वजन कम होता है, इसलिए आप इस उदाहरण में चरम पर देखना चाहेंगे।
जिस तरह माध्य एक एकल चर का पूर्ण विवरण नहीं है, उसी तरह रैखिक प्रतिगमन चर के बीच संबंधों का पूर्ण विवरण नहीं है। आप मात्रात्मक प्रतिगमन का उपयोग करके इस समस्या से निपट सकते हैं।
रैखिक प्रतिगमन आउटलेर्स के लिए संवेदनशील है
आउटलेयर ऐसे डेटा हैं जो आश्चर्यजनक हैं। आउटलेरर्स एकतरफा (एक चर पर आधारित) या बहुभिन्नरूपी हो सकते हैं। यदि आप उम्र और आय को देख रहे हैं, तो एकतरफा आउटलेयर एक व्यक्ति की तरह होगा जो 118 साल का है, या जिसने पिछले साल 12 मिलियन डॉलर कमाए थे। एक बहुभिन्नरूपी आउटलाइन 18 साल का होगा जिसने $ 200,000 कमाए। इस मामले में, न तो उम्र और न ही आय बहुत चरम है, लेकिन बहुत कम 18-वर्षीय लोग इतना पैसा कमाते हैं।
प्रतिभूतियों के प्रतिगमन पर भारी प्रभाव पड़ सकता है। आप अपने सांख्यिकीय सॉफ़्टवेयर से प्रभाव के आंकड़ों का अनुरोध करके इस समस्या से निपट सकते हैं।
डेटा स्वतंत्र होना चाहिए
रैखिक प्रतिगमन मानता है कि डेटा स्वतंत्र हैं। इसका मतलब है कि एक विषय (जैसे एक व्यक्ति) के अंकों का दूसरे के साथ कोई लेना-देना नहीं है। यह अक्सर होता है, लेकिन हमेशा नहीं, समझदार। दो सामान्य मामले जहां यह अर्थ नहीं है कि अंतरिक्ष और समय में क्लस्टरिंग है।
अंतरिक्ष में क्लस्टरिंग का एक उत्कृष्ट उदाहरण छात्र परीक्षा स्कोर है, जब आपके पास विभिन्न कक्षाओं, ग्रेड, स्कूलों और स्कूल जिलों के छात्र हैं। एक ही कक्षा के छात्र कई तरह से समान होते हैं, अर्थात्, वे अक्सर एक ही पड़ोस से आते हैं, उनके पास एक ही शिक्षक होते हैं, आदि, इस प्रकार, वे स्वतंत्र नहीं हैं।
समय में क्लस्टरिंग के उदाहरण कोई भी अध्ययन हैं जहां आप एक ही विषय को कई बार मापते हैं। उदाहरण के लिए, आहार और वजन के अध्ययन में, आप प्रत्येक व्यक्ति को कई बार माप सकते हैं। ये डेटा स्वतंत्र नहीं हैं क्योंकि किसी व्यक्ति का वजन एक अवसर पर होता है, जो अन्य अवसरों पर उसका वजन होता है। इससे निपटने का एक तरीका बहुस्तरीय मॉडल है।