विषय
एकाधिक प्रतिगमन का उपयोग कई स्वतंत्र चर और एक आश्रित चर के बीच संबंधों की जांच करने के लिए किया जाता है। जबकि कई प्रतिगमन मॉडल आपको इन स्वतंत्र, या भविष्यवक्ता, आश्रित पर चर, या मानदंड, चर के सापेक्ष प्रभावों का विश्लेषण करने की अनुमति देते हैं, इन जटिल डेटा सेटों का गलत विश्लेषण होने पर गलत निष्कर्ष निकल सकते हैं।
एकाधिक प्रतिगमन के उदाहरण
एक रियल एस्टेट एजेंट घरों के मूल्य का विश्लेषण करने के लिए कई प्रतिगमन का उपयोग कर सकता है। उदाहरण के लिए, वह घरों के आकार, उनकी उम्र, बेडरूम की संख्या, पड़ोस में घर की औसत कीमत और स्कूलों से निकटता के लिए स्वतंत्र चर के रूप में उपयोग कर सकती है। एक से अधिक प्रतिगमन मॉडल में प्लॉटिंग करते हुए, वह फिर इन कारकों का उपयोग कर घरों की कीमतों के लिए उनके रिश्ते को कसौटी के रूप में देख सकती है।
कई प्रतिगमन मॉडल का उपयोग करने का एक और उदाहरण मानव संसाधन में कोई हो सकता है जो प्रबंधन पदों के वेतन का निर्धारण करता है - मानदंड चर। भविष्यवक्ता चर प्रत्येक प्रबंधक की वरिष्ठता हो सकती है, घंटों की औसत संख्या, काम करने वाले लोगों की संख्या और प्रबंधकीय विभागीय बजट।
एकाधिक प्रतिगमन के लाभ
कई प्रतिगमन मॉडल का उपयोग करके डेटा का विश्लेषण करने के दो मुख्य फायदे हैं। पहला मानदंड मान में एक या एक से अधिक भविष्यवाणियों के सापेक्ष प्रभाव को निर्धारित करने की क्षमता है। रियल एस्टेट एजेंट यह पता लगा सकते हैं कि घरों के आकार और बेडरूम की संख्या में घर की कीमत का एक मजबूत संबंध है, जबकि स्कूलों से निकटता का कोई संबंध नहीं है, या नकारात्मक सहसंबंध भी अगर यह मुख्य रूप से सेवानिवृत्ति है समुदाय।
दूसरा फायदा आउटलेर्स या विसंगतियों की पहचान करने की क्षमता है। उदाहरण के लिए, प्रबंधन वेतन से संबंधित आंकड़ों की समीक्षा करते समय, मानव संसाधन प्रबंधक यह पता लगा सकता है कि कितने घंटे काम किया गया, विभाग के आकार और उसके बजट सभी में वेतन के लिए एक मजबूत संबंध था, जबकि वरिष्ठता नहीं थी। वैकल्पिक रूप से, यह हो सकता है कि सभी सूचीबद्ध भविष्यवक्ता मूल्यों की जांच की जा रही वेतन में से प्रत्येक के लिए सहसंबद्ध हो, सिवाय एक प्रबंधक के जो दूसरों की तुलना में अधिक भुगतान किया जा रहा था।
एकाधिक प्रतिगमन का नुकसान
कई प्रतिगमन मॉडल का उपयोग करने का कोई नुकसान आमतौर पर उपयोग किए जा रहे डेटा के लिए नीचे आता है। इसके दो उदाहरण अधूरे डेटा का उपयोग कर रहे हैं और गलत तरीके से यह निष्कर्ष निकाल रहे हैं कि सहसंबंध एक कारण है।
उदाहरण के लिए, घरों की कीमत की समीक्षा करते समय, मान लीजिए कि रियल एस्टेट एजेंट केवल 10 घरों को देखता है, जिनमें से सात युवा माता-पिता द्वारा खरीदे गए थे। इस मामले में, स्कूलों की निकटता के बीच संबंध उसे विश्वास दिला सकता है कि इससे समुदाय में बेचे जाने वाले सभी घरों की बिक्री मूल्य पर प्रभाव पड़ा। यह अधूरे डेटा के नुकसान को दिखाता है। अगर वह एक बड़ा नमूना इस्तेमाल करती, तो वह पा सकती थी कि, 100 घरों में से, केवल दस प्रतिशत घर के मूल्य एक स्कूल निकटता से संबंधित थे। अगर उसने खरीदारों की उम्र का पूर्वानुमानकर्ता मूल्य के रूप में उपयोग किया था, तो वह पा सकती थी कि युवा खरीदार पुराने खरीदारों के लिए समुदाय में घरों के लिए अधिक भुगतान करने को तैयार थे।
प्रबंधन के वेतन के उदाहरण में, मान लीजिए कि एक छोटा बजट था, जिसमें कम बजट था, कम वरिष्ठता और कम कर्मियों के साथ प्रबंधन करने के लिए लेकिन किसी और से अधिक बना रहा था। मानव संसाधन प्रबंधक डेटा को देख सकता है और निष्कर्ष निकाल सकता है कि यह व्यक्ति अधिक भुगतान कर रहा है। हालाँकि, यह निष्कर्ष गलत होगा यदि वह इस बात को ध्यान में नहीं रखता है कि यह प्रबंधक कंपनी की वेबसाइट का प्रभारी था और नेटवर्क सुरक्षा में एक उच्च प्रतिष्ठित कौशल था।