विषय
स्कैटर प्लॉट एक ग्राफ है जो डेटा के दो सेटों के बीच संबंध दिखाता है। कभी-कभी दो चर के बीच गणितीय संबंध प्राप्त करने के लिए स्कैटर प्लॉट के भीतर मौजूद डेटा का उपयोग करना सहायक होता है। एक स्कैटर प्लॉट का समीकरण दो मुख्य तरीकों का उपयोग करके, हाथ से प्राप्त किया जा सकता है: एक ग्राफिकल तकनीक या एक तकनीक जिसे रेखीय प्रतिगमन कहा जाता है।
स्कैटर प्लॉट बनाना
स्कैटर प्लॉट बनाने के लिए ग्राफ पेपर का उपयोग करें। X- और y- कुल्हाड़ियों को ड्रा करें, सुनिश्चित करें कि वे मूल को प्रतिच्छेद और लेबल करते हैं। सुनिश्चित करें कि x- और y- कुल्हाड़ियों के भी सही शीर्षक हैं। अगला, ग्राफ़ के भीतर प्रत्येक डेटा बिंदु को प्लॉट करें। प्लॉट किए गए डेटा सेट के बीच कोई भी रुझान अब स्पष्ट होना चाहिए।
बेस्ट फिट की लाइन
एक बार एक स्कैटर प्लॉट बनाया गया है, यह मानते हुए कि दो डेटा सेट के बीच एक रैखिक संबंध है, हम समीकरण प्राप्त करने के लिए एक ग्राफिकल विधि का उपयोग कर सकते हैं। एक शासक ले लो और सभी बिंदुओं के करीब संभव के रूप में एक रेखा खींचना। यह सुनिश्चित करने की कोशिश करें कि लाइन के ऊपर जितने बिंदु हैं, उतने ही नीचे लाइन में हैं। एक बार लाइन खींचने के बाद, सीधी रेखा के समीकरण को खोजने के लिए मानक तरीकों का उपयोग करें
सीधी रेखा का समीकरण
एक बार सबसे अच्छे फिट की एक पंक्ति को एक बिखरे ग्राफ पर रखा गया है जो समीकरण को खोजने के लिए सीधा है। एक सीधी रेखा का सामान्य समीकरण है:
y = mx + c
जहाँ m, रेखा का ढलान (ढाल) है और c, y- अवरोधन है। ग्रेडिएंट प्राप्त करने के लिए, लाइन पर दो बिंदु खोजें। इस उदाहरण के लिए, मान लें कि दो बिंदु (1,3) और (0,1) हैं। ग्रेड को y-निर्देशांक में अंतर और x- निर्देशांक में अंतर से विभाजित करके गणना की जा सकती है:
m = (3 - 1) / (1 - 0) = 2/1 = 2
इस मामले में ढाल 2 के बराबर है। इस प्रकार, सीधी रेखा का समीकरण है
y = 2x + c
C के लिए मान ज्ञात बिंदु के लिए मानों में प्रतिस्थापित करके प्राप्त किया जा सकता है। उदाहरण के बाद, ज्ञात बिंदुओं में से एक (1,3) है। इसे समीकरण में प्लग करें और c के लिए फिर से व्यवस्थित करें:
3 = (2 * 1) + सी
c = 3 - 2 = 1
इस मामले में अंतिम समीकरण है:
y = 2x + १
रेखीय प्रतिगमन
रैखिक प्रतिगमन एक गणितीय विधि है जिसका उपयोग स्कैटर प्लॉट के स्ट्रेट-लाइन समीकरण को प्राप्त करने के लिए किया जा सकता है। अपना डेटा किसी तालिका में रखकर प्रारंभ करें। इस उदाहरण के लिए, मान लें कि हमारे पास निम्नलिखित डेटा हैं:
(4.1, 2.2) (6.5, 4.5) (12.6, 10.4)
X- मानों के योग की गणना करें:
x_sum = 4.1 + 6.5 + 12.6 = 23.2
इसके बाद, y- मानों के योग की गणना करें:
y_sum = 2.2 + 4.4 + 10.4 = 17
अब प्रत्येक डेटा-पॉइंट सेट के उत्पादों का योग करें:
xy_sum = (4.1 * 2.2) + (6.5 * 4.4) + (12.6 * 10.4) = 168.66
अगला, चुकाये गए x-मानों और y-मानों के योग की गणना करें:
x_square_sum = (4.1 ^ 2) + (6.5 ^ 2) + (12.6 ^ 2) = 217.82
y_square_sum = (2.2 ^ 2) + (4.5 ^ 2) + (10.4 ^ 2) = 133.25
अंत में, आपके पास मौजूद डेटा बिंदुओं की संख्या की गणना करें। इस मामले में हमारे पास तीन डेटा पॉइंट (N = 3) हैं। सबसे फिट लाइन के लिए ढाल से प्राप्त किया जा सकता है:
m = (N * xy_sum) - (x_sum * y_sum) / (N * x_square_sum) - (x_sum * x_sum) = (3 * 168.66) - (23.2 * 17) / (3 * 217.82) - (23.2 * 23.2) = (23.2 *) 0.968
सबसे फिट लाइन के लिए अवरोधन से प्राप्त किया जा सकता है:
c = (x_square_sum * y_sum) - (x_sum * xy_sum) / (N * x_square_sum) - (x_sum * x_sum)
= (217.82 17) - (23.2 168.66) / (3 * 217.82) - (23.2 * 23.2) = -1.82
अंतिम समीकरण इसलिए:
y = 0.968x - 1.82