विषय
डेटा के सेट पर एक सीधी रेखा को फिट करते समय, आप यह निर्धारित करने में रुचि रख सकते हैं कि परिणामी रेखा डेटा को कितनी अच्छी तरह फिट करती है। ऐसा करने का एक तरीका वर्गों की त्रुटि (एसएसई) की राशि की गणना करना है। यह मान एक माप प्रदान करता है कि डेटा सेट कितनी अच्छी तरह से फिट होता है। एसएसई प्रयोगात्मक डेटा के विश्लेषण के लिए एक महत्वपूर्ण है और केवल कुछ ही छोटे चरणों के माध्यम से निर्धारित किया जाता है।
प्रतिगमन का उपयोग करके डेटा को मॉडल करने के लिए सबसे उपयुक्त की एक पंक्ति का पता लगाएं। सबसे अच्छी फिट की लाइन में y = ax + b है, जहां a और b ऐसे पैरामीटर हैं, जिन्हें आपको निर्धारित करने की आवश्यकता है। आप एक साधारण रैखिक प्रतिगमन विश्लेषण का उपयोग करके इन मापदंडों को पा सकते हैं। उदाहरण के लिए, मान लीजिए कि सबसे अच्छी फिट की रेखा के पास y = 0.8x + 7 है।
समीकरण का उपयोग करें प्रत्येक y- मूल्य का निर्धारण करने के लिए सर्वोत्तम फिट की रेखा द्वारा निर्धारित किया गया है। आप पंक्ति के समीकरण में प्रत्येक x- मान को प्रतिस्थापित करके ऐसा कर सकते हैं। उदाहरण के लिए, यदि x 1 के बराबर है, तो प्रतिस्थापित करना कि समीकरण y = 0.8x + 7 में y- मान के लिए 7.8 मिलता है।
सर्वोत्तम फिट समीकरण की रेखा से अनुमानित मूल्यों का मतलब निर्धारित करें। आप समीकरणों से पूर्वानुमानित सभी y-मानों को योग करके, और परिणामी संख्या को मानों की संख्या से विभाजित कर सकते हैं। उदाहरण के लिए, यदि मान 7.8, 8.6 और 9.4 हैं, तो इन मानों को योग 25.8 देता है, और मानों की संख्या से इस संख्या को विभाजित करते हुए, इस मामले में 3, 8.6 देता है।
प्रत्येक व्यक्तिगत मान को माध्य से घटाएं, और परिणामी संख्या को वर्गाकार करें। हमारे उदाहरण में, यदि हम औसत 8.6 से मान 7.8 घटाते हैं, तो परिणामी संख्या 0.8 है। इस मान को चुकाना 0.64 देता है।
चरण 4 से सभी वर्ग मानों को जोड़ दें। यदि आप चरण 4 में दिए गए निर्देशों को हमारे सभी उदाहरणों में लागू करते हैं, तो आपको 0.64, 0 और 0.64 के मान मिलेंगे। इन मूल्यों को समेटने से 1.28 प्राप्त होते हैं। यह वर्ग त्रुटि का योग है।