कैसे एक क्लस्टरिंग विश्लेषण में Centroid खोजने के लिए

Posted on
लेखक: Judy Howell
निर्माण की तारीख: 1 जुलाई 2021
डेट अपडेट करें: 15 नवंबर 2024
Anonim
K का अर्थ है क्लस्टरिंग - सेंट्रोइड ढूंढना
वीडियो: K का अर्थ है क्लस्टरिंग - सेंट्रोइड ढूंढना

विषय

क्लस्टर विश्लेषण समान विशेषताओं के आधार पर प्रतिनिधि समूहों में डेटा को व्यवस्थित करने की एक विधि है। क्लस्टर के प्रत्येक सदस्य में अन्य समूहों के सदस्यों की तुलना में समान क्लस्टर के अन्य सदस्यों के साथ सामान्य रूप से अधिक है। समूह के भीतर सबसे अधिक प्रतिनिधि बिंदु को केन्द्रक कहा जाता है। आमतौर पर, यह क्लस्टर में डेटा के बिंदुओं के मूल्यों का मतलब है।


    डेटा व्यवस्थित करें। यदि डेटा में एक एकल चर होता है, तो एक हिस्टोग्राम उपयुक्त हो सकता है। यदि दो चर शामिल हैं, तो समन्वय विमान पर डेटा को ग्राफ़ करें। उदाहरण के लिए, यदि आप कक्षा में स्कूली बच्चों की ऊंचाई और वजन देख रहे हैं, तो ग्राफ पर प्रत्येक बच्चे के लिए डेटा के बिंदुओं को प्लॉट करें, जिसमें वजन क्षैतिज अक्ष और ऊंचाई ऊर्ध्वाधर अक्ष हो। यदि दो से अधिक चर शामिल हैं, तो डेटा प्रदर्शित करने के लिए मेट्रिसेस की आवश्यकता हो सकती है।

    डेटा को समूहों में समूहित करें। प्रत्येक क्लस्टर में इसके निकटतम डेटा के बिंदु शामिल होने चाहिए। ऊंचाई और वजन के उदाहरण में, डेटा के किसी भी बिंदु को समूह करें जो एक साथ करीब दिखाई देते हैं। समूहों की संख्या, और क्या डेटा के प्रत्येक बिंदु को क्लस्टर में होना है, अध्ययन के उद्देश्यों पर निर्भर हो सकता है।

    प्रत्येक क्लस्टर के लिए, सभी सदस्यों के मान जोड़ें।उदाहरण के लिए, यदि डेटा के एक क्लस्टर में अंक (80, 56), (75, 53), (60, 50), और (68,54) शामिल हैं, तो मानों का योग (283, 213) होगा।

    क्लस्टर के सदस्यों की संख्या से कुल को विभाजित करें। ऊपर दिए गए उदाहरण में, चार द्वारा विभाजित 283 70.75 है, और 213 चार से विभाजित 53.25 है, इसलिए क्लस्टर का केंद्रक (70.75, 53.25) है।


    क्लस्टर सेंट्रोइड्स को प्लॉट करें और यह निर्धारित करें कि क्या कोई बिंदु किसी अन्य क्लस्टर के सेंट्रोइड के करीब है कि वे अपने स्वयं के क्लस्टर के सेंट्रोइड के बराबर हैं। यदि कोई बिंदु एक अलग सेंट्रोइड के करीब हैं, तो क्लस्टर को करीब सेंट्रोइड पर पुनर्वितरित करें।

    चरण 3, 4 और 5 को दोहराएं जब तक कि डेटा के सभी बिंदु उस क्लस्टर में नहीं होते हैं जिसमें सेंट्रोइड होता है जिसमें वे निकटतम हैं।

    टिप्स