मानक विचलन - एक्सेल और गूगल शीट्स

विषय - सूची

यह ट्यूटोरियल दर्शाता है कि कैसे उपयोग करना है एक्सेल मानक विचलन समारोह एक्सेल में संपूर्ण जनसंख्या के लिए मानक विचलन की गणना करने के लिए।

मानक विचलन समारोह अवलोकन

मानक विचलन फ़ंक्शन एक संपूर्ण जनसंख्या के लिए मानक विचलन की गणना करता है।

मानक विचलन एक्सेल वर्कशीट फ़ंक्शन का उपयोग करने के लिए, एक सेल का चयन करें और टाइप करें:

(ध्यान दें कि सूत्र इनपुट कैसे दिखाई देते हैं)

मानक विचलन फ़ंक्शन सिंटैक्स और इनपुट:

1 =एसटीडीईवी(नंबर1,[नंबर2],… )

नंबर- मानक विचरण प्राप्त करने के लिए मान

एक्सेल में मानक विचलन की गणना कैसे करें

जब भी आप डेटा के साथ काम कर रहे हों, तो आप इसे समझने में मदद करने के लिए कुछ बुनियादी परीक्षण चलाना चाहेंगे। आप आमतौर पर एक्सेल एवरेज फंक्शन<> का उपयोग करके माध्य की गणना करके शुरू करेंगे।

इससे आपको अंदाजा हो जाता है कि डेटा का "मध्य" कहां है। और वहां से, आप यह देखना चाहेंगे कि इस मध्य बिंदु के आसपास डेटा कितना फैला हुआ है। यह वह जगह है जहाँ मानक विचलन आता है।

एक्सेल आपको मानक विचलन की गणना करने के लिए कई फ़ंक्शन देता है - STDEV, STDEV.P, STDEV.S, और DSTDEV। हम उन सभी तक पहुंचेंगे, लेकिन पहले, आइए जानें कि मानक विचलन क्या है है, बिल्कुल सही।

मानक विचलन क्या है?

मानक विचलन आपको इस बात का अंदाजा देता है कि आपके डेटा बिंदु माध्य से कितनी दूर हैं। 100 में से टेस्ट स्कोर का निम्नलिखित डेटा सेट लें:

1 48,49,50,51,52

इस डेटा सेट का माध्य ५० है (सभी संख्याओं को जोड़ें, और n से विभाजित करें, जहां n श्रेणी में मानों की संख्या है)।

अब डेटा के इस अगले सेट को देखें:

1 10,25,50,75,90

इस डेटा सेट का माध्य है भी 50 - लेकिन दोनों श्रेणियां एक बहुत ही अलग कहानी बताती हैं। यदि आपने अभी-अभी माध्य का उपयोग किया है, तो आप सोच सकते हैं कि दोनों समूह अपनी योग्यता में लगभग बराबर थे - और औसतन, वे हैं।

लेकिन पहले समूह में, हमारे पास 5 लोग हैं, जिन्हें बहुत समान, बहुत ही औसत दर्जे का स्कोर मिला है। और दूसरे समूह में, हम कुछ उच्च-यात्रियों के बीच में एक व्यक्ति के साथ, कुछ गरीब-स्कोररों द्वारा संतुलित किया गया। NS फैला हुआ अंकों की संख्या बहुत भिन्न होती है, जिससे डेटा की आपकी व्याख्या भी बहुत भिन्न होती है।

मानक विचलन इस प्रसार का एक उपाय है।

मानक विचलन की गणना कैसे की जाती है

यह समझने के लिए कि मानक विचलन क्या है और यह कैसे काम करता है, यह हाथ से एक उदाहरण के माध्यम से काम करने में मदद कर सकता है। इस तरह, आपको पता चल जाएगा कि "अंडर-द-हुड" में क्या हो रहा है, जब हम एक्सेल फ़ंक्शंस प्राप्त कर सकते हैं जिनका आप उपयोग कर सकते हैं।

मानक विचलन की गणना करने के लिए, आप इस प्रक्रिया के माध्यम से काम करते हैं:

1) माध्य की गणना करें

आइए अपना पहला डेटा ऊपर सेट करें: 48,49,50,51,52

हम पहले से ही माध्य (50) जानते हैं, जिसकी पुष्टि मैंने यहां एक्सेल एवरेज फंक्शन<> से की है:

1 = औसत (C4:C8)

2) डेटा सेट में प्रत्येक मान से माध्य घटाएं

मैंने इसे निम्न सूत्र के साथ किया है:

1 =सी4-$एच$4

हमारा माध्य H4 में है, और मैंने कॉलम और पंक्ति (F4 दबाकर) से पहले डॉलर के संकेत डालकर सेल संदर्भ को "लॉक" कर दिया है। इसका मतलब है कि मैं सेल रेफरेंस अपडेट किए बिना फॉर्मूला को कॉलम के नीचे कॉपी कर सकता हूं।

परिणाम:

अब, यहाँ एक सेकंड के लिए रुकें। यदि आप नए कॉलम पर एक नज़र डालते हैं - आप देखेंगे कि यहाँ संख्याएँ शून्य तक जुड़ जाती हैं। इन संख्याओं का माध्य भी शून्य होता है।

बेशक, हमारे डेटा का प्रसार शून्य नहीं हो सकता - हम जानते हैं कि वहां कुछ भिन्नता है। हमें इस भिन्नता का प्रतिनिधित्व करने का एक तरीका चाहिए, बिना औसत शून्य के।

3) मतभेदों को स्क्वायर करें

हम मतभेदों को चुकता करके इसे हासिल कर सकते हैं। तो, चलिए एक नया कॉलम जोड़ते हैं, और D कॉलम में संख्याओं का वर्ग बनाते हैं:

1 =डी4*डी4

यह बेहतर दिख रहा है। अब हमारे पास कुछ भिन्नता है, और भिन्नता की मात्रा इस बात से संबंधित है कि प्रत्येक अंक माध्य से कितनी दूर है।

4) प्रसरण की गणना करें - चुकता अंतर का माध्य

अगला कदम, उन चुकता अंतरों का औसत प्राप्त करना है। मानक विचलन की गणना करते समय वास्तव में ऐसा करने के दो तरीके हैं।

  • यदि आप उपयोग कर रहे हैं जनसंख्या डेटा, आप बस माध्य लेते हैं (मानों का योग करें, और n से विभाजित करें)
  • यदि आप उपयोग कर रहे हैं नमूना डेटा, आप मानों का योग लेते हैं, और विभाजित करते हैं एन-1

जनसंख्या डेटा का अर्थ है कि आपके पास अपने डेटा का "पूर्ण सेट" है, उदाहरण के लिए, आपके पास किसी कक्षा में प्रत्येक छात्र का डेटा है।

नमूना डेटा का मतलब है कि आपके पास अपना सारा डेटा नहीं है, बस एक बड़ी आबादी से लिया गया एक नमूना है। आमतौर पर, नमूना डेटा के साथ आपका लक्ष्य यह अनुमान लगाना है कि बड़ी आबादी में मूल्य क्या है।

एक राजनीतिक जनमत सर्वेक्षण नमूना डेटा का एक अच्छा उदाहरण है - शोधकर्ता सर्वेक्षण, कहते हैं, 1,000 लोगों को यह पता लगाने के लिए कि एक पूरा देश या राज्य क्या सोच रहा है।

यहां हमारे पास कोई नमूना नहीं है। हमारे पास केवल पांच सांख्यिकीय-दिमाग वाले परिवार के सदस्य हैं जो एक परीक्षण के मानक विचलन की गणना करना चाहते हैं जो उन्होंने सभी लिया। हमारे पास सभी डेटा बिंदु हैं, और हम लोगों के एक बड़े समूह का अनुमान नहीं लगा रहे हैं। यह जनसंख्या डेटा है - इसलिए हम यहां केवल औसत ले सकते हैं:

1 =औसत(E4:E8)

ठीक है, तो हमें 2 मिल गया है। इस स्कोर को "विचरण" के रूप में जाना जाता है, और यह मानक विचलन सहित कई सांख्यिकीय परीक्षणों का आधार बिंदु है। आप इसके मुख्य पृष्ठ पर विचरण के बारे में अधिक पढ़ सकते हैं: एक्सेल में विचरण की गणना कैसे करें<>।

5) विचरण का वर्गमूल प्राप्त करें

हमने पहले अपने नंबरों को चुकता कर दिया था, जो स्पष्ट रूप से मूल्यों को थोड़ा बढ़ा देता है। तो अंक को माध्य से वास्तविक अंतर के अनुरूप लाने के लिए, हमें चरण 4 के परिणाम को वर्गमूल करने की आवश्यकता है:

1 = एसक्यूआरटी (एच 4)

और हमारे पास हमारा परिणाम है: मानक विचलन 1.414 . है

क्योंकि हमने अपनी पिछली चुकता संख्याओं का वर्गमूल किया है, मानक विचलन मूल डेटा के समान इकाइयों में दिया गया है। तो मानक विचलन यहाँ 1.414 परीक्षण अंक है।

मानक विचलन जब डेटा अधिक फैला हुआ होता है

इससे पहले हमारे पास दूसरा उदाहरण डेटा रेंज था: 10,25,50,75,90

केवल मनोरंजन के लिए, आइए देखें कि जब हम इस डेटा पर मानक विचलन की गणना करते हैं तो क्या होता है:

सभी सूत्र बिल्कुल पहले जैसे ही हैं (ध्यान दें कि समग्र माध्य अभी भी 50 है)।

केवल एक चीज जो बदल गई वह थी कॉलम सी में अंकों का प्रसार। लेकिन अब, हमारा मानक विचलन 29.832 परीक्षण बिंदुओं पर बहुत अधिक है।

बेशक, चूंकि हमारे पास केवल 5 डेटा पॉइंट हैं, इसलिए यह देखना बहुत आसान है कि स्कोर का प्रसार दो सेटों के बीच भिन्न होता है। लेकिन जब आपके पास १०० या १,००० के डेटा बिंदु हों, तो आप केवल डेटा को तुरंत स्कैन करके यह नहीं बता सकते। और यही कारण है कि हम मानक विचलन का उपयोग करते हैं।

एक्सेल मानक विचलन की गणना करने के लिए कार्य करता है

अब जब आप जानते हैं कि मानक विचलन कैसे काम करता है, तो आपको मानक विचलन पर पहुंचने के लिए उस पूरी प्रक्रिया से गुजरने की आवश्यकता नहीं है। आप केवल एक्सेल के अंतर्निहित कार्यों में से एक का उपयोग कर सकते हैं।

इस उद्देश्य के लिए एक्सेल के कई कार्य हैं:

  • पी जनसंख्या डेटा के लिए मानक विचलन की गणना करता है (उपरोक्त उदाहरण में हमारे द्वारा उपयोग की गई सटीक विधि का उपयोग करके)
  • एस नमूना डेटा के लिए मानक विचलन की गणना करता है (एन -1 विधि का उपयोग करके जिसे हमने पहले छुआ था)
  • एसटीडीईवी बिल्कुल STDEV.S जैसा ही है। यह एक पुराना फ़ंक्शन है जिसे STDEV.S और STDEV.P द्वारा बदल दिया गया है।
  • STDEVA STDEV.S के समान है, सिवाय इसके कि इसमें गणना करते समय टेक्स्ट सेल और बूलियन (TRUE/FALSE) सेल शामिल हैं।
  • एसटीदेवपा STDEV.P के समान है, सिवाय इसके कि इसमें गणना करते समय टेक्स्ट सेल और बूलियन (TRUE/FALSE) सेल शामिल हैं।

वाह, यहाँ बहुत सारे विकल्प हैं! भयभीत न हों - अधिकांश मामलों में, आप या तो STDEV.P या STDEV.S का उपयोग कर रहे होंगे।

आइए इनमें से प्रत्येक को बारी-बारी से देखें, STDEV.P से शुरू करते हुए, क्योंकि यही वह तरीका है जिससे हमने अभी काम किया है।

एक्सेल STDEV.P फ़ंक्शन

STDEV.P जनसंख्या डेटा के लिए मानक विचलन की गणना करता है। आप इसे इस तरह इस्तेमाल करते हैं:

1 =STDEV.P(C4:C8)

आप STDEV.P में एक तर्क को परिभाषित करते हैं: वह डेटा श्रेणी जिसके लिए आप मानक विचलन की गणना करना चाहते हैं।

यह वही उदाहरण है जिसे हमने ऊपर चरण-दर-चरण के माध्यम से देखा जब हमने हाथ से मानक विचलन की गणना की। और जैसा कि आप ऊपर देख सकते हैं, हमें ठीक वैसा ही परिणाम मिलता है - १.४१४।

नोट STDEV.P टेक्स्ट या बूलियन (TRUE/FALSE) मान वाले किसी भी सेल की उपेक्षा करता है। यदि आपको इन्हें शामिल करने की आवश्यकता है, तो STDEVPA का उपयोग करें।

एक्सेल STDEV.S फ़ंक्शन

STDEV.S नमूना डेटा के लिए मानक विचलन की गणना करता है। इसे इस तरह इस्तेमाल करें:

1 =STDEV.S(C4:C8)

फिर, यह एक तर्क लेता है - डेटा की वह श्रेणी जिसके लिए आप मानक विचलन जानना चाहते हैं।

एक उदाहरण में आने से पहले, आइए STDEV.S और STDEV.P के बीच के अंतर पर चर्चा करें।

जैसा कि हमने पहले ही चर्चा की है, नमूना डेटा पर STDEV.S का उपयोग किया जाना चाहिए - जब आपका डेटा एक बड़े सेट का हिस्सा हो। तो चलिए अब मान लेते हैं, कि ऊपर हमारे उदाहरण में, अधिक लोगों ने परीक्षा दी थी। हम केवल इन पांच अंकों का उपयोग करके परीक्षा देने वाले सभी लोगों के मानक विचलन का अनुमान लगाना चाहते हैं। अब हम नमूना डेटा का उपयोग कर रहे हैं।

अब, गणना ऊपर चरण (4) से भिन्न होती है, जब हम विचरण की गणना कर रहे होते हैं - समग्र माध्य से प्रत्येक स्कोर के वर्ग अंतर का औसत।

सामान्य विधि का उपयोग करने के बजाय - सभी मानों को जोड़ दें, और n से विभाजित करें, हम सभी मानों को जोड़ देंगे और विभाजित करेंगे एन-1:

1 =SUM(E4:E8) / (COUNT(E4:E8)-1)

इस सूत्र में:

  • SUM को चुकता अंतरों का योग मिलता है
  • COUNT हमारा n लौटाता है, जिसे हम 1 से घटाते हैं
  • हम तब अपने योग को हमारे n-1 . से विभाजित करते हैं

इस बार, चुकता अंतर का माध्य 2.5 है (आपको याद होगा कि यह पहले 2 था, इसलिए यह थोड़ा अधिक है)।

तो नमूना डेटा से निपटने के दौरान हम n के बजाय n-1 से विभाजित क्यों करते हैं?

इसका उत्तर काफी जटिल है, और यदि आप अपने डेटा को समझने के लिए केवल अपने नंबरों को चलाने की कोशिश कर रहे हैं, तो यह ऐसा कुछ नहीं है जिसके बारे में आपको वास्तव में चिंता करने की आवश्यकता है। बस सुनिश्चित करें कि आप नमूना डेटा के लिए STDEV.S और जनसंख्या डेटा के लिए STDEV.P का उपयोग कर रहे हैं, और आप ठीक हो जाएंगे।

यदि आप वास्तव में यह जानने के लिए उत्सुक हैं कि क्यों, एक्सेल में विचरण की गणना करने के तरीके पर मुख्य पृष्ठ देखें<>।

ठीक है तो अब हमें नमूने के लिए विचरण मिल गया है, इसलिए नमूने के लिए मानक विचलन प्राप्त करने के लिए, हमें विचरण का वर्गमूल प्राप्त होगा:

1 = एसक्यूआरटी (एच 4)

हमें 1.581 मिलता है।

STDEV.S हमारे लिए उपरोक्त सभी गणना करता है, और केवल एक सेल में नमूना मानक विचलन लौटाता है। तो आइए देखें कि यह क्या लेकर आता है…

1 =STDEV.S(C4:C8)

हां, 1.581 फिर से।

एक्सेल एसटीडीईवी फ़ंक्शन

एक्सेल का एसटीडीईवी फंक्शन ठीक उसी तरह काम करता है जैसे एसटीडीईवी.एस - यानी यह डेटा के नमूने के लिए मानक विचलन की गणना करता है।

आप इसे उसी तरह इस्तेमाल करते हैं:

1 =एसटीडीईवी(सी4:सी8)

फिर से हमें वही परिणाम मिलता है।

महत्वपूर्ण लेख: एसटीडीईवी एक "कम्पैटिबिलिटी फंक्शन" है, जिसका मूल रूप से मतलब है कि माइक्रोसॉफ्ट इससे छुटकारा पा रहा है। यह अभी भी काम करता है, इसलिए कोई भी पुरानी स्प्रैडशीट सामान्य रूप से काम करती रहेगी। लेकिन एक्सेल के भविष्य के संस्करणों में, माइक्रोसॉफ्ट इसे पूरी तरह से छोड़ सकता है, इसलिए जहां भी संभव हो, आपको एसटीडीईवी के बजाय एसटीडीईवी.एस का उपयोग करना चाहिए।

एक्सेल STDEVA फंक्शन

STDEVA का उपयोग नमूने के लिए मानक विचलन की गणना के लिए भी किया जाता है, लेकिन इसमें कुछ महत्वपूर्ण अंतर हैं जिनके बारे में आपको जानना आवश्यक है:

  • TRUE मान 1 . के रूप में गिने जाते हैं
  • FALSE मान 0 . के रूप में गिने जाते हैं
  • टेक्स्ट स्ट्रिंग्स को 0 . के रूप में गिना जाता है

इसे इस प्रकार प्रयोग करें:

1 =STDEVA(C4:C8)

चार और दोस्तों और परिवार के सदस्यों ने अपने टेस्ट स्कोर में दिए हैं। ये कॉलम सी में दिखाए गए हैं, और कॉलम डी इंगित करता है कि एसटीडीईवीए इस डेटा की व्याख्या कैसे करता है।

क्योंकि इन कोशिकाओं की व्याख्या ऐसे कम मूल्यों के रूप में की जाती है, यह हमारे डेटा के बीच पहले की तुलना में बहुत व्यापक प्रसार बनाता है, जिसने मानक विचलन को बहुत बढ़ा दिया है, अब 26.246 पर।

एक्सेल एसटीडीईवीपीए फ़ंक्शन

STDEVPA, STDEV.P की तरह ही जनसंख्या के लिए मानक विचलन की गणना करता है। हालांकि, इसमें गणना में बूलियन मान और टेक्स्ट स्ट्रिंग भी शामिल हैं, जिनकी व्याख्या इस प्रकार की जाती है:

  • TRUE मान 1 . के रूप में गिने जाते हैं
  • FALSE मान 0 . के रूप में गिने जाते हैं
  • टेक्स्ट स्ट्रिंग्स को 0 . के रूप में गिना जाता है

आप इसे इस तरह इस्तेमाल करते हैं:

1 =STDEVPA(C4:C12)

मानक विचलन की गणना करने से पहले डेटा फ़िल्टर करना

वास्तविक दुनिया में, आपके पास हमेशा वह सटीक डेटा नहीं होगा जिसकी आपको एक अच्छी साफ-सुथरी तालिका में आवश्यकता होती है। अक्सर, आपके पास डेटा से भरी एक बड़ी स्प्रेडशीट होगी, जिसे मानक विचलन की गणना करने से पहले आपको फ़िल्टर करना होगा।

आप इसे एक्सेल के डेटाबेस फ़ंक्शंस के साथ बहुत आसानी से कर सकते हैं: डीएसटीडीईवी (नमूनों के लिए) और डीएसटीडीईवीपी (आबादी के लिए)।

ये फ़ंक्शन आपको एक मानदंड तालिका बनाने में सक्षम करते हैं, जिसमें आप अपने लिए आवश्यक सभी फ़िल्टर परिभाषित कर सकते हैं। मानक विचलन को वापस करने से पहले फ़ंक्शन इन फ़िल्टरों को पर्दे के पीछे लागू करते हैं। इस तरह आपको किसी ऑटोफ़िल्टर को छूने या डेटा को एक अलग शीट में खींचने की ज़रूरत नहीं है - DSTDEV और SDTDEVP आपके लिए वह सब कर सकते हैं।

एक्सेल DSTDEV और DSTDEVP फ़ंक्शंस<> के लिए मुख्य पृष्ठ पर अधिक जानें।

Google पत्रक में मानक विचलन कार्य

मानक विचलन फ़ंक्शन Google शीट्स में ठीक उसी तरह काम करता है जैसे एक्सेल में:

wave wave wave wave wave