वेरिएंस - एक्सेल और गूगल शीट्स

विषय - सूची

यह ट्यूटोरियल दर्शाता है कि कैसे उपयोग करना है एक्सेल वेरिएंस फंक्शन एक्सेल में दिए गए नमूने के आधार पर भिन्नता का अनुमान लगाने के लिए।

वेरिएंस फंक्शन अवलोकन

वेरिएंस फ़ंक्शन किसी दिए गए नमूने के आधार पर अनुमान भिन्नता की गणना करता है।

वेरिएंस एक्सेल वर्कशीट फ़ंक्शन का उपयोग करने के लिए, एक सेल चुनें और टाइप करें:

(ध्यान दें कि सूत्र इनपुट कैसे दिखाई देते हैं)

वेरिएंस फ़ंक्शन सिंटैक्स और इनपुट:

1 =VAR(नंबर1,[नंबर2],… )

नंबर- वेरिएंस पाने के लिए मान

एक्सेल में वेरिएंस की गणना कैसे करें

प्रसरण आपको बताता है कि डेटा सेट में मानों को माध्य से कैसे फैलाया जाता है। गणितीय रूप से कहें तो, विचरण माध्य से प्रत्येक स्कोर के चुकता अंतर का औसत है (लेकिन हम इसे जल्द ही प्राप्त करेंगे)।

एक्सेल आपको विचरण की गणना करने के लिए कई फ़ंक्शन देता है - VAR.S, VAR.P, VARA, VARPA, और दो पुराने फ़ंक्शन, VAR और VARP।

इससे पहले कि हम इन कार्यों में खुदाई करें और उनका उपयोग करना सीखें, आइए विचरण के बारे में बात करते हैं और इसकी गणना कैसे की जाती है।

भिन्नता क्या है?

डेटा का विश्लेषण करते समय, एक सामान्य पहला कदम माध्य की गणना करना है। यह निश्चित रूप से गणना करने के लिए एक उपयोगी आँकड़ा है, लेकिन यह आपको पूरी तस्वीर नहीं देता है कि आपके डेटा के साथ क्या हो रहा है।

निम्नलिखित डेटा सेट लें, जो १०० में से प्राप्त किए गए परीक्षा परिणामों का एक समूह हो सकता है:

1 48,49,50,51,52

इस श्रेणी का माध्य 50 है (संख्याओं का योग और n से भाग दें, जहाँ n मानों की संख्या है)।

अगला, परीक्षा परिणामों का निम्नलिखित सेट लें:

1 10,25,50,75,90

इस श्रेणी का माध्य है भी 50 - लेकिन जाहिर तौर पर हमारे यहां दो अलग-अलग डेटा रेंज हैं।

अपने आप में, माध्य आपको इस बारे में कुछ नहीं बता सकता कि स्कोर कितने फैले हुए हैं। यह आपको नहीं बताता है कि क्या सभी मान पहले उदाहरणों की तरह बँटे हुए हैं, या दूसरे की तरह व्यापक हैं। भिन्नता आपको इसे सीखने में मदद कर सकती है।

अधिक जटिल सांख्यिकीय प्रक्रियाओं की एक श्रृंखला के लिए भिन्नता का उपयोग आधार बिंदु के रूप में भी किया जाता है।

विचरण की गणना कैसे की जाती है

आइए एक बुनियादी उदाहरण के माध्यम से काम करते हैं, और हाथ से विचरण की गणना करते हैं। इस तरह, आपको पता चल जाएगा कि पर्दे के पीछे क्या चल रहा है जब आप वास्तव में एक्सेल के विचरण कार्यों को क्रिया में डालना शुरू करते हैं।

मान लें कि हमारे पास तीन प्लेइंग कार्ड्स, एक 4, एक 6 और 8 का प्रतिनिधित्व करने वाला डेटा सेट है।

विचरण की गणना करने के लिए, आप इस प्रक्रिया के माध्यम से काम करते हैं:

1) माध्य की गणना करें

सबसे पहले, हम माध्य की गणना करते हैं। हम जानते हैं कि हमारी डेटा रेंज 4, 6, 8 है, इसलिए इसका मतलब होगा:

1 (6 + 4 + 8) / 3 = 6

मैंने नीचे एक्सेल एवरेज फंक्शन<> के साथ इसकी पुष्टि की है:

1 = औसत (सी 4: सी 6)

2) डेटा सेट में प्रत्येक मान से माध्य घटाएं

इसके बाद, हम अपने प्रत्येक मान से माध्य घटाते हैं।

मैंने इसे निम्न सूत्र के साथ किया है:

1 =सी4-$एच$4

माध्य H4 में संग्रहीत है, इसलिए मैं इसे तालिका में प्रत्येक मान से घटाता हूं। डॉलर यहां केवल उस सेल संदर्भ को "लॉक" करता है जो एच 4 के संदर्भ में है, ताकि जब मैं इसे कॉलम के नीचे कॉपी करूं, तो यह वही रहता है।

परिणाम:

हमें मिल गया है:

123 4 - 6 = -26 - 6 = 08 - 6 = 2

हमें इन अंतरों का औसत माध्य से प्राप्त करने की आवश्यकता है, लेकिन इन तीन मानों का माध्य शून्य है! इसलिए हमें उन अंतरों पर जोर देने की जरूरत है, जो हम उन्हें चुकता करके करते हैं।

3) मतभेदों को स्क्वायर करें

आइए एक नया कॉलम जोड़ें, और कॉलम डी में संख्याओं का वर्ग करें:

1 =डी4*डी4

ठीक है, यह बेहतर है। अब जब अंतर शून्य से औसत नहीं है, तो हम विचरण की गणना कर सकते हैं।

4) चुकता अंतरों के औसत की गणना करें

यहाँ हम सड़क में एक कांटा से मिलते हैं। प्रसरण की गणना करने के दो तरीके हैं, और जो आप उपयोग करते हैं वह आपके पास मौजूद डेटा के प्रकार पर निर्भर करता है।

  • यदि आप उपयोग कर रहे हैं जनसंख्या डेटा, आप सामान्य रूप से माध्य लेते हैं (मानों का योग करें, और n से विभाजित करें)
  • यदि आप उपयोग कर रहे हैं नमूना डेटा, आप मानों का योग करते हैं, और n-1 . से विभाजित करते हैं

जनसंख्या डेटा का मतलब है कि आपके पास आवश्यक डेटा है, उदाहरण के लिए, यदि आप किसी विशेष स्कूल में शिक्षकों की औसत आयु चाहते हैं, और आपके पास उस स्कूल के प्रत्येक शिक्षक के लिए आयु डेटा है, तो आपके पास जनसंख्या डेटा है।

नमूना डेटा का मतलब है कि आपके पास अपना सारा डेटा नहीं है, बस एक बड़ी आबादी से लिया गया एक नमूना है। इसलिए यदि आप पूरे देश में शिक्षकों की औसत आयु चाहते हैं, और आपके पास केवल एक स्कूल के शिक्षकों का डेटा है, तो आपके पास नमूना डेटा है।

हमारे उदाहरण में, हमारे पास जनसंख्या डेटा है। हमें केवल अपने तीन कार्डों में दिलचस्पी है - वह जनसंख्या है, और हमने उनसे कोई नमूना नहीं लिया है। तो हम सामान्य तरीके से वर्ग अंतर का औसत निकाल सकते हैं:

1 =औसत(E4:E8)

तो हमारी जनसंख्या का प्रसरण 2.666 है।

अगर यह था नमूना डेटा (शायद हमने इन तीन कार्डों को एक बड़े सेट से निकाला है), हम औसत को निम्नानुसार काम करेंगे:

1 नमूना विचरण = (4 + 0 + 4) / (3 - 1)

या:

1 नमूना विचरण = 8/2 = 4

नमूना डेटा के साथ n-1 से विभाजित क्यों करें, बस n के बजाय?

इस प्रश्न का संक्षिप्त उत्तर है "क्योंकि यह सही उत्तर देता है"। लेकिन मुझे लगता है कि आप उससे थोड़ा अधिक चाहते हैं! यह एक जटिल विषय है इसलिए मैं यहाँ केवल एक संक्षिप्त विवरण दूंगा।

इसे इस तरह से सोचें: यदि आप किसी जनसंख्या से डेटा का एक नमूना लेते हैं, तो वे मान औसत के करीब होंगे नमूना की तुलना में वे के मतलब के लिए कर रहे हैं आबादी.

इसका मतलब है कि यदि आप केवल n से विभाजित करते हैं, तो आप जनसंख्या भिन्नता को थोड़ा कम करके आंकेंगे। n-1 से भाग देने पर यह थोड़ा ठीक हो जाता है।

हमारे तीन कार्डों के सेट के साथ, हम इस सिद्धांत का परीक्षण करने के लिए एक अच्छी जगह पर हैं। चूंकि केवल तीन कार्ड हैं, इसलिए बहुत कम नमूने हैं जिन्हें हम संभवतः ले सकते हैं।

आइए दो कार्डों के नमूने लें। हम एक कार्ड चुनेंगे, उसे वापस रखेंगे, फेरबदल करेंगे और फिर दूसरा कार्ड चुनेंगे। इसका मतलब है कि हम दो कार्डों के नौ संयोजन चुन सकते हैं।

केवल नौ संभावित नमूनों के साथ, हम दोनों विधियों का उपयोग करके हर संभव नमूना विचरण की गणना कर सकते हैं (n से विभाजित करें, और n-1 से विभाजित करें), उनका औसत लें, और देखें कि कौन सा हमें सही उत्तर देता है।

नीचे दी गई तालिका में, मैंने सब कुछ निर्धारित कर दिया है। तालिका की प्रत्येक पंक्ति एक अलग नमूना है, और कॉलम बी और सी प्रत्येक नमूने में चुने गए दो कार्ड दिखाते हैं। फिर मैंने दो और कॉलम जोड़े हैं: एक जहां मैंने n से विभाजित करके दो कार्डों के उस नमूने के विचरण की गणना की, और दूसरा जहां मैंने n - 1 से विभाजित किया।

जरा देखो तो:

तालिका के दाईं ओर, मैंने कॉलम D और E का औसत दिखाया है।

कॉलम डी का औसत, जब n से विभाजित होता है, तो हमें 1.333 का विचरण मिलता है।

स्तंभ E का औसत, जब n-1 से विभाजित किया जाता है, तो हमें 2.666 का प्रसरण मिलता है।

हम अपने पिछले उदाहरण से पहले से ही जानते हैं कि जनसंख्या का विचरण 2.666 है। इसलिए नमूना डेटा का उपयोग करते समय n-1 से विभाजित करने से हमें अधिक सटीक अनुमान मिलते हैं।

विचरण की गणना करने के लिए एक्सेल कार्य

अब जब आपने एक उदाहरण देख लिया है कि विचरण की गणना कैसे की जाती है, तो चलिए एक्सेल फ़ंक्शन पर चलते हैं।

आपके पास यहां कई विकल्प हैं:

  • पी जनसंख्या डेटा के लिए विचरण देता है (n विधि द्वारा विभाजित का उपयोग करके)
  • एस नमूना डेटा के लिए विचरण देता है (n-1 से विभाजित)
  • वीएआर एक पुराना फ़ंक्शन है जो ठीक उसी तरह काम करता है जैसे VAR.S
  • वारा VAR.S के समान है, सिवाय इसके कि इसमें टेक्स्ट सेल और बूलियन मान शामिल हैं
  • वरपा VAR.P के समान है, सिवाय इसके कि इसमें टेक्स्ट सेल और बूलियन मान शामिल हैं

आइए एक-एक करके इन पर गौर करें।

एक्सेल VAR.P फ़ंक्शन

VAR.P जनसंख्या डेटा के लिए विचरण की गणना करता है (n विधि द्वारा विभाजित का उपयोग करके)। इसे इस तरह इस्तेमाल करें:

1 =VAR.P(C4:C6)

आप VAR.P में केवल एक तर्क को परिभाषित करते हैं: वह डेटा श्रेणी जिसके लिए आप विचरण की गणना करना चाहते हैं। यहां हमारे मामले में, वह C4:C6 में कार्ड मान है।

जैसा कि आप ऊपर देखते हैं VAR.P हमारे तीन कार्डों के सेट के लिए 2.666 देता है। यह वही मान है जिसकी गणना हमने पहले हाथ से की थी।

ध्यान दें कि VAR.P टेक्स्ट या बूलियन (TRUE/FALSE) मानों वाले सेल को पूरी तरह से अनदेखा कर देता है। यदि आपको इन्हें शामिल करने की आवश्यकता है, तो इसके बजाय VARPA का उपयोग करें।

एक्सेल VAR.S फंक्शन

VAR.S नमूना डेटा के लिए विचरण की गणना करता है (n-1 से विभाजित)। आप इसे इस तरह इस्तेमाल करते हैं:

1 =VAR.S(C4:C6)

फिर से, केवल एक तर्क है - आपकी डेटा श्रेणी।

इस मामले में VAR.S 4 देता है। जब हमने ऊपर मैन्युअल गणना की तो हमें चरण 4 में वही आंकड़ा मिला।

VAR.S टेक्स्ट या बूलियन (TRUE/FALSE) मानों वाले सेल को पूरी तरह से अनदेखा कर देता है। यदि आपको इन्हें शामिल करने की आवश्यकता है, तो इसके बजाय VARA का उपयोग करें।

एक्सेल वार फंक्शन

VAR पूरी तरह से VAR.S के बराबर है: यह नमूना डेटा के लिए भिन्नताओं की गणना करता है (n-1 विधि का उपयोग करके)। यहां इसका उपयोग करने का तरीका बताया गया है:

1 =VAR(C4:C6)

VAR एक "संगतता फ़ंक्शन" है। इसका मतलब है कि माइक्रोसॉफ्ट इस फंक्शन को एक्सेल से हटाने की प्रक्रिया में है। फिलहाल यह अभी भी उपयोग के लिए उपलब्ध है, लेकिन आपको इसके बजाय VAR.S का उपयोग करना चाहिए, ताकि आपकी स्प्रैडशीट्स एक्सेल के भविष्य के संस्करणों के साथ संगत रहें।

एक्सेल वारा फंक्शन

VARA नमूना डेटा का विचरण भी लौटाता है, लेकिन इसमें VAR और VAR.S के कुछ महत्वपूर्ण अंतर हैं। अर्थात्, इसकी गणना में बूलियन और टेक्स्ट मान शामिल हैं:

  • TRUE मान 1 . के रूप में गिने जाते हैं
  • FALSE मान 0 . के रूप में गिने जाते हैं
  • टेक्स्ट स्ट्रिंग्स को 0 . के रूप में गिना जाता है

यहां बताया गया है कि आप इसका उपयोग कैसे करते हैं:

1 =वरा(सी4:सी11)

हमने तालिका में पाँच और पंक्तियाँ जोड़ी हैं: J, Q, K, TRUE, और FALSE। कॉलम डी दिखाता है कि VARA इन मूल्यों की व्याख्या कैसे करता है।

क्योंकि अब हमारी तालिका में निम्न मानों का एक नया बैच है, विचरण बढ़कर 10.268 हो गया है।

एक्सेल वारपा फंक्शन

VARPA जनसंख्या डेटा के लिए प्रसरण की गणना करता है। यह VAR.P के समान है, सिवाय इसके कि इसमें गणना में बूलियन मान और टेक्स्ट स्ट्रिंग भी शामिल हैं:

  • TRUE मान 1 . के रूप में गिने जाते हैं
  • FALSE मान 0 . के रूप में गिने जाते हैं
  • टेक्स्ट स्ट्रिंग्स को 0 . के रूप में गिना जाता है

आप इसे इस तरह इस्तेमाल करते हैं:

1 =वरपा (C4:C12)

हमने तालिका में पाँच और पंक्तियाँ जोड़ी हैं: J, Q, K, TRUE, और FALSE। कॉलम डी दिखाता है कि वीएआरपीए इन मूल्यों की व्याख्या कैसे करता है।

निम्न मानों के इस समूह को डेटा में जोड़ने के परिणामस्वरूप, विचरण बढ़कर 8.984 हो गया है।

Google पत्रक में भिन्नता फ़ंक्शन

CORREL फ़ंक्शन Google शीट्स में ठीक उसी तरह काम करता है जैसे Excel में होता है:

आप साइट के विकास में मदद मिलेगी, अपने दोस्तों के साथ साझा करने पेज

wave wave wave wave wave