अगर आप कंप्यूटर यूजर हैं या मोबाइल इस्तेमाल करते हैं या फिर कोई Technical device आप उपयोग कर रहे हैं तो आपने डाटा शब्द जरूर सुना होगा. दोस्तों Data शब्द Datum का बहुवचन रूप है. Data का मतलब है तथ्य, तथ्य इनमे से कुछ भी हो सकता है नंबर, नाम, और symbol. इन तथ्यों को एक जुट करके analysis करने के लिए इस्तेमाल किया जाता है. Data कोई Text, Picture, Sound में से कुछ भी हो सकता है. डाटा को निचे दिए गए Character से Represent किया जाता है. Number– 234, 44.40, 506, 1000, 121.50, 3111.50. Symbols– @, #, %, *, $. Character-A, B, C, D, e, f, g, h, i String– raj, riya, pathan, tony, rahul. उदहारण के तौर पर मान लो कोई एक Student है उसका नाम, roll no, mark, City Name, Address, ये सब एक एक data है. या आप इसे आम भाषा में बोल सकते हैं यह Student के बारे में उसकी जानकारी है. जब इन सभी डाटा को एकत्रित करके हम एक student report बना देते हैं तब उसे Information कहते हैं, जिसके बारे में हम आगे चर्चा करेंगे. कुछ और डाटा के उदहारण हैं , prices, costs, numbers of items sold, employee names, product names, addresses, tax codes, registration marks. उपयोगी जानकारी पाने के लिए हमें data की आवश्यकता होती है, जब हम बहुत सारे data को एकत्रित करके प्रसंस्करण करते हैं तभी हमें Information मिलती है।
Data in Hindi
डेटा सादे तथ्य हैं, “डेटा” शब्द “डेटम” के लिए बहुवचन है. जब डेटा को किसी संदर्भ में संसाधित, व्यवस्थित, संरचित या प्रस्तुत किया जाता है ताकि उन्हें उपयोगी बनाने के लिए, उन्हें सूचना कहा जाता है. यह डेटा के लिए पर्याप्त नहीं है (जैसे कि अर्थव्यवस्था पर आंकड़े), डेटा स्वयं काफी बेकार हैं, लेकिन जब इन आंकड़ों की व्याख्या की जाती है और इसका सही अर्थ निर्धारित करने के लिए संसाधित किया जाता है, तो वे उपयोगी हो जाते हैं और उन्हें सूचना के रूप में नामित किया जा सकता है. वह डेटा है जिसे इस तरह से संसाधित किया गया है कि इसे प्राप्त करने वाले व्यक्ति के लिए सार्थक हो. यह किसी भी चीज का संचार है. डेटा शब्द है, जो शुरुआती लोगों के लिए नया हो सकता है, लेकिन यह समझना बहुत दिलचस्प और सरल है. यह किसी व्यक्ति या स्थान या संख्या आदि के नाम जैसे कुछ भी हो सकता है। डेटा मूलभूत तथ्यों और संस्थाओं जैसे नाम और संख्याओं को दिया गया नाम है. डेटा के मुख्य उदाहरण वजन, मूल्य, लागत, बेची गई वस्तुओं की संख्या, कर्मचारी नाम, उत्पाद नाम, पते, कर कोड, पंजीकरण सामग्री आदि हैं. डेटा एक कच्चा माल है जिसे किसी भी कंप्यूटिंग मशीन द्वारा संसाधित किया जा सकता है. डेटा को इस रूप में दर्शाया जा सकता है. संख्या और शब्द जो कंप्यूटर की भाषा में संग्रहीत किए जा सकते हैं, चित्र, ध्वनियाँ, मल्टीमीडिया और एनिमेटेड डेटा जैसा कि दिखाया गया है।।
कंप्यूटर के आविष्कार के बाद से, लोगों ने कंप्यूटर की जानकारी को संदर्भित करने के लिए डेटा शब्द का उपयोग किया है, और यह जानकारी या तो प्रेषित या संग्रहीत की गई थी, लेकिन यह केवल डेटा परिभाषा नहीं है; अन्य प्रकार के डेटा भी मौजूद हैं, तो, डेटा क्या है? डेटा ग्रंथ या कागज पर लिखे नंबर हो सकते हैं, या यह इलेक्ट्रॉनिक उपकरणों की मेमोरी के अंदर बाइट्स और बिट्स हो सकते हैं, या यह ऐसे तथ्य हो सकते हैं जो किसी व्यक्ति के दिमाग के अंदर संग्रहीत होते हैं. अब, अगर हम मुख्य रूप से विज्ञान के क्षेत्र में डेटा के बारे में बात करते हैं, तो “डेटा क्या है” का उत्तर यह होगा कि डेटा विभिन्न प्रकार की जानकारी है जो आमतौर पर एक विशेष तरीके से स्वरूपित होती है, सभी सॉफ्टवेयर दो प्रमुख श्रेणियों में विभाजित हैं, और वे प्रोग्राम और डेटा हैं. प्रोग्राम निर्देशों का संग्रह है जो डेटा को हेरफेर करने के लिए उपयोग किया जाता है, तो, अब पूरी तरह से समझने के बाद कि डेटा और डेटा साइंस क्या है, आइए जानें कुछ शानदार तथ्य।
डेटा के प्रकार और उपयोग ?
प्रौद्योगिकी के क्षेत्र में वृद्धि, विशेष रूप से स्मार्टफ़ोन में पाठ, वीडियो और ऑडियो को डेटा प्लस वेब और लॉग गतिविधि रिकॉर्ड के तहत शामिल किया गया है. इस डेटा का अधिकांश हिस्सा असंरचित है. बड़ा डेटा शब्द का उपयोग डेटा परिभाषा में उस डेटा का वर्णन करने के लिए किया जाता है जो पेटाबाइट रेंज या उच्चतर में होता है. बड़े डेटा को 5V के रूप में भी वर्णित किया गया है: विविधता, मात्रा, मूल्य, सत्यता और वेग, आजकल, वेब-आधारित ईकामर्स बड़े पैमाने पर फैल गया है, बड़े डेटा पर आधारित व्यावसायिक मॉडल विकसित हुए हैं, और वे डेटा को एक संपत्ति के रूप में मानते हैं. और बड़े डेटा के कई लाभ भी हैं, जैसे कि कम लागत, बढ़ी हुई दक्षता, बढ़ी हुई बिक्री, आदि, डेटा का अर्थ कंप्यूटिंग अनुप्रयोगों में डेटा के प्रसंस्करण से परे फैलता है. जब यह पता चलता है कि डेटा साइंस क्या है, तो तथ्यों से बनी एक बॉडी को डेटा साइंस कहा जाता है. तदनुसार, वित्त, जनसांख्यिकी, स्वास्थ्य और विपणन में भी डेटा के अलग-अलग अर्थ होते हैं, जो अंततः डेटा के लिए अलग-अलग उत्तर देते हैं।
डेटा जानकारी के अलग-अलग टुकड़े हैं, आमतौर पर एक विशेष तरीके से स्वरूपित किया जाता है. सभी सॉफ्टवेयर दो सामान्य श्रेणियों में विभाजित हैं: डेटा और प्रोग्राम। कार्यक्रम डेटा में हेरफेर करने के लिए निर्देशों का संग्रह है. डेटा कई रूपों में मौजूद हो सकता है – कागज के टुकड़ों पर संख्या या पाठ के रूप में, बिट्स और बाइट इलेक्ट्रॉनिक मेमोरी में संग्रहीत, या किसी व्यक्ति के दिमाग में संग्रहीत तथ्यों के रूप में, 1900 के दशक के मध्य से, लोगों ने कंप्यूटर की जानकारी के लिए डेटा का उपयोग किया है जिसका अर्थ है कि संचारित या संग्रहीत. कड़ाई से बोलना, डेटा सूचना का बहुवचन है, जो जानकारी का एक टुकड़ा है, व्यवहार में, हालांकि, लोग शब्द के एकवचन और बहुवचन दोनों के रूप में और एक जन संज्ञा (जैसे “रेत”) के रूप में डेटा का उपयोग करते हैं।
कंप्यूटर डेटा एक कंप्यूटर द्वारा संसाधित या संग्रहीत जानकारी है. यह जानकारी पाठ दस्तावेज़, चित्र, ऑडियो क्लिप, सॉफ़्टवेयर प्रोग्राम, या अन्य प्रकार के डेटा के रूप में हो सकती है. कंप्यूटर डेटा को कंप्यूटर के सीपीयू द्वारा संसाधित किया जा सकता है और इसे कंप्यूटर की हार्ड डिस्क पर फ़ाइलों और फ़ोल्डरों में संग्रहीत किया जाता है. अपने सबसे अल्पविकसित स्तर पर, कंप्यूटर डेटा लोगों और शून्य का एक समूह है, जिसे बाइनरी डेटा के रूप में जाना जाता है. क्योंकि सभी कंप्यूटर डेटा बाइनरी प्रारूप में हैं, इसे डिजिटल रूप से बनाया, संसाधित, सहेजा और संग्रहीत किया जा सकता है. यह नेटवर्क कनेक्शन या विभिन्न मीडिया उपकरणों का उपयोग करके डेटा को एक कंप्यूटर से दूसरे कंप्यूटर में स्थानांतरित करने की अनुमति देता है. यह कई बार उपयोग किए जाने के बाद भी समय के साथ खराब नहीं होता है या गुणवत्ता खो देता है।
डाटा क्या है (What is Data in Hindi)
डाटा का मतलब होता है किसी भी तरह की जानकारी यानि इनफार्मेशन और सूचना, डाटा कुछ भी हो सकता है जैसे: फाइल, वीडियो, सॉन्ग, फोटो, टेक्स्ट, इत्यादि, लगभग सभी चीजें डाटा के अंदर आता है, जैसे मान लीजिए आप कंप्यूटर पर कोई फाइल तैयार कर रहे हैं उसमें आपने कुछ टाइप किया है फोटो भी उपयोग किया है वीडियो इत्यादि फाइल में आपने लगाया है, यह सभी डाटा हुआ |
सामान्यतः डाटा कैरेक्टर्स का कोई set होता है जिसे किसी उद्देश्य के लिए एकत्रित या फिर translate किया जाता है. जैसे कि डेटा को analysis (विश्लेषण) करने के लिए, यह डेटा character (वर्ण ) के रूप में कोई भी images, video, text, sound के हो सकता है. यदि डाटा को context संदर्भ में नहीं रखा जाता है तो यह न तो मानव के लिए और न ही किसी कंप्यूटर के लिए कुछ कर सकता है, यहां आपका जानना जरूरी है कि कंप्यूटर data के जरिये information निकालता है जिससे हम उस data के बारे में समझ पाते हैं. यदि डाटा को कंप्यूटर के storage के रूप में देखे तो डाटा नंबर्स का एक Collection होता है. जिसे Bytes के रूप में represent किया जाता है यह डाटा सीपीयू द्वारा processed किया जाता है. इस तरह आप समझ चुके होंगे कि यह डाटा क्या होता है, अब हम जानते हैं डाटा को कंप्यूटर में किस तरह store किया जाता है. किसी कंप्यूटर में डाटा तथा जानकारी को स्टोर करने के लिए हार्ड ड्राइव या अन्य Storage device का इस्तेमाल किया जाता है. जबकि स्मार्टफोन तथा अन्य मोबाइल डिवाइसेज में data term का इस्तेमाल इंटरनेट के जरिए विभिन्न devices के बीच डाटा को ट्रांसफर करने के लिए किया जाता है. जब यह डेटा raw फॉर्म में होता है. मनुष्य के लिए इस डाटा का कोई अर्थ नहीं होता अतः यह किसी काम का नहीं होता! परंतु जब इस डाटा की प्रोसेस तथा व्याख्या की जाती है तो इस डाटा का अर्थ मनुष्य के लिए समझने योग्य होता है और इससे proceed डाटा को इंफॉर्मेशन नाम भी दिया जाता है।
कंप्यूटिंग में, डेटा वह जानकारी है जिसे किसी ऐसे रूप में अनुवादित किया गया है जो स्थानांतरित करने या प्रक्रिया करने के लिए अधिक सुविधाजनक है. आज के कंप्यूटर और ट्रांसमिशन मीडिया के सापेक्ष, डेटा को बाइनरी डिजिटल रूप में परिवर्तित किया जाता है. डेटा जीवन चक्र प्रबंधन (DLM) एक नीति-आधारित दृष्टिकोण है जो अपने जीवन चक्र में सूचना प्रणाली के डेटा के प्रवाह के प्रबंधन के लिए है: निर्माण और प्रारंभिक भंडारण से उस समय तक जब यह अप्रचलित हो जाता है और हटा दिया जाता है. यह डेटा के लिए एक विलक्षण विषय या बहुवचन विषय का उपयोग करने के लिए स्वीकार्य है।
कंप्यूटर घटक इंटरकनेक्शन और नेटवर्क संचार में, डेटा को अक्सर “नियंत्रण सूचना,” “नियंत्रण बिट्स” और समान शर्तों से अलग किया जाता है ताकि एक ट्रांसमिशन यूनिट की मुख्य सामग्री की पहचान हो सके, दूरसंचार में, डेटा का मतलब कभी-कभी डिजिटल-एन्कोडेड जानकारी को एनालॉग-एन्कोडेड जानकारी जैसे कि पारंपरिक टेलीफोन वॉयस कॉल से अलग करना होता है. सामान्य तौर पर, “एनालॉग” या वॉयस ट्रांसमिशन को प्रसारण की संबंधित श्रृंखला की अवधि के लिए एक समर्पित निरंतर कनेक्शन की आवश्यकता होती है. डेटा ट्रांसमिशन को उन टुकड़ों में रुक-रुक कर कनेक्शन के साथ भेजा जा सकता है जो टुकड़ों में आते हैं।
अगर हम बात करे की सूचना क्या है तो सूचना वह डेटा है जिसे अधिक उपयोगी या समझदार रूप में परिवर्तित किया गया है. यह आंकड़ों का वह समूह है जो मानव जाति के प्रत्यक्ष उपयोग के लिए आयोजित किया गया है, क्योंकि जानकारी मानव को अपने निर्णय लेने की प्रक्रिया में मदद करती है. उदाहरण हैं: टाइम टेबल, मेरिट लिस्ट, रिपोर्ट कार्ड, हेडेड टेबल, प्रिंटेड डॉक्यूमेंट्स, पे स्लिप, रसीदें, रिपोर्ट आदि, डाटा के आइटम को अर्थपूर्ण रूप में इकट्ठा करके जानकारी प्राप्त की जाती है. उदाहरण के लिए, छात्रों द्वारा प्राप्त अंक और उनके रोल नंबर डेटा बनाते हैं, रिपोर्ट कार्ड / शीट .information है. सूचना के अन्य रूप पे-स्लिप, शेड्यूल, रिपोर्ट, वर्कशीट, बार चार्ट, चालान और खाता रिटर्न आदि हैं. यह ध्यान दिया जा सकता है कि जानकारी को आगे संसाधित किया जा सकता है और / या ज्ञान बनाने के लिए हेरफेर किया जा सकता है. ज्ञान युक्त जानकारी को ज्ञान के रूप में जाना जाता है।
हमें सूचना की जरूरत क्यों पड़ती है ?
मॉडेम सभ्यता इतनी जटिल और परिष्कृत हो गई है कि जीवित रहने के लिए प्रतिस्पर्धी होना चाहिए। यह लोगों को समाज में सभी प्रकार की घटनाओं के बारे में सूचित रखने के लिए मजबूर करता है। समाज में शैक्षिक सुधारों के आगमन के साथ, मानव जाति भारी मात्रा में उपलब्ध आंकड़ों से घिरी हुई है। मॉडेम व्यापार प्रबंधन प्रणाली ने भी विभिन्न स्रोतों से डेटा के थोक संग्रह के लिए खुद को प्रदान किया है, जिसे एक फैशन में पुनर्व्यवस्थित करने की आवश्यकता है ताकि इसका उपयोग न्यूनतम संभव समय के साथ किया जा सके। इसके लिए उच्च स्तर की फाइलिंग की जरूरत है या तो डाटा स्टेज पर या सूचना स्टेज पर। कोई भी कार्यालय बिना फाइलों के नहीं हो सकता। अगर आप किसी भी टैक्स कलेक्शन डिपार्टमेंट या म्युनिसिपल ऑफिस में जाते हैं तो आपको यहां और वहां ढेर सारी फाइलें मिल जाएंगी।
मॉडेम के नियमों, विनियमन और कानून के लिए प्रत्येक लेनदेन को लिखित रूप में होना आवश्यक है, एक समझौता, आवेदन, वाउचर, बिल, पत्र, ज्ञापन, आदेश आदि हो सकता है। कागजी फाइलों के लिए अधिक मात्रा में स्टोरेज स्पेस की आवश्यकता होती है और पेपर स्टोरेज कई अन्य समस्याएं पैदा करता है। उम्र बढ़ने के सूक्ष्मजीव और नमी आदि के माध्यम से आग के जोखिम, खराब होने और बिगड़ने की तरह। एक सिस्टम या प्रक्रिया को चलाने के लिए या किसी व्यवसाय को कमांड करने के लिए आदमी की खुद की आजीविका चलाने के लिए मॉडम दिनों की जानकारी की आवश्यकता होती है।
सूचना की मात्रा बहुत तेजी से बढ़ रही है. सूचना की वर्तमान आयु कंप्यूटर साक्षरता को सूचना साक्षरता के साथ नियोक्ताओं की निर्भरता के रूप में रखने की मांग करती है. अब तक पेशेवरों पर ध्यान केंद्रित किया गया है, जिसमें सूचना और सभी प्रकार के सूचना प्रसंस्करण कौशल हैं, ताकि सूचना के बदलते परिदृश्य की चुनौती ले सकें, विश्व सूचना साक्षरता उपयुक्त जानकारी इकट्ठा करने, सूचना का मूल्यांकन करने और एक सूचित निर्णय उत्पन्न करने में मदद करती है. सूचना क्रांति का प्रभाव समाज के प्रत्येक व्यक्ति के लिए बढ़ाया गया है, और यह औद्योगिक क्रांति की तुलना में बहुत तेज है. औद्योगिक युग से सूचना युग में प्रवासन ने श्रमिकों के दोहराए गए प्रयासों को कंप्यूटर सॉफ्टवेयर के साथ बदलकर समाप्त कर दिया है, कृत्रिम बुद्धिमत्ता वाले रोबोटों ने मनुष्यों का स्थान ले लिया है, और मल्टीप्रोसेसिंग कंप्यूटरों ने कार्यालय कर्मचारियों को टाइपराइटरों से बदल दिया है।
डाटा का प्रकार ?
डेटा मूल मूल्य या तथ्य हैं, या आप इसे और भी आसान शब्दों में कहे तो किसी चीज के बारे में तथ्य और जानकारी को ‘डाटा‘ कहा जाता है. इस जानकारी में संख्या, शब्द, तस्वीर, चिन्ह, राय आदि शामिल होता है. यह तथ्य अर्थहीन और सामान्य इंसान की समझ से परे होते है. डाटा को विभिन्न स्रोतों से इकट्ठा किया जाता है. ध्यान दें कि वैज्ञानिक समुदाय में ‘डेटा’ को बहुवचन माना जाता है, जैसे ‘डेटा एकत्र किया जाता है’, न कि ‘डेटा एकत्र किया जाता है’; हालाँकि, हर कोई इसका पालन नहीं करता है, इसलिए कभी-कभी आप डेटा को एकवचन के रूप में उपयोग करते देखेंगे, प्रत्येक कार्य एक कंप्यूटर करता है जो किसी न किसी तरह से डेटा के साथ काम करता है. डेटा के बिना, एक कंप्यूटर बहुत बेकार होगा. इसलिए, यह समझना महत्वपूर्ण है कि डेटा का प्रतिनिधित्व और व्यवस्थित कैसे करें, यह पाठ कंप्यूटर सिस्टम में उपयोग किए जाने वाले विभिन्न प्रकार के डेटा को देखेगा कि कैसे उन्हें डिजिटल रूप में दर्शाया जाता है, और उन्हें डेटाबेस में कैसे व्यवस्थित किया जाता है।
अल्फाबेट्स इंग्लिश में A to Z और हिंदी में क से ज्ञ. ये सभी Text डाटा कहलाता है. कीबोर्ड में ये सारे Alphabets होते है।
अंक इस प्रकार के डाटा में 0 से 9 तक के अंक होते है. कीबोर्ड पर ये सारे अंक मौजूद होते है, इस डाटा पर गणितीय फॉर्मूले लगाकर उसे Process करते है।
अल्फानुमेरिक (Alpha Numeric) – कीबोर्ड में @,$,& जैसे चिन्ह अल्फा न्यूमेरिक डाटा होते है।
चित्र (Image) – JPEG, JPG, PNG जैसे फॉरमेट इमेज डाटा कहलाते है।
ऑडियो डाटा (Audio) एंड वीडियो डाटा (Video) – इस प्रकार के डाटा में ध्वनि आती है. म्यूजिक फाइल्स आती है, MP3, MP4, HD आदि फॉरमेट इस प्रकार के डाटा में आते है।
डेटा का विश्लेषण कैसे करें?
विषयगत जानकारी में डेटा विश्लेषण और अनुसंधान संख्यात्मक जानकारी से कुछ बेहतर काम करते हैं, क्योंकि गुणवत्ता की जानकारी शब्दों, चित्रण, चित्रों, वस्तुओं और कभी-कभी छवियों से मिलकर होती है. ऐसे उलझे हुए डेटा से ज्ञान प्राप्त करना एक जटिल प्रक्रिया है; इस प्रकार, यह आमतौर पर खोजपूर्ण अनुसंधान के साथ-साथ डेटा विश्लेषण के लिए उपयोग किया जाता है।
आपको गुणात्मक डेटा में पैटर्न खोजना की जरुरत होती है, यद्यपि मुद्रित डेटा में पैटर्न की खोज करने के लिए कुछ अलग तरीके हैं, एक शब्द-आधारित रणनीति डेटा के अनुसंधान और विश्लेषण के लिए सबसे अधिक निर्भर और व्यापक रूप से उपयोग की जाने वाली वैश्विक विधि है. मुख्य रूप से, गुणात्मक अनुसंधान में डेटा विश्लेषण की प्रक्रिया मैनुअल है. यहां विशेषज्ञ, एक नियम के रूप में, सुलभ जानकारी पढ़ते हैं और नीरस या अक्सर उपयोग किए जाने वाले शब्द पाते हैं।
डाटा प्रोसेसिंग ?
डेटा प्रोसेसिंग तब होती है जब डेटा को एकत्र किया जाता है और उपयोग करने योग्य जानकारी में अनुवाद किया जाता है. आमतौर पर एक डेटा वैज्ञानिक या डेटा वैज्ञानिकों की टीम द्वारा प्रदर्शन किया जाता है, डेटा प्रोसेसिंग के लिए सही तरीके से किया जाना महत्वपूर्ण है क्योंकि अंत उत्पाद, या डेटा आउटपुट को नकारात्मक रूप से प्रभावित नहीं करता है. डेटा प्रसंस्करण अपने कच्चे रूप में डेटा के साथ शुरू होता है और इसे एक अधिक पठनीय प्रारूप (ग्राफ़, दस्तावेज़, आदि) में परिवर्तित करता है, यह कंप्यूटर द्वारा व्याख्या किए जाने के लिए आवश्यक रूप और संदर्भ देता है और पूरे संगठन में कर्मचारियों द्वारा उपयोग किया जाता है।
आपके देखा होगा किसी सूचना को प्राप्त करने के लिये हम डाटा यानि आंकड़े इक्ठ्ठठा करते हैं और इस डाटा का अपनी जरूरत के हिसाब से विश्लेशण या डाटा प्रोसेसिंग करते हैं इस विश्लेशण यानि डाटा प्रोसेसिंग की प्रक्रिया में डाटा से अर्थपूर्ण तथ्य, अंक या Statistical data प्राप्त होता है इसी अर्थपूर्ण डाटा काे सूचना कहते हैं जिसे उपयोग में लाया जाता है, डाटा की Utility के आधार पर किया जाने वाला Analysis data processing कहते हैं डाटा से सूचना निकलने के लिए हमें बहुत सी क्रियाएं जैसे जोड़ना और घटाना करनी पड़ती है, उन सब क्रियाओं को डाटा प्रोसेसिंग कहा जाता है, इसके बाद ही सूचना प्राप्त हाेती है ।
डेटा प्रसंस्करण मूल रूप से सॉफ्टवेयर में दर्ज सभी डेटा को सिंक्रनाइज़ कर रहा है ताकि इसके सबसे उपयोगी जानकारी को फ़िल्टर किया जा सके, यह किसी भी कंपनी के लिए एक बहुत ही महत्वपूर्ण कार्य है क्योंकि यह बाद में उपयोग के लिए सबसे अधिक प्रासंगिक सामग्री निकालने में उनकी मदद करता है. हर महत्वपूर्ण क्षेत्र, बैंक, स्कूल, कॉलेज या बड़ी कंपनियाँ हों, लगभग सभी को डेटा के प्रसंस्करण की आवश्यकता होती है. यह प्रसंस्करण बाद में उपयोग के लिए अपने सिस्टम में सबसे परिष्कृत जानकारी संग्रहीत करने के लिए किया जाता है. मैनुअल प्रोसेसिंग में बहुत समय लगता है और ऐसा करने के लिए आपको बहुत से लोगों को संलग्न करने की आवश्यकता होती है. जब आप बल्क में डेटा रखते हैं तो यह वास्तव में एक संभव कार्य नहीं है. आजकल उद्योग के लोग उस सभी डेटा को संसाधित करने में मदद करने के लिए मजबूत और अच्छी तरह से कुशल सॉफ्टवेयर टूल पर निर्भर हैं. इससे उन्हें अधिक सटीकता प्राप्त करने और उनकी दक्षता बढ़ाने में मदद मिलती है. डेटा के उचित प्रसंस्करण के साथ, अधिक से अधिक जानकारी को सॉर्ट किया जा सकता है. यह बात को स्पष्ट रूप से देखने में मदद करता है और इसकी बेहतर समझ रखता है. इससे विभिन्न व्यावसायिक क्षेत्रों के लिए बेहतर उत्पादकता और अधिक लाभ हो सकता है।
डेटा प्रोसेसिंग के छह चरण होते है
Data collection
डेटा एकत्र करना डाटा प्रोसेसिंग में पहला कदम है. डेटा उपलब्ध झीलों और डेटा वेयरहाउस सहित उपलब्ध स्रोतों से खींचा जाता है. यह महत्वपूर्ण है कि उपलब्ध डेटा स्रोत भरोसेमंद और अच्छी तरह से निर्मित हैं इसलिए एकत्र किए गए डेटा (और बाद में जानकारी के रूप में उपयोग किया गया) उच्चतम संभव गुणवत्ता का है।
Data preparation
एक बार डेटा एकत्र करने के बाद, यह डेटा तैयारी चरण में प्रवेश करता है. डेटा तैयारी, जिसे अक्सर “प्री-प्रोसेसिंग” के रूप में संदर्भित किया जाता है, वह चरण होता है जिस पर डेटा प्रोसेसिंग के निम्न चरण के लिए कच्चे डेटा को साफ और व्यवस्थित किया जाता है. तैयारी के दौरान, किसी भी त्रुटि के लिए कच्चे डेटा की जांच की जाती है. इस कदम का उद्देश्य खराब डेटा (अनावश्यक, या गलत डेटा) को खत्म करना है और सबसे अच्छी व्यावसायिक बुद्धि के लिए उच्च-गुणवत्ता वाला डेटा बनाना शुरू करना है।
Data input
फिर स्वच्छ डेटा को अपने गंतव्य (शायद एक CRM जैसे Salesforce या Redshift जैसे डेटा वेयरहाउस) में दर्ज किया जाता है, और एक ऐसी भाषा में अनुवादित किया जाता है जिसे वह समझ सकता है. डेटा इनपुट पहला चरण है जिसमें कच्चे डेटा को उपयोगी जानकारी के रूप में लेना शुरू किया जाता है।
Processing
इस चरण के दौरान, पिछले चरण में कंप्यूटर को इनपुट किया गया डेटा वास्तव में व्याख्या के लिए संसाधित होता है. मशीन लर्निंग एल्गोरिदम का उपयोग करके प्रसंस्करण किया जाता है, हालांकि डेटा संसाधित होने के स्रोत (डेटा झीलों, सामाजिक नेटवर्क, जुड़े उपकरणों आदि) के आधार पर प्रक्रिया थोड़ी भिन्न हो सकती है, और इसके इच्छित उपयोग (विज्ञापन पैटर्न की जांच, जुड़े उपकरणों से चिकित्सा निदान,) ग्राहक की जरूरतों का निर्धारण, आदि)।
Data output/interpretation
आउटपुट / व्याख्या चरण वह चरण है, जिस पर डेटा आखिरकार गैर-डेटा वैज्ञानिकों के लिए उपयोग करने योग्य है. इसका अनुवाद, पठनीय और अक्सर रेखांकन, वीडियो, चित्र, सादा पाठ, आदि के रूप में किया जाता है), कंपनी या संस्थान के सदस्य अब अपनी डेटा एनालिटिक्स परियोजनाओं के लिए डेटा को स्वयं सेवा देना शुरू कर सकते हैं।
Data storage
डेटा प्रोसेसिंग का अंतिम चरण स्टोरेज है. डेटा के सभी संसाधित होने के बाद, इसे भविष्य के उपयोग के लिए संग्रहीत किया जाता है. हालांकि कुछ सूचनाओं को तुरंत उपयोग करने के लिए रखा जा सकता है, लेकिन इसका अधिकांश हिस्सा बाद में एक उद्देश्य की पूर्ति करेगा. इसके अलावा, ठीक से संग्रहीत डेटा GDPR जैसे डेटा सुरक्षा कानून के अनुपालन के लिए एक आवश्यकता है. जब डेटा को ठीक से संग्रहीत किया जाता है, तो इसे संगठन के सदस्यों द्वारा जल्दी और आसानी से एक्सेस किया जा सकता है।