डाटा माइनिंग को data या knowledge discovery के नाम से भी जाना जाता है. डाटा माइनिंग बहुत बड़े डेटा के समूह में से small डेटा को search करने की प्रक्रिया है. आपकी जानकारी के लिए बता दे की इस प्रक्रिया में परम्परागत सांख्यिकी, कृत्रिम बुद्धि तथा computer graphics का इस्तेमाल किया जाता है. डेटा माइनिंग डेटा के बीच असुरक्षित / पहले के अज्ञात संबंधों की खोज करने के बारे में है. Data mining में डेटा को analyze करने के लिए डाटा माइनिंग tools का प्रयोग किया जाता है। ये tool बहुत ही powerful होते है।
Data Mining बहुत बड़े Data सेट में से Data निकालने और हम कह सकते हैं कि Data को छान कर वर्गिकरत करने के काम में आता है. दोस्तों आमतौर पर ऐसा हम इसलिए करते हैं ताकि हम Data का अध्यन कर सकें और Data को छाँट सकें. Data Mining टूल का इस्तेमाल आज बहुत बड़े पैमाने पर किया जा रहा है, Data Mining टूल हमें भविष्य के ट्रेंड को समझने में काम आते हैं. Data Mining में हम कुछ रुल्स बनाते हैं जिनहे असोशिएशन रूल बोलते हैं. यह रूल Data को एनलाइज़ करने के काम में आता है. Data Mining parameter में पाथ एनालिसिस (यानि की पाथ को समझना और उसके बारे में डीटेल निकालना), क्लास्सिफिकेशन (उसको टुकड़ों में विभाजित करना), क्लस्टरिंग (एक जगह जोड़ना या फिट करना) , और फोरकास्टिंग (उसका पूर्वानुमान लगाना) भी Data parameter में होते हैं. Path analysis parameter pattern को देखता है जिससे की वह प्रभावी रूप से काम कर सके।
What is Data Mining in Hindi
परिभाषा: सरल शब्दों में, Data Mining को किसी भी raw data के एक बड़े सेट से प्रयोग करने योग्य Data को निकालने के लिए उपयोग की जाने वाली प्रक्रिया के रूप में परिभाषित किया गया है. इसका अर्थ है एक या अधिक सॉफ़्टवेयर का उपयोग करके Data के बड़े बैचों में Data Pattern का विश्लेषण करना. Data Mining में विज्ञान और अनुसंधान जैसे कई क्षेत्रों में अनुप्रयोग हैं. Data Mining के एक अनुप्रयोग के रूप में, व्यवसाय अपने ग्राहकों के बारे में अधिक जान सकते हैं और विभिन्न व्यावसायिक कार्यों से संबंधित अधिक प्रभावी रणनीति विकसित कर सकते हैं और बदले में संसाधनों का अधिक इष्टतम और व्यावहारिक तरीके से लाभ उठा सकते हैं. यह व्यवसायों को उनके उद्देश्य के करीब होने और बेहतर निर्णय लेने में मदद करता है. Data Mining में प्रभावी Data संग्रह और Warehousing के साथ-साथ कंप्यूटर प्रोसेसिंग भी शामिल है. Data को खंडित करने और भविष्य की घटनाओं की संभावना का मूल्यांकन करने के लिए, डेटा खनन परिष्कृत गणितीय एल्गोरिदम का उपयोग करता है. Data Mining को Data (केडीडी) में नॉलेज डिस्कवरी के रूप में भी जाना जाता है।
डेटा माइनिंग की मुख्य विशेषताएं −
प्रवृत्ति और व्यवहार विश्लेषण के आधार पर स्वचालित पैटर्न भविष्यवाणियों।
संभावना परिणामों के आधार पर भविष्यवाणी।
निर्णय-उन्मुख जानकारी का निर्माण।
विश्लेषण के लिए बड़े डेटा सेट और डेटाबेस पर ध्यान दें।
पहले ज्ञात नहीं तथ्यों के समूहों को खोजने और नेत्रहीन दस्तावेज के आधार पर क्लस्टरिंग।
डाटा माइनिंग की चार स्टेज −
डाटा सोर्स − यह डेटाबेस के अंदर हर तरह की मुश्किलों को संभालने का काम करता हैं यह डेटाबेस से लेकर न्यूज़ वायर तक होता है।
मोडल − यूसर एक मोडल टेस्ट बनाता है और फिर उसका निरीक्षण भी करता है।
डाटा को इकठ्ठा करना − डाटा को इकठ्ठा करना बहुत जरूरी होता है, इस प्रोसेस में हम डाटा को इक्कठा करते हैं और डाटा की सैंपलिंग करते हैं।
डिप्लोईंग मोडल − इसमे आप Result पर निर्भर करते हुए आप कोई भी एक्शन ले सकते हैं।
डेटा माइनिंग में पहला कदम व्यापार के लिए महत्वपूर्ण डेटा को इकट्ठा करना है. कंपनी का डेटा या तो लेनदेन, गैर-परिचालन या मेटाडेटा है. लेन-देन डेटा दिन-प्रतिदिन के संचालन, जैसे बिक्री, इन्वेंट्री और लागत आदि के साथ काम करता है. Non-operational data सामान्य रूप से पूर्वानुमान है, जबकि Metadata logical database design से संबंधित है. डेटा तत्वों के बीच पैटर्न और संबंध प्रासंगिक जानकारी को प्रस्तुत करते हैं, जिससे संगठनात्मक राजस्व बढ़ सकता है. बेचा, मूल्य, प्रतिस्पर्धा और ग्राहक जनसांख्यिकी के उत्पादों की स्पष्ट तस्वीरें प्रदान करने वाली डेटा खनन तकनीकों के साथ एक मजबूत उपभोक्ता फ़ोकस सौदे के साथ संगठन।
उदाहरण के लिए, रिटेल दिग्गज वॉलमार्ट अपनी सभी प्रासंगिक जानकारी डेटा के टेराबाइट्स वाले वेयरहाउस में पहुंचाता है. यह डेटा आसानी से उन Suppliers द्वारा पहुँचा जा सकता है जो उन्हें ग्राहक खरीदने के पैटर्न की पहचान करने में सक्षम बनाते हैं. वे खरीदारी की आदतों पर पैटर्न उत्पन्न कर सकते हैं, सबसे अधिक खरीदारी के दिनों में, सबसे अधिक उत्पादों और डेटा खनन तकनीकों का उपयोग करने वाले अन्य डेटा के लिए।
डेटा माइनिंग में दूसरा चरण एक उपयुक्त Algorithms का चयन करता है, एक डेटा माइनिंग मॉडल का निर्माण करने वाला तंत्र, एल्गोरिथ्म के सामान्य काम में डेटा के एक सेट में रुझानों की पहचान करना और पैरामीटर परिभाषा के लिए आउटपुट का उपयोग करना शामिल है. डेटा माइनिंग के लिए उपयोग किए जाने वाले सबसे लोकप्रिय Algorithms classification algorithms और प्रतिगमन Algorithms हैं, जिनका उपयोग डेटा तत्वों के बीच संबंधों की पहचान करने के लिए किया जाता है. ओरेकल और SQL जैसे प्रमुख database विक्रेता डेटा माइनिंग की मांग को पूरा करने के लिए डेटा माइनिंग Algorithms जैसे क्लस्टरिंग और रिग्रेशन ट्रेस को शामिल करते हैं।
डेटा माइनिंग उपयोगी जानकारी में वर्गीकरण के लिए Different perspectives के अनुसार डेटा के छिपे हुए पैटर्न का विश्लेषण करने की प्रक्रिया है, जो डेटा विश्लेषण, Data Mining Algorithm के लिए आम क्षेत्रों में इकट्ठा किया जाता है, जैसे कुशल वेयरहाउस, व्यापार निर्णय लेने की सुविधा और अन्य जानकारी. अंततः लागत में कटौती करने और राजस्व बढ़ाने के लिए आवश्यकताएं. डेटा माइनिंग को डेटा डिस्कवरी और नॉलेज डिस्कवरी के रूप में भी जाना जाता है।
जैसा की हम जानते है, Clustering parameter documents को ढूंढता है. उसके बाद वह उनको सही से लगाता है, यहाँ पर हम आपकी जानकरी के लिए बताना चाहेंगे की क्लस्टरिंग ग्रुप एक तरह से डाटा को सेट्स में व्यवस्थित करता है और कुछ जो सामान्य होते हैं उन्हे भी यह उनके हिसाब से उसी प्रकार से व्यवस्थित कर देते हैं. इसमे बहुत तरीकों से यूजर क्लस्टरिंग कर सकते हैं जो की Clustering modeling में काम आते हैं. Fostering Parameters Data Mining के अंदर Pattern को डिस्कवर करता है और भविष्य की गतिविधियों की भविष्यवाणी करता है जिसे हम प्रेडिक्टिव एनालिसिस भी बोलते हैं।
डाटा माइनिंग कैसे करें
Accepted data mining प्रक्रिया में छह चरण शामिल हैं, जिनके बारे में हमने नीचे विस्तार से बताया है
Business understanding
पहला कदम परियोजना के लक्ष्यों को स्थापित कर रहा है और डेटा खनन कैसे आपको उस लक्ष्य तक पहुंचने में मदद कर सकता है. इस स्तर पर एक योजना विकसित की जानी चाहिए, जिसमें समय, कार्य और भूमिका कार्य शामिल हों।
Data understanding
इस चरण में सभी लागू डेटा स्रोतों से डेटा एकत्र किया जाता है. डेटा विज़ुअलाइज़ेशन टूल अक्सर इस चरण में उपयोग किया जाता है. ताकि डेटा के गुणों का पता लगाया जा सके ताकि यह सुनिश्चित हो सके कि यह व्यावसायिक लक्ष्यों को प्राप्त करने में मदद करेगा।
Data preparation
डेटा को फिर से साफ किया जाता है, और लापता डेटा को यह सुनिश्चित करने के लिए शामिल किया जाता है कि यह खनन किया जाए. डेटा का विश्लेषण और डेटा स्रोतों की संख्या के आधार पर डेटा प्रोसेसिंग में भारी मात्रा में समय लग सकता है. इसलिए, वितरित सिस्टम का उपयोग आधुनिक डेटाबेस प्रबंधन प्रणालियों (DBMS) में किया जाता है, ताकि एकल प्रणाली को बोझ करने के बजाय डेटा खनन प्रक्रिया की गति में सुधार किया जा सके. वे एकल डेटा वेयरहाउस में संगठन के सभी डेटा रखने से अधिक सुरक्षित हैं. डेटा हेरफेर चरण में विफल कैफे उपायों को शामिल करना महत्वपूर्ण है ताकि डेटा स्थायी रूप से खो न जाए।
Data Modeling
Mathematical model का उपयोग तब परिष्कृत डेटा टूल का उपयोग करके डेटा में पैटर्न खोजने के लिए किया जाता है।
Evaluation
Findings का मूल्यांकन किया जाता है और व्यावसायिक उद्देश्यों की तुलना में यह निर्धारित करने के लिए कि क्या उन्हें संगठन में तैनात किया जाना चाहिए।
Deployment
अंतिम चरण में, डेटा माइनिंग Findings को रोजमर्रा के व्यवसाय के संचालन में साझा किया जाता है. एक Enterprise business intelligence platform का उपयोग स्वयं-सेवा डेटा खोज के लिए सत्य का एक स्रोत प्रदान करने के लिए किया जा सकता है।
डाटा माइनिंग के फायदे ?
डाटा माइनिंग करने के वैसे तो बहुत से फायदे होते है. लेकिन इसके जो बहुत ही खास फायदे उनके बारे में हमने नीचे बताया है −
Automated Decision-Making
डाटा माइनिंग संगठनों को डेटा का लगातार Analysis करने और मानव निर्णय की देरी के बिना नियमित और महत्वपूर्ण दोनों निर्णयों को Self drive करने की अनुमति देता है. बैंक तुरंत धोखाधड़ी के लेनदेन का पता लगा सकते हैं, सत्यापन का अनुरोध कर सकते हैं, और पहचान की चोरी के खिलाफ ग्राहकों की सुरक्षा के लिए व्यक्तिगत जानकारी भी सुरक्षित कर सकते हैं. एक फर्म के परिचालन एल्गोरिदम के भीतर तैनात, ये मॉडल निर्णय लेने और संगठन की दैनिक प्रक्रियाओं को बढ़ाने के लिए स्वतंत्र रूप से डेटा पर एकत्र, Analysis और कार्य कर सकते हैं।
Cost Reduction
डेटा खनन संसाधनों के अधिक कुशल उपयोग और आवंटन के लिए अनुमति देता है. संगठन सटीक पूर्वानुमानों के साथ Self drive निर्णय लेने और योजना बना सकते हैं जिसके परिणामस्वरूप अधिकतम लागत में कमी आएगी, यात्रियों में Delta Imbedded RFID चिप्स सामान की जाँच की और उनकी प्रक्रिया में छेद की पहचान करने और गुमराह बैग की संख्या को कम करने के लिए डेटा खनन मॉडल तैनात किया. इस प्रक्रिया में सुधार से यात्रियों की संतुष्टि बढ़ जाती है और खोए हुए सामान की फिर से खोज करने और पुन: रूट करने की लागत घट जाती है।
Accurate Prediction and Forecasting
नियोजन प्रत्येक संगठन के भीतर एक महत्वपूर्ण प्रक्रिया है. डेटा माइनिंग प्लानिंग की सुविधा देता है और प्रबंधकों को पिछले रुझानों और वर्तमान स्थितियों के आधार पर विश्वसनीय पूर्वानुमान प्रदान करता है. मेसी के औजार प्रत्येक स्टोर पर प्रत्येक कपड़ों की श्रेणी की मांग की भविष्यवाणी करने और बाजार की जरूरतों को कुशलता से पूरा करने के लिए उचित इन्वेंट्री को रूट करने के लिए पूर्वानुमान मॉडल की मांग करते हैं।
Customer Insights
फर्म अपने ग्राहकों के बीच प्रमुख विशेषताओं और मतभेदों को उजागर करने के लिए ग्राहक डेटा से डेटा खनन मॉडल तैनात करते हैं. डेटा खनन का उपयोग व्यक्ति बनाने और समग्र ग्राहक अनुभव को बेहतर बनाने के लिए प्रत्येक टचप्वाइंट को निजीकृत करने के लिए किया जा सकता है. 2017 में, डिज़्नी ने “मैजिक बैंड्स” को बनाने और लागू करने के लिए एक बिलियन डॉलर से अधिक का निवेश किया. इन बैंडों का उपभोक्ताओं के साथ एक सहजीवी संबंध है. जो रिसॉर्ट में अपने समग्र अनुभव को बढ़ाने के लिए काम कर रहे हैं, और साथ ही साथ डिज़नी के लिए अपनी गतिविधियों पर डेटा एकत्र करते हुए आगे बढ़ाने के लिए विश्लेषण करते हैं। उनके ग्राहक अनुभव