Site icon Learn2Win

Hadoop Kya Hai

Hadoop Apache का एक ओपन सोर्स फ्रेमवर्क है और इसका इस्तेमाल प्रोसेस को स्टोर करने और डेटा के विश्लेषण के लिए किया जाता है जो वॉल्यूम में बहुत विशाल होते हैं. Hadoop जावा में लिखा गया है और OLAP ऑनलाइन विश्लेषणात्मक प्रसंस्करण नहीं है. यह बैच / ऑफ़लाइन प्रसंस्करण के लिए उपयोग किया जाता है. इसका उपयोग फेसबुक, याहू, गूगल, ट्विटर, लिंक्डइन और कई और अधिक द्वारा किया जा रहा है. इसके अलावा इसे क्लस्टर में केवल नोड्स जोड़कर बढ़ाया जा सकता है.

Hadoop एक Open source software framework है, जिसको JAVA प्रोग्रामिंग लैंग्वेज में बनाया गया है. आपकी जानकारी के लिए बता दे की Hadoop अलग अलग स्थानो पर मौजूद computer पर एवं computer के समहुओ पर मौजूद बड़े डेटा को Distributed तरीके से स्टोर करने और Processing करने की लिए प्रयोग किया जाता है. यह फाइल सिस्टम पर आधारित है। जिसकी मदद से डेटा के कुछ मुख्य Parameter के आधार पर डेटा की जांच ,उसकी Analysis की क्रिया को तेज और उत्तम बनाया जाता है. इसकी मदद से बिग डाटा को Decision making के लिए किसी ग्राफ एवं चार्ट के रूप में आसानी से दिखाया जा सकता है. यह मुख्यत उन वेब साइट्स के द्वारा डेटा को सही तरीके से व्यवस्थित करने के लिए प्रयोग किया जाता है जिनका डेटाबेस काफी बड़ा होता है।

Modules of Hadoop

Advantages of Hadoop

What is HDFS

Hadoop एक वितरित फ़ाइल सिस्टम के साथ आता है जिसे HDFS कहा जाता है. HDFS में डेटा को कई मशीनों में वितरित किया जाता है और उनकी विफलता को स्थायित्व और समानांतर अनुप्रयोग के लिए उच्च उपलब्धता सुनिश्चित करने के लिए दोहराया जाता है. यह कम खर्चीला है क्योंकि यह कमोडिटी हार्डवेयर का उपयोग करता है। इसमें ब्लॉक, डेटा नोड्स और नोड नाम की अवधारणा शामिल है.

Where to use HDFS

Where not to use HDFS

HDFS Concepts

Exit mobile version