R Programming Kya Hai

R प्रोग्रामिंग का उपयोग Statistical information और डेटा प्रतिनिधित्व के लिए किया जाता है. इसलिए यह आवश्यक है कि हमें गणित में Statistical theory का ज्ञान होना चाहिए, डेटा प्रतिनिधित्व के लिए विभिन्न प्रकार के ग्राफ़ की समझ और सबसे महत्वपूर्ण यह है कि हमें किसी भी प्रोग्रामिंग का पूर्व ज्ञान होना चाहिए।

R एक Programming के साथ साथ ये सांख्यिकीय Statistics data manipulation, graphics का वर्णन और रिपोर्टिंग के लिए सॉफ्टवेयर वातावरण भी है. R Programming का अविष्कार रॉबर्ट जेंटलमैन और Ross Ihaka ने NewZeland के Auckland University में August 1993 में किया गया था. R Programming का नाम इन दोनों के नाम के पहले अक्षरों से रखा गया है. अभी इस Programming को R Development Core Team द्वारा developed किया जा रहा है. R Programming एक ओपन सोर्स और GNU General Public License के अंतर्गत मुफ्त में पायी जाती है।

R ये Programming GNU Package है . यह प्रोग्रामिंग सांख्यिकीय कम्प्यूटिंग के लिये design कि गयी है जिसमे हजारो Packages को Develop किया गया है. ये Packages लगभग हर तरह Statistical Model को शामिल करके रखे हुए है. यह Statistics और Data Mining के लिये बहुतायत से उपयोग होती है. R मे सॉफ्टवेयर वातावरण को C और फोरट्रान प्रोग्रामिंग में लिखा गया है. R Programming, Linux, Windows, Mac और लगभग सभी Operating System/Platform को support करती है. यह Programming, Web Technology ओर Cloud मे बडे बडे डेटा सेट को analyze करने के लिये भी उपयोग होती है. यह बहुत सारी Commands को एक साथ प्रोसेस कर सकती है और Excel से ज्यादा Data Points को handle कर सकती है।

What is R Programming in Hindi

R Language का अविष्कार रॉबर्ट जेंटलमैन और Ross Ihaka ने न्यूजीलैंड के Auckland University में August 1993 में किया गया था. R language का नाम इन दोनों के नाम के पहले अक्षरों से रखा गया है, अभी इस language को R Development Core Team द्वारा developed किया जा रहा है, R एक प्रोग्रामिंग भाषा और वातावरण है जो आमतौर पर सांख्यिकीय कंप्यूटिंग, डेटा एनालिटिक्स और वैज्ञानिक अनुसंधान में उपयोग किया जाता है. यह सांख्यिकीविदों, डेटा विश्लेषकों, शोधकर्ताओं और मार्केटर्स द्वारा उपयोग की जाने वाली, स्वच्छ, विश्लेषण, कल्पना और वर्तमान डेटा को प्राप्त करने के लिए उपयोग की जाने वाली सबसे लोकप्रिय भाषाओं में से एक है. अपने अभिव्यंजक वाक्यविन्यास और आसान उपयोग इंटरफ़ेस के कारण, हाल के वर्षों में लोकप्रियता में वृद्धि हुई है।

इस Programming language में मशीन लर्निंग अल्गोरिद्म, लीनियर रिग्रेशन, टाइम सीरीज़, स्टैटिस्टिकल इन्वेंशन कुछ नाम शामिल हैं, अधिकांश R पुस्तकालयों को R में लिखा जाता है, लेकिन भारी कम्प्यूटेशनल कार्य के लिए, C, C++ और फोरट्रान कोड पसंद किए जाते हैं. R Programming न केवल अकादमिक द्वारा सौंपा गया है, बल्कि कई बड़ी कंपनियां भी R प्रोग्रामिंग भाषा का उपयोग करती हैं, जिसमें उबर, गूगल, एयरबीएनबी, फेसबुक और इसी तरह शामिल हैं।

यह एक Software environment भी है, जिसका उपयोग सांख्यिकीय जानकारी, चित्रमय प्रतिनिधित्व, रिपोर्टिंग और डेटा मॉडलिंग का विश्लेषण करने के लिए किया जाता है. R एस प्रोग्रामिंग भाषा का कार्यान्वयन है, जिसे लेक्सिकल स्कूपिंग शब्दार्थ के साथ जोड़ा गया है. R हमें न केवल ब्रांचिंग और लूपिंग करने की अनुमति देता है, बल्कि फ़ंक्शन का उपयोग करके मॉड्यूलर प्रोग्रामिंग करने की भी अनुमति देता है. R, C, C ++, .Net, Python, और Fortran भाषाओं में लिखी प्रक्रियाओं को दक्षता में सुधार के साथ एकीकरण की अनुमति देता है।

R का इतिहास लगभग 20-30 साल पहले का है. R को यूनिवर्सिटी ऑफ ऑकलैंड, न्यूज़ीलैंड में रॉस ल्हाका और रॉबर्ट जेंटलमैन द्वारा विकसित किया गया था, और आर डेवलपमेंट कोर टीम ने इसे विकसित किया है. यह प्रोग्रामिंग भाषा का नाम दोनों डेवलपर्स के नाम से लिया गया है, पहला प्रोजेक्ट 1992 में माना गया था. प्रारंभिक संस्करण 1995 में जारी किया गया था, और 2000 में, एक स्थिर बीटा संस्करण जारी किया गया था।

R Programming को क्यों सीखना चाहिए?

  • R खुला स्रोत है, इसलिए यह मुफ़्त है।
  • आर क्रॉस-प्लेटफॉर्म संगत है, इसलिए इसे विंडोज, मैक ओएसएक्स और लिनक्स पर स्थापित किया जा सकता है।
  • आर सांख्यिकीय तकनीकों और चित्रमय क्षमताओं की एक विस्तृत विविधता प्रदान करता है।
  • R स्क्रिप्ट और परिणाम को एक फ़ाइल में एम्बेड करके एक Reproduce करने योग्य अनुसंधान करने की संभावना प्रदान करता है।
  • शिक्षा और व्यवसाय दोनों में R का एक विशाल समुदाय है।
  • विशेष समस्याओं को हल करने के लिए आर पैकेज बनाना आसान है।

डेटा विश्लेषण करने के लिए बाजार में कई उपकरण उपलब्ध हैं. नई भाषाओं को सीखने में समय लगता है, डेटा वैज्ञानिक दो Excellent tools का उपयोग कर सकते हैं, अर्थात्, आर और पायथन, हमारे पास उन दोनों को सीखने का समय नहीं हो सकता है. जब हम डेटा विज्ञान सीखना शुरू करते है. एक प्रोग्रामिंग भाषा सीखने की तुलना में सांख्यिकीय मॉडलिंग और एल्गोरिथ्म सीखना अधिक महत्वपूर्ण है. एक प्रोग्रामिंग भाषा का उपयोग हमारी खोज की गणना और संचार करने के लिए किया जाता है।

डेटा विज्ञान में महत्वपूर्ण कार्य वह तरीका है जिससे हम डेटा से deal करते है, स्वच्छ, सुविधा इंजीनियरिंग, सुविधा चयन और आयात, यह हमारा प्राथमिक ध्यान होना चाहिए. डेटा साइंटिस्ट का काम डेटा को समझना, उसमें फेरबदल करना और सर्वश्रेष्ठ दृष्टिकोण को उजागर करना है. मशीन सीखने के लिए, सबसे अच्छा एल्गोरिदम आर केरस और टेन्सरफ्लो के साथ लागू किया जा सकता है. जो हमें उच्च-अंत मशीन सीखने की तकनीक बनाने की अनुमति देता है. R Xgboost प्रदर्शन करने के लिए एक पैकेज है. काग्गल प्रतियोगिता के लिए Xgboost सर्वश्रेष्ठ एल्गोरिदम में से एक है।

अन्य भाषाओं के साथ संवाद और संभवतः पायथन, जावा, C++ को कॉल करता है. बड़ा डेटा वर्ल्ड R के लिए भी सुलभ है. हम R को स्पार्क या हडोप जैसे विभिन्न डेटाबेस से जोड़ सकते हैं. संक्षेप में, R डेटा की जांच और अन्वेषण करने के लिए एक महान उपकरण है. क्लस्टरिंग, सहसंबंध और डेटा में कमी जैसे विस्तृत विश्लेषण आर के साथ किए जाते हैं।

R प्रोग्रामिंग को वर्तमान समय में सॉफ्टवेयर प्रोग्रामर, सांख्यिकीविदों, डेटा वैज्ञानिकों और डेटा खानों द्वारा बड़े पैमाने पर उपयोग किया जाता है. यह डेटा एनालिटिक्स और बिजनेस एनालिटिक्स में उपयोग किए जाने वाले सबसे लोकप्रिय एनालिटिक्स टूल में से एक है. यह स्वास्थ्य सेवा, शिक्षाविद, परामर्श, वित्त, मीडिया और कई और अधिक जैसे डोमेन में कई अनुप्रयोग हैं. सांख्यिकी, डेटा विज़ुअलाइज़ेशन और मशीन लर्निंग में इसकी विशाल प्रयोज्यता ने आर में प्रमाणित प्रशिक्षित पेशेवरों की मांग को जन्म दिया है।

Features of R programming

R एक डोमेन-विशिष्ट प्रोग्रामिंग भाषा है जिसका उद्देश्य डेटा विश्लेषण करना है. इसकी कुछ Unique features हैं जो इसे बहुत शक्तिशाली बनाती हैं. सबसे महत्वपूर्ण यकीनन वैक्टर की धारणा है. ये वैक्टर हमें एक ही कमांड में मानों के एक सेट पर एक Complex operation करने की अनुमति देते हैं, R की कुछ महत्वपूर्ण विशेषताएं इस प्रकार हैं −

यह GNU (जनरल पब्लिक लाइसेंस) के तहत जारी की जाने वाली एक स्वतंत्र और ओपन सोर्स प्रोग्रामिंग भाषा है।

इसमें क्रॉस-प्लेटफॉर्म इंटरऑपरेबिलिटी है जिसका अर्थ है कि इसमें विंडोज, लिनक्स और मैक पर चलने वाले वितरण हैं. आर कोड को आसानी से एक प्लेटफॉर्म से दूसरे प्लेटफॉर्म पर पोर्ट किया जा सकता है।

यह एक compiler के बजाय एक दुभाषिया का उपयोग करता है, जो कोड के विकास को आसान बनाता है।

यह प्रभावी रूप से विभिन्न डेटाबेस को संबद्ध करता है, और यह Microsoft Excel, साथ ही Microsoft Access, MySQL, SQLite, Oracle, आदि से जानकारी लाने में अच्छा करता है।

यह एक flexible language है जो सॉफ्टवेयर डेवलपमेंट और डेटा एनालिसिस के बीच की खाई को पाटती है।

यह डेटा विश्लेषण, सांख्यिकीय मॉडलिंग, विज़ुअलाइज़ेशन, मशीन लर्निंग और डेटा आयात और हेर-फेर करने के लिए अनुरूपित कोड, फ़ंक्शंस और सुविधाओं की विविधता के साथ कई प्रकार के पैकेज प्रदान करता है।

यह सीएसवी, एक्सएमएल, एचटीएमएल, और पीडीएफ जैसे विभिन्न रूपों में रिपोर्टों को संप्रेषित करने के लिए विभिन्न शक्तिशाली उपकरणों को एकीकृत करता है, और आर संकुल की मदद से इंटरेक्टिव वेबसाइटों के माध्यम से भी।

R programming में डेटा विश्लेषण करने के लिए कदम

Import − पहला कदम आर पर्यावरण में डेटा आयात करना है. इसका अर्थ है कि आप फ़ाइलों, डेटाबेस, HTML तालिकाओं आदि में संग्रहीत डेटा को लेते हैं, और उस पर डेटा विश्लेषण करने के लिए इसे R डेटा फ़्रेम में लोड करते हैं।

Transform − इस चरण में, पहले, हम प्रत्येक स्तंभ को एक चर और प्रत्येक पंक्ति को एक अवलोकन बनाकर अपने डेटा को व्यवस्थित बनाते हैं. एक बार जब हमारे पास सुव्यवस्थित डेटा होता है, तो हम अपनी रुचि की टिप्पणियों को खोजने के लिए उस पर संकीर्ण हो जाते हैं, नए चर बनाते हैं जो मौजूदा चर के कार्य होते हैं, और टिप्पणियों के सारांश आंकड़े पाते हैं।

Visualization − इसका उपयोग graphical रूप में डेटा का प्रतिनिधित्व करके हमारे डेटा को अधिक समझने योग्य बनाने के लिए किया जाता है. visualization से हमारे डेटा में पैटर्न को पहचानना, रुझान और अपवादों को पहचानना आसान हो जाता है. यह हमें quick और visual तरीके से जानकारी और परिणाम देने में सक्षम बनाता है।

Model − मॉडल विज़ुअलाइज़ेशन के पूरक उपकरण हैं, ये मौलिक रूप से गणितीय या कम्प्यूटेशनल उपकरण हैं जिनका उपयोग हमारी टिप्पणियों से संबंधित सवालों के जवाब देने के लिए किया जाता है।

Communication − डेटा विश्लेषण के इस अंतिम चरण में, हम विज़ुअलाइज़ेशन और दूसरों के साथ मॉडलिंग से परिणामों को संप्रेषित करने पर ध्यान केंद्रित करते हैं. यह दुनिया भर में साझा करने के लिए अच्छी तरह से डिज़ाइन किए गए प्रिंट-गुणवत्ता वाले भूखंडों का उत्पादन करने में आसानी प्रदान करता है।