हडूप (HADOOP) भाग - ५

उदाहरणार्थ इनपुट माहितीतील विशिष्ट शब्द वा संज्ञा यांची संख्या यांची मोजदाद करायची असेल तर  प्रत्येक इनपुट माहिती घटकातील संख्या,  की आणि व्हॅल्यु या स्वरुपात आऊटपुट यादीत मांडली जाते.  इनपुट माहितीघटकांचे आवश्यकतेनुसार विश्लेषण करून येणार्‍या निष्कर्षांची आऊटपुट यादी बनविणे हे मॅपिंग प्रणालीचे काम असते.

रिड्यूस प्रणाली

रिड्यूस प्रणालीमध्ये अशा आउटपुट यादीतील निष्कर्षांचे एकत्रीकरण  ( Aggregation)  केले जाते.

 

 

शफलिंग ( अदलाबदल)

अनेक कॉम्प्युटर्सवरून तयार झालेले निष्कर्ष जसेच्या तसे न वापरता त्यांची अदलाबदल ( शफलिंग ) करून निष्कर्षांचे  नवे गट केले जातात. यामुळे एखाद्या कॉम्प्युटरवरील माहितीत दोष निर्माण झाला असेल तरीही त्याचा  परिणाम एका पूर्ण गटावर होत नाही व  प्रत्येक गटातून योग्य निष्कर्ष निवडण्याची प्रक्रिया करणे शक्य होते.

 

संकलित होणार्‍या माहितीचे अनेक भाग वेगवेगळ्या कॉम्प्युटर्स वर वितरित होऊन तेथे स्थानिक पातळीवर मॅप रिड्यूस द्वारे निष्कर्ष जमा केले जात असल्याने कामाची गती कितीही वाढविता येते.