गुगल गाळणी (परकोलेटर) भाग - २

डाटाबेस(Database) -  माहिती साठविण्यासाठी डाटाबेस वापरले जातात. या डाटाबेसमध्ये  प्रत्येक  प्रकारची माहिती वेगवेगळ्या टेबलमध्ये नोंदली जाते.  टेबलची रचना आडव्या ओळी(Rows) व उभे रकाने (Columns) असणार्‍या तक्त्याप्रमाणे असते. प्रत्येक आडव्या ओळीत एक माहिती संच (Record)असतो. व त्यातील प्रत्येक घटक वेगवेगळ्या विशिष्ट रकान्यांमध्ये (Fields) नोंदविला जातो.  अशा सुनियोजित माहिती संचामुळे  डाटाबेसमध्ये माहिती भरणे, त्यात बदल करणे व त्याचे विश्लेषण करून विविध अहवाल करणे सोपे जाते. मात्र माहितीचा आवाका फार मोठा असेल तर अशा एकसंध डाटाबेसमधील टेबलमधील रेकार्डची संख्या प्रचंड वाढते व त्यामुळे या डाटाबेसचा उपयोग करून आवश्यक  माहिती मिळविण्यासाठी फार अवधी लागतो. वेबसाईटवरील माहिती ही टेक्स्ट, आकृत्या,  चित्रे, ध्वनी,  व्हिडीओ अशा विविध प्रकारची असते व त्यातही प्रत्येक वेबसाईटवरील माहितीतही विविधता असते. त्यामुळे वेबसाईट शोधप्रणालीसाठी डाटाबेसचा वापर करणे शक्य होत नाही.

 

यावर उपाय म्हणून बिग टेबल  (Big Table) या नव्या माहितीसंकलन पद्धतीचा वापर केला जातॊ. यात आडव्या ओळी व उभे रकाने अशीच रचना असली तरी त्यातील प्रत्येक ओळीमध्ये तेवढेच रकाने असण्याचे बंधन नसते. शिवाय सर्व ओळींचा एकच टेबल संच न करता त्याचे अनेक संचात विभाजन करून ते छोट्या टॅबलेटस्वरुपात सर्व्हरवर साठविले जातात. यामुळे माहिती कितीही मोठी व विविध प्रकारची असली तरी ती अनेक कॉम्प्युटरवर बिगटेबल टॅबलेटच्या स्वरुपात साठविली जात असल्याने त्याचे विश्लेषण करणे कमी वेळात होऊ शकते.  

     

गुगल गाळणीमध्ये तीन कार्यघटकांचा एकत्रित संच कॉम्प्युटर समूहातील प्रत्येक कॉम्प्युटरमध्ये स्थापित केला जातो. परकोलेटर वर्कर, बिगटेबल टॅबलेट सर्व्हर आणि गुगल फाईल सिस्टीमद्वारे माहिती संच  हाताळणारा चंकसर्व्हर.

 

परकोलेटर वर्करमार्फत बिगटेबलमधील ज्या ज्या रकान्यातील माहिती बदलली  जात असेल त्याचा शोध घेऊन संबंधित निरीक्षक प्रणालीस कार्यान्वित केली जाते. निरीक्षक प्रणाली बिगटेबल टॅबलेटमधील संबंधित माहितीबरहुकूम चंकसर्व्हरमध्ये माहितीचे संपादन करते.