शोधयंत्रास सुयोग्य वेबसाईट भाग - १

आपली वेबसाईट जास्तीत जास्त लोकांनी, विशेषतः आपल्या वस्तू वा सेवेची गरज असणार्‍यांनी पहावी असे सर्वांना वाटत असते. मात्र केवळ वेबसाईटच्या नावावरून त्यातील माहितीचा अंदाज घेता येत नाही. शिवाय ते नावही आपल्या संपर्कातील व्यक्तींव्यतिरिक्त इतरांना अपरिचित असते. त्यामुळे याहू, गुगल, बिंग, रेडीफ यासारख्या शोधयंत्राचा उपयोग करून लोक आपल्याला हवी असणार्‍या माहितीचा शोध घेतात. यासाठी विषय व माहितीसंदर्भातील शब्द शोधयंत्राच्या कप्प्यात लिहिले जातात. या शब्दांच्या आधारे शोधयंत्रे त्या शब्दांचा समावेश असणार्‍या वा त्याविषयाशी निगडित असणारी माहिती देणार्‍या अनेक वेबसाईटची लांबलचक यादी क्षणार्धात सादर करतात.
ही यादी अनेक पानांत विभागलेली असते. जिज्ञासूला प्रत्येक पानावरील सर्व वेबसाईट पहाणे शक्य नसते. पहिल्या ४/५ पानांतील वेबसाईटपर्यंतच सहसा त्याचा शोध मर्यादित राहतो. साहजिकच यादीतील पुढच्या वेबसाईटस्‌कडे वाचकाचे लक्ष जात नाही. सार्‍या जगातील सर्व संबंधित वेबसाईट्स्‌ची नावे येत असल्याने ही यादी फार मोठी (सर्वसधारणपणे कित्येक हजार वेबसाईटस्‌) असते व आपल्या वेबसाईटचे नाव सहजी वर येणे अवघड असते. बहुधा पहिल्या पानावरील वेबसाईटलाच पाहून त्यातील वेबसाईट पाहण्याकडे लोकांचा कल असतो. यासाठी आपली वेबसाईट यादीत वरचे स्थान मिळ्वणे फार आवश्यक असते. या दृष्टीकोनातून केलेले वेबडिझाईन म्हणजे सर्च इंजिन ऑप्टिमायझेशन (SEO) होय. शोधयंत्र यादी कशी तयार करते याची पूर्ण माहिती असल्याखेरीज या विषयी काहीच अंदाज बांधता येत नाही.
गुगल शोधयंत्राच्या कार्यपद्धतीची सर्व माहिती इंटरनेटवर उपलब्ध आहे. त्याचा अभ्यास केल्यास खालील माहिती मिळते.
प्रत्येक शोधयंत्रात तीन विभाग असतात.
१. The Crawler (or the spider) - वेबसाईटस्‌ना भेटी देऊन त्यातील माहिती सलगपणे तपासून माहिती वा दुवे असणारी वेबपेजेस डाऊनलोड करून साठवून ठेवणारा क्रॉलर(रांगणारा) वा स्पायडरसारखे ( कोळ्यासारखे ) काम करणारा रोबोट प्रोग्रॅम. ठराविक कालावधीनंतर सर्व जुन्या नव्या वेबसाईट्ना भेटी देणे व माहितीत बदल असल्यास त्यातील बदल नोंदवण्याचे कार्य या रोबोट प्रोग्रॅमने केले जाते.
२. The Indexer - क्रॉलरने गोळा केलेली सर्व वेबपेजेस या प्रोग्रॅमच्या साहाय्याने Index या डाटाबेसमध्ये भरली जातात. हा डाटाबेस नवी माहिती भरून वा असलेली माहिती बदलून सतत अद्ययावत ठेवला जातो. याला Indexing असे म्हणतात.
३. The Ranker - शोधयंत्राचा हा सर्वात महत्वाचा प्रोग्रॅम ( Search engine software). युजरने भरलेले संदर्भ शब्द वाचून Index डाटाबेसमधील असंख्य वेबपेजेसना योग्य प्राधान्य क्रम लावण्याचे व ती पाने क्रमवार प्रदर्शित करण्याचे काम या प्रोग्रॅमने केले जाते.