शोधयंत्राचा शोध - भाग १
[श्रेय अव्हेर: प्रस्तुत लेखक शोधयंत्राच्या विकसनासाठी एका संस्थेत कार्यरत आहे. परंतु ह्या लेखातील मते सर्वस्वी त्याचीच आहेत. त्या संस्थेचा येथील व्यक्त केलेल्या मतांशी काहीही संबंध नाही. तसेच ह्या संस्थेच्या शोधयंत्राविषयी आजवर प्रकाशित न झालेली माहिती लेखकाने गुप्तच ठेवलेली आहे. त्याविषयी पृच्छा करू नये
]
तुम्ही गूगल, याहू, मायक्रोसॉफ्ट ह्या संस्थांची नावे ऐकली असतीलच. पण इंकटूमी, आल्टाव्हिस्टा, ऑलदवेब, ओव्हर्चर ही नावे आठवतात का तुम्हाला? विश्वजाळावर आपल्याला हव्या त्या विषयाबद्दल काय लिहिले आहे ही माहिती करून घेण्यासाठी तुम्ही गूगलचे शोधयंत्र वापरले असेल. जगातील महाजाळाच्या प्रवाशांपैकी ४० टक्के प्रवासी गूगलचे शोधयंत्र वापरतात. ३० टक्के याहू! वापरतात, १५ टक्के मायक्रोसॉफ्टचे शोधयंत्र वापरतात. गूगलच्या ह्या लोकप्रियतेमुळेच नुकतेच शब्दकोशात ‘गूगल’ हे क्रियापद ‘शोध घेणे’ ह्या अर्थाने अंतर्भूत करण्यात आले आहे.
हे शोधयंत्र कसे काम करते? पहिल्यांदा हे कुणी विकसित केले? गूगलचे शोधयंत्र इतके लोकप्रिय का झाले? गूगल आणि इतर शोधयंत्रात फरक काय ? आपल्याला शोधयंत्राचा फायदा होतो कारण हवी ती माहिती चुटकीसरशी मिळू शकते. पण जे लोक संकेतस्थळांवर ही माहिती चढवतात, त्यांना शोधयंत्रांचा काय फायदा आहे ? आणि एवढ्या मोठ्या विश्वजाळावरच्या माहितीचा शोध ही शोधयंत्रे निमिषार्धात घेतात तरी कशी? गूगल आणि याहू सारख्या संस्था आपल्याला ही शोधयंत्र फुकट वापरू देतात. मग त्याच्या विकसनासाठी लागणारा पैसा त्यांना कुठून मिळतो? ही एवढी बलाढ्य शोधयंत्रे अस्तित्वात असताना गेल्या वर्षात विश्वजाळावरील माहिती शोधून काढण्यासाठी सुमारे वीस ते पंचवीस नवीन शोधयंत्रांच्या संस्था स्थापन झाल्यात. त्यांचा कसा निभाव लागेल? मराठी भाषेसाठी वेगळे शोधयंत्र का नसावे?
ह्या आणि अशाच अनेक प्रश्नांची उत्तरे देण्याचा प्रयत्न मी ह्या लेखमालेत करीत आहे. यातील बरीच माहिती इंग्रजीत विकिपीडिया सारख्या स्थळावर उपलब्ध आहे. काही आठवणीतून लिहिली आहे. तपशिलात चुका आढळल्यास दुरुस्ती करावी ही विनंती.
विश्वजाल लोकप्रिय होण्या आधीही आपण सगळ्यांनी शोधयंत्रासारखी सुविधा वापरली आहे. अगदी आपल्या पाठ्यपुस्तकांत, संदर्भग्रंथांतून वापरली आहे. ही सुविधा म्हणजे अशा पुस्तकांच्या शेवटच्या काही पानावर असलेली शब्द सूची (इंडेक्स). एखाद्या पुस्तकात आपल्याला हव्या असणाऱ्या विषयावर माहिती कुठे दिली आहे, हे शोधायचे असेल, तर आपण ते पुस्तक सुरुवातीपासून वाचतो का ? तसे केले तरी माहिती सापडेलच, पण त्यापेक्षाही सोपा मार्ग म्हणजे त्या पुस्तकाच्या शब्द सूचीत तो शब्द कुठल्या पानावर आहे हे बघायचे. तो पृष्ठक्रमांक बघून थेट त्या पानावर जायचे, आणि मग फक्त त्या पानावरच त्या शब्दाचा शोध घ्यायचा.
हे तुम्ही एकदा जरी केले असेल, तरी शोधयंत्रे कशी काम करतात हे तुम्हाला कळले आहे असे समजा. कारण वरवर पाहता, शोधयंत्राचा कृतिक्रम हा अगदी आपल्या पुस्तकातला एखादा शब्द शोधण्याच्या कृतिक्रमासारखाच आहे.
पण पुस्तकातली ही शब्दसूची लेखक किंवा प्रकाशक कशी तयार करतो, ह्याचा विचार आपण केला आहे का? शोधयंत्राच्या विकसनात हा सर्वात महत्वाचा कृतिक्रम आहे. आपल्याला हव्या असणाऱ्या विषयाला धरून विश्वजालावरची माहिती कशी दाखवता येते, हे त्या विषयांची किंवा शब्दांची सूची कशी तयार करण्यात आली आहे यावर मुख्यत: अवलंबून असते. ह्या संबंधी खोलात जाण्या आधी आपण पुढच्या लेखात थोडा इतिहास बघू या.
[ गृहपाठ: गूगल अथवा याहूच्या शोधयंत्राला भेट देऊन आपल्या आवडत्या विषयावरील माहिती शोधा. त्या शोधयंत्राने शोधलेली माहिती तुम्हाला हव्या असलेल्या विषयाला धरून आहे का याचा अभ्यास करा.]
September 14th, 2006 at 6:53 pm
मिलिंद,
ह्या स्तुत्य उपक्रमासाठी आपले हार्दिक अभिनंदन! शोधयंत्राच्या तंत्रज्ञानाची माहिती मराठीत आणून आपण मोलाची भर घालत आहात.
September 14th, 2006 at 9:16 pm
छान उपक्रम आहे. धन्यवाद.
पुढील भागांच्या प्रतिक्षेत.