शोधयंत्राचा शोध - भाग १

[श्रेय अव्हेर: प्रस्तुत लेखक शोधयंत्राच्या विकसनासाठी एका संस्थेत कार्यरत आहे. परंतु ह्या लेखातील मते सर्वस्वी त्याचीच आहेत. त्या संस्थेचा येथील व्यक्त केलेल्या मतांशी काहीही संबंध नाही. तसेच ह्या संस्थेच्या शोधयंत्राविषयी आजवर प्रकाशित न झालेली माहिती लेखकाने गुप्तच ठेवलेली आहे. त्याविषयी पृच्छा करू नये :-) ]

तुम्ही गूगल, याहू, मायक्रोसॉफ्ट ह्या संस्थांची नावे ऐकली असतीलच. पण इंकटूमी, आल्टाव्हिस्टा, ऑलदवेब, ओव्हर्चर ही नावे आठवतात का तुम्हाला? विश्वजाळावर आपल्याला हव्या त्या विषयाबद्दल काय लिहिले आहे ही माहिती करून घेण्यासाठी तुम्ही गूगलचे शोधयंत्र वापरले असेल. जगातील महाजाळाच्या प्रवाशांपैकी ४० टक्के प्रवासी गूगलचे शोधयंत्र वापरतात. ३० टक्के याहू! वापरतात, १५ टक्के मायक्रोसॉफ्टचे शोधयंत्र वापरतात. गूगलच्या ह्या लोकप्रियतेमुळेच नुकतेच शब्दकोशात ‘गूगल’ हे क्रियापद ‘शोध घेणे’ ह्या अर्थाने अंतर्भूत करण्यात आले आहे.

हे शोधयंत्र कसे काम करते? पहिल्यांदा हे कुणी विकसित केले? गूगलचे शोधयंत्र इतके लोकप्रिय का झाले? गूगल आणि इतर शोधयंत्रात फरक काय ? आपल्याला शोधयंत्राचा फायदा होतो कारण हवी ती माहिती चुटकीसरशी मिळू शकते. पण जे लोक संकेतस्थळांवर ही माहिती चढवतात, त्यांना शोधयंत्रांचा काय फायदा आहे ? आणि एवढ्या मोठ्या विश्वजाळावरच्या माहितीचा शोध ही शोधयंत्रे निमिषार्धात घेतात तरी कशी? गूगल आणि याहू सारख्या संस्था आपल्याला ही शोधयंत्र फुकट वापरू देतात. मग त्याच्या विकसनासाठी लागणारा पैसा त्यांना कुठून मिळतो? ही एवढी बलाढ्य शोधयंत्रे अस्तित्वात असताना गेल्या वर्षात विश्वजाळावरील माहिती शोधून काढण्यासाठी सुमारे वीस ते पंचवीस नवीन शोधयंत्रांच्या संस्था स्थापन झाल्यात. त्यांचा कसा निभाव लागेल? मराठी भाषेसाठी वेगळे शोधयंत्र का नसावे?

ह्या आणि अशाच अनेक प्रश्नांची उत्तरे देण्याचा प्रयत्न मी ह्या लेखमालेत करीत आहे. यातील बरीच माहिती इंग्रजीत विकिपीडिया सारख्या स्थळावर उपलब्ध आहे. काही आठवणीतून लिहिली आहे. तपशिलात चुका आढळल्यास दुरुस्ती करावी ही विनंती.

विश्वजाल लोकप्रिय होण्या आधीही आपण सगळ्यांनी शोधयंत्रासारखी सुविधा वापरली आहे. अगदी आपल्या पाठ्यपुस्तकांत, संदर्भग्रंथांतून वापरली आहे. ही सुविधा म्हणजे अशा पुस्तकांच्या शेवटच्या काही पानावर असलेली शब्द सूची (इंडेक्स). एखाद्या पुस्तकात आपल्याला हव्या असणाऱ्या विषयावर माहिती कुठे दिली आहे, हे शोधायचे असेल, तर आपण ते पुस्तक सुरुवातीपासून वाचतो का ? तसे केले तरी माहिती सापडेलच, पण त्यापेक्षाही सोपा मार्ग म्हणजे त्या पुस्तकाच्या शब्द सूचीत तो शब्द कुठल्या पानावर आहे हे बघायचे. तो पृष्ठक्रमांक बघून थेट त्या पानावर जायचे, आणि मग फक्त त्या पानावरच त्या शब्दाचा शोध घ्यायचा.

हे तुम्ही एकदा जरी केले असेल, तरी शोधयंत्रे कशी काम करतात हे तुम्हाला कळले आहे असे समजा. कारण वरवर पाहता, शोधयंत्राचा कृतिक्रम हा अगदी आपल्या पुस्तकातला एखादा शब्द शोधण्याच्या कृतिक्रमासारखाच आहे.

पण पुस्तकातली ही शब्दसूची लेखक किंवा प्रकाशक कशी तयार करतो, ह्याचा विचार आपण केला आहे का? शोधयंत्राच्या विकसनात हा सर्वात महत्वाचा कृतिक्रम आहे. आपल्याला हव्या असणाऱ्या विषयाला धरून विश्वजालावरची माहिती कशी दाखवता येते, हे त्या विषयांची किंवा शब्दांची सूची कशी तयार करण्यात आली आहे यावर मुख्यत: अवलंबून असते. ह्या संबंधी खोलात जाण्या आधी आपण पुढच्या लेखात थोडा इतिहास बघू या.

[ गृहपाठ: गूगल अथवा याहूच्या शोधयंत्राला भेट देऊन आपल्या आवडत्या विषयावरील माहिती शोधा. त्या शोधयंत्राने शोधलेली माहिती तुम्हाला हव्या असलेल्या विषयाला धरून आहे का याचा अभ्यास करा.]

2 Responses to “शोधयंत्राचा शोध - भाग १”

  1. शैलेश श. खांडेकर Says:

    मिलिंद,

    ह्या स्तुत्य उपक्रमासाठी आपले हार्दिक अभिनंदन! शोधयंत्राच्या तंत्रज्ञानाची माहिती मराठीत आणून आपण मोलाची भर घालत आहात.

  2. विशाल Says:

    छान उपक्रम आहे. धन्यवाद.
    पुढील भागांच्या प्रतिक्षेत.

Leave a Reply