रविवार

21 साल के हुए सर्च इंजन

at 04:06
मनोज जैसवाल : इंटरनेट सर्च इंजनों के 21 साल पूरे होने के बाद आज गूगल, बिंग और याहू जैसे दिग्गज सर्च इंजनों की व्यापकता को देखकर ऐसा लगता है जैसे उन्होंने जीवन के लगभग हर पहलू को ‘खोज योग्य’ बना दिया है, लेकिन इतने लंबे और बड़े सफर के बाद भी वेब सर्च को ज्यादा से ज्यादा सटीक और उपयोगी बनाने की होड़ खत्म नहीं हुई है। जब-तब कोई न कोई नवीनता भरा प्रयोग कर वे अपने यूजर्स को चौंकाने का मौका तलाश ही लेते हैं। गूगल के ‘इंस्टेंट’ सर्च फीचर के साथ-साथ इन दिनों जो खासी चर्चा में है वह है ‘सोशल सर्च।
गूगल ने हाल ही में एक ‘सोशल सर्च’ कंपनी आर्डवार्क का अधिग्रहण किया था। अब उसने अपनी खोज सेवाओं में ‘सोशल सर्च’ को भी शामिल कर लिया है। उधर माइक्रोसॉफ्ट के ‘बिंग’ से लेकर सोशल नेटवर्किंग साइट ‘फेसबुक’ और ‘ट्विटर’ ने भी ‘सोशल सर्च’ के क्षेत्र में प्रवेश किया है। इस नई श्रेणी की सर्च सुविधा की जरूरत क्यों पड़ी? आप जानते हैं कि सभी प्रमुख सर्च इंजनों के खोज परिणाम स्वचालित एल्गोरिद्म (कंप्यूटरीय गणनाओं के फार्मूले) के आधार पर दिखाए जाते हैं।
इन परिणामों का प्रासंगिक और सटीक होना इन्हीं गणनाओं पर आधारित होता है। उन्हें महत्व के लिहाज से किस क्रम में दिखाया जाए, वह भी कंप्यूटर ही तय करता है। हालांकि ‘पेज रैंक’ और ‘लिंक लोकप्रियता’ जैसी अवधारणाओं के प्रयोग ने इन नतीजों को बेहतर बनाया है, लेकिन फिर भी ‘मशीनी’ फैसलों की अपनी सीमाएं होती हैं। वे इंसानों की पसंद-नापसंद और प्राथमिकताओं से मेल करेंगे, इस बात की कोई गारंटी नहीं है।
दूसरी तरफ सोशल सर्च ‘मानवीय पसंद-नापसंद’ को ध्यान में रखते हुए परिणाम दिखाती है, इसीलिए वे अधिक स्वाभाविक और अनुकूल महसूस होते हैं। इसका प्रयोग करने वाले अलग-अलग व्यक्तियों को अलग-अलग नतीजे दिखाई देंगे, भले ही कीवर्ड समान हो।
सोशल सर्च में इस बात का पता लगाया जाता है कि क्या आपकी दिलचस्पी वाले मुद्दों पर आपके सामाजिक दायरे में रहने वाले अन्य लोगों ने भी कभी सर्च किया है या फिर फेसबुक, ट्विटर, ब्लॉग या किसी अन्य माध्यम पर उनसे जुड़ी टिप्पणी की है? यदि हां, तो शायद वे आपके लिए भी उपयोगी होंगे क्योंकि आपके परिचय-क्षेत्र में किसी ने उन्हें ‘पसंद’ किया है। दूसरे, इस बात के काफी आसार हैं कि समान सामाजिक परिवेश से आने वाले लोगों को एक जैसी सूचनाओं की जरूरत हो।


परिणाम कहां-कहां से!
गूगल सोशल सर्च में ट्विटर, गूगल प्रोफाइल, ब्लॉगों, फ्लिकर, फ्रेंड्सफीड, पिकासा, यू-ट्यूब आदि की सामग्री शामिल की जाती है, लेकिन वही सामग्री जिसका आपके सामाजिक दायरे के लोगों ने प्रयोग या जिक्र किया हो। यदि आप हिन्दी पत्रकारिता पर सामग्री ढूंढ रहे हैं तो हो सकता है कि आपके किसी मित्र के ब्लॉग का लेख सबसे ऊपर देखकर आप चौंक जाएं।
सामान्य सर्च में शायद वही लेख दो सौवें पेज तक भी नहीं मिलेगा, लेकिन सोशल सर्च आपकी जरूरतों का इंसानी लिहाज से आकलन करती है। इस लेख की उपयोगिता अन्य लोगों के लिए भले ही बिल्कुल न हो, आपके लिए जरूर है क्योंकि आप लेखक के मित्र हैं और उसकी रचना को पढ़ना चाहेंगे।
फर्ज कीजिए कि आप जापान के बारे में चित्र तलाश रहे हैं। आपके लिए कितना सुखद आश्चर्य होगा यदि सर्च नतीजों में पहले नंबर पर आपके किसी मित्र की जापान यात्रा के दौरान लिए गए चित्र दिखाई दें, जो उन्होंने कभी फ्लिकर या पिकासा जैसी इमेज साइटों पर डाले थे! अगर आप उन्हें इस्तेमाल करना भी चाहें तो मित्र से अनुमति लेने में कोई परेशानी नहीं आएगी, बनिस्पत किसी अन्य फोटोग्राफर के ‘कापीराइट-युक्त’ फोटोग्राफ के।
आप शेक्सपियर पर रिसर्च कर रहे हैं और इंटरनेट सर्च के दौरान यह देखकर खुशी के मारे उछल पड़ते हैं कि आपके गाइड के वरिष्ठ मित्र ने शेक्सपियर के बारे में किसी ‘कमाल के लेख’ का जिक्र अपने फेसबुक पेज में किया है।
आपने लिंक क्लिक किया और लेख हाजिर! सोशल सर्च न होती तो शायद आप कभी अपने गाइड के उन वरिष्ठ मित्र तक न पहुंच पाते। चूंकि वे भी उच्च शिक्षा के क्षेत्र में हैं, इसलिए उनकी पसंद का लेख आपके लिए भी उपयोगी होगा ही, यह मानकर चला जा सकता है! सोशल सर्च इसी तरह हर व्यक्ति की अलग-अलग जरूरतों, परिवेश, पसंद-नापसंद और सर्च नतीजों की अनुकूलता को ध्यान में रखकर परिणाम दिखाती है।

खोज का आधार क्या?
आपके मन में यह सवाल उठना स्वाभाविक है कि गूगल या दूसरे सोशल सर्च इंजन आपके मित्रों, रिश्तेदारों और परिचितों की सामग्री तक कैसे पहुंचते हैं? और यदि वे दुनिया के हर इंसान के लिए इतनी मेहनत कर रहे हैं तो उनके कुल नतीजों का भंडार कितना बड़ा होगा! अगर आप गूगल समूह की किसी भी वेबसाइट (जीमेल, ब्लॉगर, यू-ट्यूब, गूगल-डॉक्स आदि) के सदस्य हैं तो उसे आपकी पसंद-नापसंद या गतिविधियों की कुछ न कुछ जानकारी जरूर है।
इस आधार पर वह आपके ब्लॉगों में टिप्पणियां करने वाले मित्रों, ट्विटर में आपके फॉलोवर्स या जिन्हें आप फॉलो करते हैं, उन सबको खोजने में सक्षम है। यही नहीं, वह आपके मित्रों के मित्रों और परिचितों को भी अपने दायरे में लेता है। इन सबको मिलाकर आपका ‘सोशल ग्राफ’ (गूगल इसे ‘सोशल सर्कल’ कहता है) तैयार होता है - एक तरह से आपका अपना मित्र-समाज जो आपकी उम्मीदों से कहीं बड़ा हो सकता है। वजह? अगर आप ट्विटर में पच्चीस लोगों को फॉलो करते हैं और वे पच्चीस लोग अलग-अलग पच्चीस लोगों को फॉलो करते हैं तो आपके सोशल सर्किल में वे भी शामिल होंगे।
सोशल सर्च में परिणाम दिखाने से पहले आपके सोशल ग्राफ के दायरे में आने वाले लोगों से जुड़े कंटेंट (सामग्री) को खोजा जाता है और नतीजे सामान्य सर्च के साथ ‘सर्च रिजल्ट्स फ्रॉम पीपल इन योर सोशल सर्कल’ शीर्षक के साथ अलग से दिखाए जाते हैं। आपके सोशल ग्राफ में कुछ अन्य लोग भी शामिल हैं, जैसे - फ्रेंड्सफीड नामक वेबसाइट में आपके मित्र, गूगल-टॉक की चैट-सूची के मित्र, गूगल कॉन्टेक्ट्स में दिए गए मित्र, सहकर्मी और रिश्तेदार।
अगर आप जानना चाहते हैं कि आपका सोशल सर्कल कितना बड़ा है, तो देखें- ’google.com/s2/search/social. गूगल सोशल सर्च को पूर्णता तक ले जाने के लिए उसका फेसबुक और लिंक्ड-इन के साथ जुड़ना जरूरी है, जो आज नहीं तो कल हो ही जाएगा। फेसबुक ने अपने सर्च नतीजों को वेबसाइटों से जोड़ने के लिए एक विशेष सुविधा ‘ओपन ग्राफ प्रोटोकॉल’ सार्वजनिक रूप से उपलब्ध कराई है जिसका इस्तेमाल करने को कोई भी वेबसाइट स्वतंत्र है। अगर गूगल चाहे तो इसे आजमा सकता है।
गूगल पर सोशल सर्च के लिए अलग से कोई वेब एड्रेस डालने की जरूरत नहीं है। सामान्य सर्च के नतीजों के बीच में ही सोशल सर्च के परिणाम अलग से दिखाए जाते हैं, लेकिन इस सुविधा का प्रयोग करने के लिए आपका गूगल पर ‘साइन इन’ करना (यूज़रनेम और पासवर्ड डालकर साइट खोलना) जरूरी है।
यह भी संभव है कि आपके सामाजिक दायरे में आने वाले लोगों ने इच्छित कीवर्ड से जुड़ी कोई सामग्री इंटरनेट पर नहीं डाली है। कुछ लोग अपनी सोशल नेटवर्किंग साइटों का कुछ हिस्सा ‘प्राइवेट’ रखते हैं। उसके नतीजे सोशल सर्च में नहीं दिखते। अगर आपके प्रोफाइल की भाषा ‘यूएस-इंग्लिश’ है, तो शायद आपको अधिक नतीजे दिखाई दें।

दूसरे भी पीछे नहीं
माइक्रोसॉफ्ट की सोशल सर्च सुविधा आजमाने के लिए  bing.com/social पर जाएं। यह सोशल नेटवर्किंग साइटों पर साझा किए गए लिंक्स और ट्विटर के नतीजे दिखाता है। यहां कोई कीवर्ड डालने पर ऐसे तीन लोगों से जुड़े लिंक भी सुझाए जाते हैं जो उस विषय पर गहरी जानकारी रखते हैं। अगर आप उस विषय में ज्यादा दिलचस्पी रखते हैं तो आप बिंग के सुझाए लोगों को ट्विटर पर ‘फॉलो’ कर उनके संपर्क में रह सकते हैं।
बिंग सोशल आपको अपनी रुचि के अनुकूल दिलचस्प लोगों से जोड़ता है। इंटरनेट सर्च में इस तरह का सामाजिक पहलू पहले कहां था? फेसबुक ने पिछले अप्रैल माह में अपना ‘ओपन ग्राफ प्रोटोकॉल’ जारी किया था। आपने देखा होगा कि कुछ समय पहले इस वेबसाइट पर ‘लाइक’ और ‘रिकमेंड’ नामक लिंक्स की शुरुआत हुई थी जिन्हें दबाकर आप किसी भी व्यक्ति, टिप्पणी, लिंक, चित्र आदि के बारे में अपनी दिलचस्पी का इजहार कर सकते थे।

21 साल के हुए सर्च इंजन
सर्च इंजनों के इस्तेमाल को 21 साल हो गए हैं। पहला इंटरनेट सर्च इंजन ‘आर्ची’ था जिसे 1990 में एलन एमटेज नामक छात्र ने विकसित किया था। आर्ची के आगमन के समय ‘विश्व व्यापी वेब’ का नामो-निशान भी नहीं था। चूंकि उस समय वेब पेज जैसी कोई चीज नहीं थी, इसलिए आर्ची एफटीपी सर्वरों में मौजूद सामग्री को इन्डेक्स कर उसकी सूची उपलब्ध कराता था।
‘आर्ची’ इसी नाम वाली प्रसिद्ध कॉमिक स्ट्रिप से कोई संबंध नहीं है। यह नाम अंग्रेजी के ‘आर्काइव’ शब्द से लिया गया था, जिसका अर्थ है क्रमानुसार सहेजी हुई सूचनाएं। आर्ची के बाद मार्क मैककैहिल का ‘गोफर’ (1991), ‘वेरोनिका’ और ‘जगहेड’ आए। 1997 में आया ‘गूगल’ जो सबसे सफल और सबसे विशाल सर्च इंजन माना जाता है। ‘याहू’ ‘बिंग’ (पिछला नाम एमएसएन सर्च), एक्साइट, लाइकोस, अल्टा विस्टा, गो, इंकटोमी आदि सर्च इंजन भी बहुत प्रसिद्ध हैं। भारत में ‘रीडिफ’ ‘गुरुजी’ और ‘रफ्तार’ अच्छे सर्च इंजन हैं।
इंटरनेट पर खोज के लिए दो तरह की वेबसाइटें उपलब्ध हैं - डायरेक्टरी या निर्देशिका और सर्च इंजन। दोनों के काम करने के तरीके अलग-अलग हैं। डायरेक्टरी यलो पेजेज की तरह है। जिस तरह यलो पेजेज में अलग-अलग कंपनियों, फर्मो आदि से संबंधित सूचनाओं को श्रेणियों और सूचियों में बांटकर रखा जाता है, उसी तरह निर्देशिकाओं में भी श्रेणियां होती हैं।
शिक्षा, विज्ञान, कला, भूगोल आदि ऐसी ही श्रेणियां हैं। इन्हें आगे भी उप श्रेणियों में विभक्त किया जाता है। याहू डायरेक्टरी (dir.yahoo.com), डीमोज (dmoz.com) आदि ऐसी ही निर्देशिकाएं हैं। इनमें हम श्रेणियों, उप श्रेणियों से होते हुए संबंधित जानकारी तक पहुंचते हैं। चूंकि निर्देशिकाओं के बंधक खुद इन श्रेणियों और सूचियों को संपादित करते रहते हैं, इसलिए इनमें अनावश्यक सामग्री मिलने की आशंका कम होती है। इनमें प्राय: बहुत देखभाल कर उन्हीं वेबसाइटों की सामग्री ली जाती है जो वहां विधिवत पंजीकृत होती हैं।
निर्देशिका के विपरीत, सर्च इंजनों का काम स्वचालित ढंग से होता है। इनके सॉफ्टवेयर टूल जिन्हें ‘वेब क्रॉलर’ ‘स्पाइडर’ ‘रोबोट’ या ‘बोट’ कहा जाता है, इंटरनेट पर मौजूद वेब पेजों की खोजबीन करता रहता है। ये क्रॉलर वेबसाइटों में दिए गए लिंक्स के जरिए एक से दूसरे पेज पर पहुंचते रहते हैं और जब भी कोई नई सामग्री मिलती है, उससे संबंधित जानकारी अपने सर्च इंजन में डाल देते हैं।

जिन वेबसाइटों में निरंतर सामग्री डाली जाती है (जैसे समाचार वेबसाइटें), उनमें ये बार-बार आते हैं। इस तरह उनकी सूचनाएं लगातार ताजा होती रहती हैं। लेकिन चूंकि ज्यादातर काम मशीनी ढंग से होता है, इसलिए सर्च इंजनों में कई अनावश्यक वेबपेज भी शामिल हो जाते हैं। इसलिए सर्च नतीजों को निखारने की क्रिया लगातार चलती है।

14 टिप्‍पणियां

  1. बेनामी19:29

    धन्यबाद,आप तकनीकी पर औरअधिक लिखे

    उत्तर देंहटाएं
  2. मनोज जी तकनीकी पर जल्दी जानकारी देने की कोशिस करे

    उत्तर देंहटाएं
  3. मनोज जी तकनीकी पर जानकारी देने की kosis करे

    उत्तर देंहटाएं
  4. मनोज जी तकनीकी पर जानकारी देने की कोशिस करे

    उत्तर देंहटाएं
  5. मनोज जी तकनीकी पर जानकारी देने की कोशिस करे

    उत्तर देंहटाएं
  6. शानदार जानकारी के धन्यबाद मनोज जी

    उत्तर देंहटाएं
  7. manoj ji धन्यबाद,आप तकनीकी पर और अधिक लिखे

    उत्तर देंहटाएं
  8. Vary nice post ji
    :
    thanks manoj sir ji
    hame ish post ke jariy bahut jankari hashil hui hai
    aap Mahan ho manoj sir ji
    :
    dhanyawad manoj ji

    उत्तर देंहटाएं
  9. Vary nice post ji
    :
    thanks manoj sir ji
    hame ish post ke jariy bahut jankari hashil hui hai
    aap Mahan ho manoj sir ji
    :
    dhanyawad manoj ji

    उत्तर देंहटाएं
  10. Yo Yo Kúñdàn singh
    www.facebook.com/yooyookundan.singh
    :
    Vary nice post
    :
    thanks manoj sir ji
    hame ish post ke jariy bahut jankari hashil hui hai
    aap Mahan ho manoj sir ji
    :
    dhanyawad manoj ji

    उत्तर देंहटाएं