मजेदार दुनियाँ: 21 साल के हुए सर्च इंजन

मनोज जैसवाल : इंटरनेट सर्च इंजनों के 21 साल पूरे होने के बाद आज गूगल, बिंग और याहू जैसे दिग्गज सर्च इंजनों की व्यापकता को देखकर ऐसा लगता है जैसे उन्होंने जीवन के लगभग हर पहलू को ‘खोज योग्य’ बना दिया है, लेकिन इतने लंबे और बड़े सफर के बाद भी वेब सर्च को ज्यादा से ज्यादा सटीक और उपयोगी बनाने की होड़ खत्म नहीं हुई है। जब-तब कोई न कोई नवीनता भरा प्रयोग कर वे अपने यूजर्स को चौंकाने का मौका तलाश ही लेते हैं। गूगल के ‘इंस्टेंट’ सर्च फीचर के साथ-साथ इन दिनों जो खासी चर्चा में है वह है ‘सोशल सर्च।
गूगल ने हाल ही में एक ‘सोशल सर्च’ कंपनी आर्डवार्क का अधिग्रहण किया था। अब उसने अपनी खोज सेवाओं में ‘सोशल सर्च’ को भी शामिल कर लिया है। उधर माइक्रोसॉफ्ट के ‘बिंग’ से लेकर सोशल नेटवर्किंग साइट ‘फेसबुक’ और ‘ट्विटर’ ने भी ‘सोशल सर्च’ के क्षेत्र में प्रवेश किया है। इस नई श्रेणी की सर्च सुविधा की जरूरत क्यों पड़ी? आप जानते हैं कि सभी प्रमुख सर्च इंजनों के खोज परिणाम स्वचालित एल्गोरिद्म (कंप्यूटरीय गणनाओं के फार्मूले) के आधार पर दिखाए जाते हैं।
इन परिणामों का प्रासंगिक और सटीक होना इन्हीं गणनाओं पर आधारित होता है। उन्हें महत्व के लिहाज से किस क्रम में दिखाया जाए, वह भी कंप्यूटर ही तय करता है। हालांकि ‘पेज रैंक’ और ‘लिंक लोकप्रियता’ जैसी अवधारणाओं के प्रयोग ने इन नतीजों को बेहतर बनाया है, लेकिन फिर भी ‘मशीनी’ फैसलों की अपनी सीमाएं होती हैं। वे इंसानों की पसंद-नापसंद और प्राथमिकताओं से मेल करेंगे, इस बात की कोई गारंटी नहीं है।
दूसरी तरफ सोशल सर्च ‘मानवीय पसंद-नापसंद’ को ध्यान में रखते हुए परिणाम दिखाती है, इसीलिए वे अधिक स्वाभाविक और अनुकूल महसूस होते हैं। इसका प्रयोग करने वाले अलग-अलग व्यक्तियों को अलग-अलग नतीजे दिखाई देंगे, भले ही कीवर्ड समान हो।
सोशल सर्च में इस बात का पता लगाया जाता है कि क्या आपकी दिलचस्पी वाले मुद्दों पर आपके सामाजिक दायरे में रहने वाले अन्य लोगों ने भी कभी सर्च किया है या फिर फेसबुक, ट्विटर, ब्लॉग या किसी अन्य माध्यम पर उनसे जुड़ी टिप्पणी की है? यदि हां, तो शायद वे आपके लिए भी उपयोगी होंगे क्योंकि आपके परिचय-क्षेत्र में किसी ने उन्हें ‘पसंद’ किया है। दूसरे, इस बात के काफी आसार हैं कि समान सामाजिक परिवेश से आने वाले लोगों को एक जैसी सूचनाओं की जरूरत हो।

परिणाम कहां-कहां से!
गूगल सोशल सर्च में ट्विटर, गूगल प्रोफाइल, ब्लॉगों, फ्लिकर, फ्रेंड्सफीड, पिकासा, यू-ट्यूब आदि की सामग्री शामिल की जाती है, लेकिन वही सामग्री जिसका आपके सामाजिक दायरे के लोगों ने प्रयोग या जिक्र किया हो। यदि आप हिन्दी पत्रकारिता पर सामग्री ढूंढ रहे हैं तो हो सकता है कि आपके किसी मित्र के ब्लॉग का लेख सबसे ऊपर देखकर आप चौंक जाएं।
सामान्य सर्च में शायद वही लेख दो सौवें पेज तक भी नहीं मिलेगा, लेकिन सोशल सर्च आपकी जरूरतों का इंसानी लिहाज से आकलन करती है। इस लेख की उपयोगिता अन्य लोगों के लिए भले ही बिल्कुल न हो, आपके लिए जरूर है क्योंकि आप लेखक के मित्र हैं और उसकी रचना को पढ़ना चाहेंगे।
फर्ज कीजिए कि आप जापान के बारे में चित्र तलाश रहे हैं। आपके लिए कितना सुखद आश्चर्य होगा यदि सर्च नतीजों में पहले नंबर पर आपके किसी मित्र की जापान यात्रा के दौरान लिए गए चित्र दिखाई दें, जो उन्होंने कभी फ्लिकर या पिकासा जैसी इमेज साइटों पर डाले थे! अगर आप उन्हें इस्तेमाल करना भी चाहें तो मित्र से अनुमति लेने में कोई परेशानी नहीं आएगी, बनिस्पत किसी अन्य फोटोग्राफर के ‘कापीराइट-युक्त’ फोटोग्राफ के।
आप शेक्सपियर पर रिसर्च कर रहे हैं और इंटरनेट सर्च के दौरान यह देखकर खुशी के मारे उछल पड़ते हैं कि आपके गाइड के वरिष्ठ मित्र ने शेक्सपियर के बारे में किसी ‘कमाल के लेख’ का जिक्र अपने फेसबुक पेज में किया है।
आपने लिंक क्लिक किया और लेख हाजिर! सोशल सर्च न होती तो शायद आप कभी अपने गाइड के उन वरिष्ठ मित्र तक न पहुंच पाते। चूंकि वे भी उच्च शिक्षा के क्षेत्र में हैं, इसलिए उनकी पसंद का लेख आपके लिए भी उपयोगी होगा ही, यह मानकर चला जा सकता है! सोशल सर्च इसी तरह हर व्यक्ति की अलग-अलग जरूरतों, परिवेश, पसंद-नापसंद और सर्च नतीजों की अनुकूलता को ध्यान में रखकर परिणाम दिखाती है।
खोज का आधार क्या?
आपके मन में यह सवाल उठना स्वाभाविक है कि गूगल या दूसरे सोशल सर्च इंजन आपके मित्रों, रिश्तेदारों और परिचितों की सामग्री तक कैसे पहुंचते हैं? और यदि वे दुनिया के हर इंसान के लिए इतनी मेहनत कर रहे हैं तो उनके कुल नतीजों का भंडार कितना बड़ा होगा! अगर आप गूगल समूह की किसी भी वेबसाइट (जीमेल, ब्लॉगर, यू-ट्यूब, गूगल-डॉक्स आदि) के सदस्य हैं तो उसे आपकी पसंद-नापसंद या गतिविधियों की कुछ न कुछ जानकारी जरूर है।
इस आधार पर वह आपके ब्लॉगों में टिप्पणियां करने वाले मित्रों, ट्विटर में आपके फॉलोवर्स या जिन्हें आप फॉलो करते हैं, उन सबको खोजने में सक्षम है। यही नहीं, वह आपके मित्रों के मित्रों और परिचितों को भी अपने दायरे में लेता है। इन सबको मिलाकर आपका ‘सोशल ग्राफ’ (गूगल इसे ‘सोशल सर्कल’ कहता है) तैयार होता है - एक तरह से आपका अपना मित्र-समाज जो आपकी उम्मीदों से कहीं बड़ा हो सकता है। वजह? अगर आप ट्विटर में पच्चीस लोगों को फॉलो करते हैं और वे पच्चीस लोग अलग-अलग पच्चीस लोगों को फॉलो करते हैं तो आपके सोशल सर्किल में वे भी शामिल होंगे।
सोशल सर्च में परिणाम दिखाने से पहले आपके सोशल ग्राफ के दायरे में आने वाले लोगों से जुड़े कंटेंट (सामग्री) को खोजा जाता है और नतीजे सामान्य सर्च के साथ ‘सर्च रिजल्ट्स फ्रॉम पीपल इन योर सोशल सर्कल’ शीर्षक के साथ अलग से दिखाए जाते हैं। आपके सोशल ग्राफ में कुछ अन्य लोग भी शामिल हैं, जैसे - फ्रेंड्सफीड नामक वेबसाइट में आपके मित्र, गूगल-टॉक की चैट-सूची के मित्र, गूगल कॉन्टेक्ट्स में दिए गए मित्र, सहकर्मी और रिश्तेदार।
अगर आप जानना चाहते हैं कि आपका सोशल सर्कल कितना बड़ा है, तो देखें- ’google.com/s2/search/social. गूगल सोशल सर्च को पूर्णता तक ले जाने के लिए उसका फेसबुक और लिंक्ड-इन के साथ जुड़ना जरूरी है, जो आज नहीं तो कल हो ही जाएगा। फेसबुक ने अपने सर्च नतीजों को वेबसाइटों से जोड़ने के लिए एक विशेष सुविधा ‘ओपन ग्राफ प्रोटोकॉल’ सार्वजनिक रूप से उपलब्ध कराई है जिसका इस्तेमाल करने को कोई भी वेबसाइट स्वतंत्र है। अगर गूगल चाहे तो इसे आजमा सकता है।
गूगल पर सोशल सर्च के लिए अलग से कोई वेब एड्रेस डालने की जरूरत नहीं है। सामान्य सर्च के नतीजों के बीच में ही सोशल सर्च के परिणाम अलग से दिखाए जाते हैं, लेकिन इस सुविधा का प्रयोग करने के लिए आपका गूगल पर ‘साइन इन’ करना (यूज़रनेम और पासवर्ड डालकर साइट खोलना) जरूरी है।
यह भी संभव है कि आपके सामाजिक दायरे में आने वाले लोगों ने इच्छित कीवर्ड से जुड़ी कोई सामग्री इंटरनेट पर नहीं डाली है। कुछ लोग अपनी सोशल नेटवर्किंग साइटों का कुछ हिस्सा ‘प्राइवेट’ रखते हैं। उसके नतीजे सोशल सर्च में नहीं दिखते। अगर आपके प्रोफाइल की भाषा ‘यूएस-इंग्लिश’ है, तो शायद आपको अधिक नतीजे दिखाई दें।
दूसरे भी पीछे नहीं
माइक्रोसॉफ्ट की सोशल सर्च सुविधा आजमाने के लिए bing.com/social पर जाएं। यह सोशल नेटवर्किंग साइटों पर साझा किए गए लिंक्स और ट्विटर के नतीजे दिखाता है। यहां कोई कीवर्ड डालने पर ऐसे तीन लोगों से जुड़े लिंक भी सुझाए जाते हैं जो उस विषय पर गहरी जानकारी रखते हैं। अगर आप उस विषय में ज्यादा दिलचस्पी रखते हैं तो आप बिंग के सुझाए लोगों को ट्विटर पर ‘फॉलो’ कर उनके संपर्क में रह सकते हैं।
बिंग सोशल आपको अपनी रुचि के अनुकूल दिलचस्प लोगों से जोड़ता है। इंटरनेट सर्च में इस तरह का सामाजिक पहलू पहले कहां था? फेसबुक ने पिछले अप्रैल माह में अपना ‘ओपन ग्राफ प्रोटोकॉल’ जारी किया था। आपने देखा होगा कि कुछ समय पहले इस वेबसाइट पर ‘लाइक’ और ‘रिकमेंड’ नामक लिंक्स की शुरुआत हुई थी जिन्हें दबाकर आप किसी भी व्यक्ति, टिप्पणी, लिंक, चित्र आदि के बारे में अपनी दिलचस्पी का इजहार कर सकते थे।
21 साल के हुए सर्च इंजन
सर्च इंजनों के इस्तेमाल को 21 साल हो गए हैं। पहला इंटरनेट सर्च इंजन ‘आर्ची’ था जिसे 1990 में एलन एमटेज नामक छात्र ने विकसित किया था। आर्ची के आगमन के समय ‘विश्व व्यापी वेब’ का नामो-निशान भी नहीं था। चूंकि उस समय वेब पेज जैसी कोई चीज नहीं थी, इसलिए आर्ची एफटीपी सर्वरों में मौजूद सामग्री को इन्डेक्स कर उसकी सूची उपलब्ध कराता था।
‘आर्ची’ इसी नाम वाली प्रसिद्ध कॉमिक स्ट्रिप से कोई संबंध नहीं है। यह नाम अंग्रेजी के ‘आर्काइव’ शब्द से लिया गया था, जिसका अर्थ है क्रमानुसार सहेजी हुई सूचनाएं। आर्ची के बाद मार्क मैककैहिल का ‘गोफर’ (1991), ‘वेरोनिका’ और ‘जगहेड’ आए। 1997 में आया ‘गूगल’ जो सबसे सफल और सबसे विशाल सर्च इंजन माना जाता है। ‘याहू’ ‘बिंग’ (पिछला नाम एमएसएन सर्च), एक्साइट, लाइकोस, अल्टा विस्टा, गो, इंकटोमी आदि सर्च इंजन भी बहुत प्रसिद्ध हैं। भारत में ‘रीडिफ’ ‘गुरुजी’ और ‘रफ्तार’ अच्छे सर्च इंजन हैं।
इंटरनेट पर खोज के लिए दो तरह की वेबसाइटें उपलब्ध हैं - डायरेक्टरी या निर्देशिका और सर्च इंजन। दोनों के काम करने के तरीके अलग-अलग हैं। डायरेक्टरी यलो पेजेज की तरह है। जिस तरह यलो पेजेज में अलग-अलग कंपनियों, फर्मो आदि से संबंधित सूचनाओं को श्रेणियों और सूचियों में बांटकर रखा जाता है, उसी तरह निर्देशिकाओं में भी श्रेणियां होती हैं।
शिक्षा, विज्ञान, कला, भूगोल आदि ऐसी ही श्रेणियां हैं। इन्हें आगे भी उप श्रेणियों में विभक्त किया जाता है। याहू डायरेक्टरी (dir.yahoo.com), डीमोज (dmoz.com) आदि ऐसी ही निर्देशिकाएं हैं। इनमें हम श्रेणियों, उप श्रेणियों से होते हुए संबंधित जानकारी तक पहुंचते हैं। चूंकि निर्देशिकाओं के बंधक खुद इन श्रेणियों और सूचियों को संपादित करते रहते हैं, इसलिए इनमें अनावश्यक सामग्री मिलने की आशंका कम होती है। इनमें प्राय: बहुत देखभाल कर उन्हीं वेबसाइटों की सामग्री ली जाती है जो वहां विधिवत पंजीकृत होती हैं।
निर्देशिका के विपरीत, सर्च इंजनों का काम स्वचालित ढंग से होता है। इनके सॉफ्टवेयर टूल जिन्हें ‘वेब क्रॉलर’ ‘स्पाइडर’ ‘रोबोट’ या ‘बोट’ कहा जाता है, इंटरनेट पर मौजूद वेब पेजों की खोजबीन करता रहता है। ये क्रॉलर वेबसाइटों में दिए गए लिंक्स के जरिए एक से दूसरे पेज पर पहुंचते रहते हैं और जब भी कोई नई सामग्री मिलती है, उससे संबंधित जानकारी अपने सर्च इंजन में डाल देते हैं।

जिन वेबसाइटों में निरंतर सामग्री डाली जाती है (जैसे समाचार वेबसाइटें), उनमें ये बार-बार आते हैं। इस तरह उनकी सूचनाएं लगातार ताजा होती रहती हैं। लेकिन चूंकि ज्यादातर काम मशीनी ढंग से होता है, इसलिए सर्च इंजनों में कई अनावश्यक वेबपेज भी शामिल हो जाते हैं। इसलिए सर्च नतीजों को निखारने की क्रिया लगातार चलती है।