सेमल्ट: गूगल क्रोम प्लगइन के साथ वेब डेटा एक्सट्रैक्शन

यदि आप नेट पर सर्फिंग के लिए Google क्रोम ब्राउज़र का उपयोग कर रहे हैं, तो आपके पसंदीदा वेब पेजों से डेटा निकालने के लिए एक ब्राउज़र प्लगइन है। Google Chrome स्क्रैपर एक सॉफ्टवेयर है जिसका उपयोग डायनामिक और स्टैटिक वेबसाइट दोनों से डेटा प्राप्त करने के लिए किया जाता है। यह Chrome प्लगइन आपको अपनी पसंदीदा वेब पेज सामग्री को परिमार्जन करने और Google डॉक्स में सहेजने की अनुमति देगा।

Google Chrome वेब स्क्रैपर

Google Chrome वेब स्क्रैपर एक ब्राउज़र एक्सटेंशन है जो साइटों और पृष्ठों का डेटा निकालता है। इस एक्सटेंशन के साथ, आपको पूरे दिन साइटों से सामग्री को कॉपी-पेस्ट करने के लिए सैकड़ों श्रमिकों की आवश्यकता नहीं है। अपने क्रोम ब्राउज़र पर इंस्टॉल होने के बाद, आपको केवल लक्ष्य-सामग्री का चयन करना है और वेब स्क्रैपर को बाकी काम करने देना है।

यदि आपके पास कोई कोडिंग ज्ञान नहीं है, तो यह विचार करने के लिए सबसे अच्छा वेब स्क्रैपर है। Google Chrome स्क्रैपर को छोटे और बड़े पैमाने पर दोनों तरह के स्क्रैपिंग के लिए अनुशंसित किया जाता है। इसमें बहुमूल्य जानकारी और डेटा शामिल हैं जिन्हें प्रतिस्पर्धी खुफिया डेटा में बदल दिया जा सकता है। इस एक्सटेंशन के साथ, आपके सभी लक्ष्य-चित्र और निर्देशिका आसानी से CouchDB या स्प्रेडशीट में निकाले और निर्यात किए जा सकते हैं।

आरंभ करने का तरीका बताता है

ब्राउज़र प्लगइन के साथ वेब पेजों को स्क्रैप करना एक ऐसा काम है जो आप अपने पीसी के साथ जल्दी से कर सकते हैं। यहाँ एक अंतिम गाइड है जो आपको आरंभ करने में मदद करेगा:

  • अपना Google Chrome ब्राउज़र प्रारंभ करें और "Chrome वेब स्टोर" पर क्लिक करें।
  • अपने ब्राउज़र एक्सटेंशन खोलें और "स्क्रैपर" खोजें।
  • अपनी स्क्रीन पर प्रदर्शित "एड टू क्रोम" विकल्प पर क्लिक करें
  • स्क्रैप किए जाने के लिए वेबसाइट या वेब पेज खोलें और उस डेटा को हाइलाइट करें जिसे आपको प्राप्त करने की आवश्यकता है। तत्व को राइट-क्लिक करें और "समान स्क्रैप करें" पर क्लिक करें।
  • आपकी स्क्रीन पर एक स्क्रैपर कंसोल दिखाई देगा। ध्यान दें कि वेब स्क्रैपर कंसोल में निकाले गए डेटा शामिल हैं।
  • इस स्तर पर, आप यह तय कर सकते हैं कि अपनी बिखरी हुई सामग्री को कहाँ सहेजना है। उदाहरण के लिए, आप "Google डॉक्स में सहेजें" पर क्लिक करके सामग्री को Google डॉक्स पर सहेज सकते हैं।

ध्यान दें कि "स्क्रैपर" एक स्वचालित स्क्रिप्ट है जो डायनेमिक वेब पेज और साइट्स से उपयोगी डेटा निकालती है। अन्य वेब स्क्रैपिंग टूल के विपरीत, वेब स्क्रैपर Google क्रोम जावास्क्रिप्ट के साथ उत्पन्न डेटा को भी परिमार्जन कर सकता है। क्रोम स्क्रैपर प्लगइन द्वारा निष्पादित अन्य कार्यों में शामिल हैं:

  • डेटा लोड करने के लिए सामग्री बटन पर क्लिक करना;
  • पेजेशन बटन पर क्लिक करना जो AJAX का उपयोग करके जानकारी लोड करता है;
  • अधिक सामग्री लोड करने के लिए वेब पृष्ठों को नीचे स्क्रॉल करना;
  • किसी वेब पेज में डायनामिक कंटेंट के लोड होने की प्रतीक्षा करना;

एक वेब पेज से डेटा को स्क्रैप करने के बाद, आप डेटा को कोमा से अलग किए गए मान (CSV) प्रारूप में डाउनलोड कर सकते हैं या इसे CouchDB में स्टोर कर सकते हैं। Google Chrome वेब स्क्रैपर के साथ, आपको डेटा निष्कर्षण, योजना निर्माण, या निर्यात पर काम नहीं करना है।