Chrome အတွက်ခြစ်ခြင်း extension ကိုတွင် Semalt လမ်းညွှန်

မည်သည့်စီးပွားရေးလုပ်ငန်းကိုမဆိုရှင်သန်ရန်နှင့်နောက်ဆုံးတွင်ကြီးထွားရန်အတွက်၎င်း၏ပြိုင်ဘက်များနှင့်အမျိုးမျိုးသောစွန့်စားမှုများရှေ့တွင်ဆက်လက်ရပ်တည်ရန်လိုအပ်သည်။ ခွဲခြမ်းစိတ်ဖြာမှုဆိုင်ရာအချက်အလက်များအပေါ် အခြေခံ၍ ဆုံးဖြတ်ချက်ချခြင်းသည်ဤပြproblemsနာများကိုမေ့ပျောက်ရန်သေချာသည့်နည်းလမ်းဖြစ်သည်။ ထိုသို့သောအချက်အလက်များကိုဖျက်သိမ်းခြင်းမှရရှိနိုင်သည်။ လွယ်ကူသောအဘယ်မှာရှိကြောင်းဖွင့် ခြစ် extension ကို Chrome အတွက်လာ: က data တွေကိုရိတ်သိမ်း၏လုပ်ငန်းစဉ်လွယ်ကူချောမွေ့ဒါပေမယ့်လည်းရှုပ်ထွေး Setup မပါဘဲသွားလာရင်းခြစ်ဖို့ကဖြစ်နိုင်ခြေစေမည်သာ။

Scraper အသုံးပြုနည်း

    ၁။ ပထမဆုံးလုပ်ရမှာက extension ကိုတပ်ဆင်ရန်ဖြစ်သည်။ ထို့ကြောင့် chrome web store သို့သွားပြီး "scraper" ကိုရှာပြီး add ကိုနှိပ်ပါ။

    ၂။ သင်မှ ဒေတာများကိုဖယ်ရှားရန် သင်ရည်ရွယ်သောဝက်ဘ်ဆိုက်သို့သွားပါ၊ ၎င်းကိုမီးမောင်းထိုးပြခြင်းဖြင့်သင်စိတ်ဝင်စားသောမှတ်စုကိုမှတ်သားပါ။ အဲဒါကိုညာဖက်နှိပ်ပြီးပေါ်လာတဲ့ menu ထဲက "scrape similar" ကို select လုပ်ပါ။

    ၃။ ဤသို့ပြုလုပ်ခြင်းဖြင့်သီးခြားခြစ်စက် console window ကိုစတင်လိမ့်မည်။ ဤတွင်သင်သည် ခြစ်ထားသောအချက်အလက်များ၏ စာရင်းကိုတွေ့လိမ့်မည်။

    ၄။ အကြောင်းအရာများကိုသိမ်းဆည်းရန် "ဂူဂဲလ်မှတ်တမ်းများသို့သိမ်းဆည်းရန်" ကိုနှိပ်ပါ၊ ၎င်းသည်အချက်အလက်များကို Google spreadsheet သို့အလိုအလျောက်တင်ပို့လိမ့်မည်။

တိုးချဲ့ခြစ်

သင်ပိုမိုသောအချက်အလက်များကိုခြစ်ရန်စီစဉ်နေပါကအဆင့်မြင့်ချဉ်းကပ်မှုကိုသင်အသုံးပြုနိုင်သည်။ သတိပြုပါ၊ အကယ်၍ သင့်တွင် HTML နှင့်ပတ်သက်သောဗဟုသုတအနည်းငယ်ရှိပါက၎င်းကိုအသုံးပြုရန်ပိုမိုလွယ်ကူလိမ့်မည်။ အချိန်ကုန်စီးရီးအချက်အလက်ပေါ်အခြေခံပြီးမော်ကွန်းတင်ထားတဲ့အရင်းအမြစ်တစ်ခုမှအချက်အလက်များကိုသင်ဖျက်ချင်သည်ဆိုပါစို့။ ထိုကဲ့သို့သောအခြေအနေမျိုးတွင်အထက်တွင်ဖော်ပြထားသောနည်းလမ်းကိုသင်စမ်းကြည့်ပါကအချက်အလက်များကိုရရှိလိမ့်မည်။

ဤပြissueနာကိုဖြေရှင်းရန် XPath ဟုလူသိများသော HTML နှင့် XML query language ကိုသုံးနိုင်သည်။ ဘာလုပ်လဲ XPath သည်ရွေးချယ်မှုတစ်ခုစီတွင်ပါ ၀ င်သောကွဲပြားသောဒြပ်စင်များနှင့်ပတ်သက်သောအချက်အလက်များကိုအသိအမှတ်ပြုသည် ဒီဟာကဘယ်လိုသွားရမလဲဆိုတဲ့လမ်းညွှန်ဖြစ်တယ်။

၁။ Scraper console သို့သွားပါ။ ဘယ်ဘက်အပေါ်ဘက်တွင် "XPath" ခလုတ်ကိုသတိပြုမိပြီး၊ ၎င်းပေါ်တွင် နှိပ်၍ ကန ဦး ဇယားကိုစုစည်းပါ။

၂။ XPath ကိုမှန်ကန်သော element အတွက်ရေးရန်လိုအပ်သည်။ သတင်းအချက်အလက်တစ်ခုလုံးပါ ၀ င်သောလက်ရှိ XPath ကို "// div [3] / div [3] / div [2] / div" ပုံစံဖြင့်ပြလိမ့်မည်။ <div> element တွေကို HTML document မှာကွန်ပျူတာကအသိအမှတ်ပြုလိမ့်မယ်။

၃။ အသိအမှတ်ပြုထားသောအချက်အလက်များကိုခွဲခြားရန် Scraper ကော်လံကိုအသုံးပြုရမည်။ အဲဒီလိုလုပ်ဖို့၊ သင်ရရှိနိုင်တဲ့သတင်းအချက်အလက်အမျိုးမျိုးကိုရှာဖွေဖို့လိုတယ်။ သင်ခြစ်နေသောအချက်အလက်ပေါ် မူတည်၍ သင့်တွင်ခေါင်းစဉ်ရှိနိုင်သည်။ ဤခေါင်းစဉ်ဒေတာအမှုအမျိုးမျိုးရှိသမျှအစုဘေးတွင်ပစ္စုပ္ပန်ဖြစ်ကြသည်။ သူတို့က tag၊ လိုက်ပါလာရင် <b> tag နဲ့လိုက်ပါလာကြတယ်။

4. Inspect element ကို အသုံးပြု၍ <b> tag ကိုသင့် XPath ထဲသို့ထည့်ပါ။ ယခုသင်ပထမ ဦး ဆုံးကော်လံကို“ title column” အဖြစ်သတ်မှတ်နိုင်သည်။ သင်လိုအပ်သည့်ကော်လံတစ်ခုစီအတွက်ကွဲပြားခြားနားသော XPaths ကိုဆက်လက်ဖန်တီးပါ။

Scratch ကိုနှိပ်လိုက်ပါ။ တိုးချဲ့မှုသည်အချက်အလက်များကိုအလိုအလျောက်စုဆောင်းပေးပြီးသင်သတ်မှတ်ထားသောကော်လံအမျိုးမျိုးသို့စုစည်းပေးလိမ့်မည်။