后羿采集器官方版是提供網(wǎng)頁數(shù)據(jù)采集的應(yīng)用工具,功能十分強(qiáng)大,界面設(shè)計(jì)也比較簡單。提供豐富的采集功能,可以只需輸入網(wǎng)址就能智能識別數(shù)據(jù),還支持多種數(shù)據(jù)導(dǎo)出方式,更支持全操作系統(tǒng),無縫切換,操作簡單又便捷。
后羿采集器是杭州快憶科技有限公司旗下的一款采集軟件,本產(chǎn)品由前谷歌搜索技術(shù)團(tuán)隊(duì)基于人工智能技術(shù)研發(fā),功能強(qiáng)大,操作簡單,可謂是居家旅行隨身神器。
1、功能強(qiáng)大,提供企業(yè)級服務(wù)
后羿采集器提供豐富的采集功能,無論是采集穩(wěn)定性或是采集效率,都能夠滿足個(gè)人、團(tuán)隊(duì)和企業(yè)級采集需求。
豐富的功能: 定時(shí)采集,自動導(dǎo)出,文件下載,加速引擎,按組啟動和導(dǎo)出,Webhook,RESTful API,智能識別SKU和大圖等。
2、智能識別數(shù)據(jù),小白神器
自動識別:列表、表格、鏈接、圖片、價(jià)格等
智能模式:基于人工智能算法,只需輸入網(wǎng)址就能智能識別列表數(shù)據(jù)、表格數(shù)據(jù)和分頁按鈕,不需要配置任何采集規(guī)則,一鍵采集。
3、可視化點(diǎn)擊,簡單上手
流程圖模式:只需根據(jù)軟件提示在頁面中進(jìn)行點(diǎn)擊操作,完全符合人為瀏覽網(wǎng)頁的思維方式,簡單幾步即可生成復(fù)雜的采集規(guī)則,結(jié)合智能識別算法,任何網(wǎng)頁的數(shù)據(jù)都能輕松采集。
可模擬操作: 輸入文本、點(diǎn)擊、移動鼠標(biāo)、下拉框、滾動頁面、等待加載、循環(huán)操作和判斷條件等。
4、云端賬號,方便快捷
創(chuàng)建后羿采集器賬號并登錄,您的所有采集任務(wù)設(shè)置都將自動加密保存到后羿的云端服務(wù)器,無需擔(dān)心采集任務(wù)丟失,任務(wù)運(yùn)行及采集的數(shù)據(jù)均在您本地,而且非常安全,只有您自己在本地登錄客戶端后才能查看。后羿采集器對賬號沒有終端綁定限制,您切換終端時(shí)采集任務(wù)也會同步更新,任務(wù)管理方便快捷。
5、全平臺支持,無縫切換
同時(shí)支持Windows、Mac和Linux全操作系統(tǒng)的采集軟件,各平臺版本完全相同,無縫切換。
6、支持多種數(shù)據(jù)導(dǎo)出方式
采集結(jié)果可以導(dǎo)出到本地,支持TXT、excel、CSV和HTML文件格式,也可以直接發(fā)布到數(shù)據(jù)庫(mysql、MongoDB、sql server、PostgreSQL)供您使用。
1、在極光下載站下載后羿采集器安裝包并解壓,找到安裝程序雙擊安裝
2、閱讀并同意許可協(xié)議,點(diǎn)擊下一步
3、選擇安裝存儲位置,點(diǎn)擊安裝
4、等待安裝,安裝完成即可打開使用
步驟1:創(chuàng)建采集任務(wù)
1-啟動后羿采集器,進(jìn)入主界面,點(diǎn)擊創(chuàng)建任務(wù)按鈕創(chuàng)建 &向?qū)Р杉蝿?wù)&
2-輸入百度搜索的URL,包括三種方式
1、手動輸入:在輸入框中直接輸入U(xiǎn)RL,多個(gè)URL時(shí)須要換行分割
2、點(diǎn)擊從文件中讀取方式:用戶選擇一個(gè)存放URL的文件,文件中可以有多個(gè)URL地址,地址須要換行分割。
3、批量添加方式:通過添加并調(diào)整地址參數(shù)生成多個(gè)有規(guī)律的地址
步驟2:定制采集過程
1-點(diǎn)擊創(chuàng)建后自動打開第一個(gè)URL進(jìn)而進(jìn)入向?qū)гO(shè)置,此處選擇列表頁,點(diǎn)擊下一步
2-填寫搜索關(guān)鍵字和選擇輸入關(guān)鍵字的輸入框,點(diǎn)擊下一步。進(jìn)入第一個(gè)關(guān)鍵字搜索結(jié)果頁面后,點(diǎn)擊設(shè)置搜索按鈕,點(diǎn)擊下一步
3-點(diǎn)選列表塊中第一塊元素。再點(diǎn)擊結(jié)果列表塊中另外一塊元素,此時(shí)自動選中列表塊。點(diǎn)擊下一步
4-選擇下一頁按鈕,選中選擇下一頁選項(xiàng),然后點(diǎn)擊頁面中的下一頁按鈕填充第一個(gè)輸入框,第二個(gè)數(shù)據(jù)框可以調(diào)節(jié)采集運(yùn)行中點(diǎn)擊下一頁按鈕的次數(shù)。理論上次數(shù)越多,采集到的數(shù)據(jù)越多。點(diǎn)擊下一步
5-選擇要采集的字段:在焦點(diǎn)框中點(diǎn)選要抽取的元素后點(diǎn)擊下一步。選擇不進(jìn)入詳情頁。點(diǎn)擊保存或保存并運(yùn)行
步驟3:數(shù)據(jù)采集及導(dǎo)出
1-采集任務(wù)運(yùn)行中。采集完成后,選擇“導(dǎo)出數(shù)據(jù)”可以把數(shù)據(jù)都導(dǎo)出到本地文件
2-選擇“導(dǎo)出方式”,將采集好的數(shù)據(jù)導(dǎo)出,這里可以選擇excel作為導(dǎo)出為格式
3-采集數(shù)據(jù)導(dǎo)出
網(wǎng)友評論