經過一段時間的開發,爬山虎采集器V3 (Chromium內核)終于發布測試版本。新版本相比之前版本更加穩定、快速,主要功能改動如下:
- 瀏覽器更換為Chromium內核
- 增加任務查找功能
- 增加備份全部任務、導入備份功能,方便遷移
- 完全兼容之前版本的規則
軟件下載:V3下載地址
2020/7/30 更新
- 修改為AnyCpu模式 ,支持64位
- 優化列表識別
- 修復部分bug
2020/6/10 更新
- 優化腳本錄制
- 腳本命令的重試
- 點擊命令加入模擬
- 輸入命令增加回車選項
- 深入采集時加入refer參數
- 修復部分bug
2020/5/29 更新
- 優化列表識別
- 優化腳本命令
- 輸入命令支持輸入回車
- 修復部分bug
2020/4/2 更新
- 修復長時間采集內存溢出問題
- 采集詳情頁面的速度提高一倍
2020/4/9 更新
- 修復安裝時的一些問題
- 修復運行任務時的焦點丟失問題
- 修復一些其他小問題
2020/4/24 更新
- 增加運行歷史記錄
- 優化分頁識別算法
- 當導出txt、csv時已經存在文件,則追加內容
- 豐富采集日志(增加采集數量)
- 優化日志刷新
- 自定義數據 當前網址支持post數據
2020/5/1 更新
- 解決部分網站長時間采集異常退出問題
- 優化分頁識別算法
- 修復部分網站cookie無效問題
- 修復部分系統sqlite無法使用問題
2020/5/8 更新
- 修復驗證碼檢測bug
- 修復iframe的相關問題
2020/5/18 更新
- 修復異常退出問題
- 在導出文件界面加入"追加模式" 選項,支持excel
2020/5/23 更新
- 優化列表識別
- 支持mysql8.0默認驗證算法
使用Chromium內核的優勢:
- 采集速度更快
- 可以解決之前一些網站長時間采集卡死問題
- 解決部分網站的反爬蟲技術(攜程、美團點評等網站)
老版本升級注意:
- 可直接把原來版本的任務復制到新版本目錄,V2的任務目錄
D:\Program Files (x86)\PashanhuV3\tasks
,V3目錄D:\Program Files (x86)\PashanhuV3\tasks
- 配置文件
Settings.xml
和ExportSettings.xml
也可以直接復制過去