正文
文章最后更新时间2021年11月27日,若文章内容或图片失效,请留言反馈!

特别功能

  1. 多任务可视化采集

  2. 采集量图表统计,历史采集状况一看便知

  3. 支持文章评论采集(仅第一页评论)

  4. 支持大多数主题、插件数据采集(任意数据表入库)

  5. 第三方触发自动采集

  6. 多标签页,多线程采集

  7. 文章伪原创(5118、百度翻译)

 

本插件一些规则配置方面,参考了火车头软件

 

免责申明

因为本插件属于“蜘蛛”性质,采集网站请遵守对方的robots.txt规则。如有违反,相应的法律责任由使用者自行承担。

插件使用教程

网站采集神器用户手册

插件截图

插件首页

zblog—网站采集神器,网站采集神器,zblog,第1张,采集,第1张

任务概况

zblog—网站采集神器,网站采集神器,zblog,第2张,采集,第2张

正在采集

zblog—网站采集神器,网站采集神器,zblog,第3张,采集,第3张

未采集到内容

zblog—网站采集神器,网站采集神器,zblog,第4张,采集,第4张

任务规则-第一步(链接采集)

zblog—网站采集神器,网站采集神器,zblog,第5张,采集,第5张

任务规则-第一步(添加有规则的网址)

zblog—网站采集神器,网站采集神器,zblog,第6张,采集,第6张

任务规则-第一步(链接采集预览)

zblog—网站采集神器,网站采集神器,zblog,第7张,采集,第7张

任务规则-第二步(添加内容采集)

zblog—网站采集神器,网站采集神器,zblog,第8张,采集,第8张

任务规则-第二步(测试内容采集)

zblog—网站采集神器,网站采集神器,zblog,第9张,采集,第9张

任务规则-第三步(设置发布规则)

zblog—网站采集神器,网站采集神器,zblog,第10张,采集,第10张

任务规则-第三步(设置自定义内容)

zblog—网站采集神器,网站采集神器,zblog,第11张,采集,第11张

任务规则-第四步(任务杂项配置)

zblog—网站采集神器,网站采集神器,zblog,第12张,采集,第12张

公共配置

zblog—网站采集神器,网站采集神器,zblog,第13张,采集,第13张

入库模块配置

本采集插件正常情况下仅支持单个数据表入库,要同时入库多个表,需要定制入库模块。

什么情况下需要入库模块?比如文章评论,采集到的评论,入库时和文章不在同一个数据表,这时候就要单独的一个入库规则来实现评论发布;或者是需要处理一些其它数据

目前插件已附加两个入库模块

zblog—网站采集神器,网站采集神器,zblog,第14张,采集,第14张

 

更新日志

v1.4 2021-11-13 16:13

  1. [优化]5188伪原创同时开始“标题伪原创”和“正文伪原创”时,一次性请求,不会请求两次
  2. [新增]内容采集可以配置“间隔内容”,当匹配到多个内容时,入库时多个内容合并时之间的内容
  3. [新增]发布规则增加“截取字符串”,截取指定范围的字符长度

v1.3 2021-07-06 16:33

  1. [新增]5188一键智能改写API

v1.2.4 2021-03-03 19:36

  1. [修复]链接采集填充异常的问题

v1.2.3 2021-02-27 19:48

  1. [修复]部分网站采集的链接无法正确填充的问题

v1.2.2 2021-02-27 16:10

  1. [修复]问答插件采集分类配置无效的问题

v1.2.1 2021-02-24 11:39

  1. [修复]不信任的ssl证书图片下载失败的问题

v1.2 2021-01-30 22:53

  1. [优化]文章采集“保存到文本”中的内容进行简单的代码格式化
  2. [优化]文章采集“保存到文本”可配置“保存后不发布文章”
  3. [新增]文章采集百度翻译伪原创
  4. [新增]文章采集可配置字数最低限制

v1.1.1 2021-01-04 16:16

  1. [优化]公共配置只的内容替换将会在所有内容处理后最后一步执行
  2. [优化]公共配置内容替换input文本框改为textarea文本框

v1.1.0 2021-01-04 16:03

  1. [修复]链接匹配正则匹配方式无效的问题

v1.0.9 2021-01-01 16:56

  1. [修复]某些情况下排除多个元素部分无法排除的问题

v1.0.8 2020-11-21 10:12

  1. [修复]部分服务器导入的规则数据太长导入失败的问题

v1.0.7 2020-11-09 20:52

  1. [修复]文章发布模块,不能保存txt文件的问题
  2. 插件入口改到顶部导航

v1.0.6 2020-11-03 20:49

  1. [修复]链接采集链接排除中的回车符导致采集不到链接的问题

v1.0.5 2020-10-18 20:47

  1. [新增]规则配置可选择是否调用其它插件接口Filter_Plugin_Upload_SaveBase64File
  2. [修复]前后截取部分情况下无法截取的问题

v1.0.4 2020-10-16 20:55

  1. [修复]部分情况下排除元素消失的问题

v1.0.3 2020-10-14 22:14

  1. [优化]当转存图片时,对方站点证书不匹配造成的失败问题(忽略证书检测)
  2. [新增]插件右上角新增“使用手册”菜单

v1.0.2 2020-10-10 20:59

  1. [新增]文章采集,可以设置保存到txt文件
  2. [新增]链接采集可配置“必须包含”“不能包含”
  3. [新增]链接采集可选择“打乱链接”,采集后的链接不是按照原页面顺序

v1.0.1 2020-10-08 17:59

  1. meta支持数组,结尾用[]表示

v1.0 2020-10-07 20:12

 附件下载(至尊VIP可享8折)
 售价:468 米币
 附件1
网站采集神器
5.63mb
zba
可风
0
未购买,点击此处购买 购买并下载 ,至尊VIP可享8折购买该附件,同时享受全站VIP资源免费下载!【 点击开通VIP

文章版权声明:除非注明,否则均为小君博客原创文章,转载或复制请以超链接形式并注明出处。