正文
此篇文章发布距今已超过173天,您需要注意文章的内容或图片是否可用!

特别功能

  1. 多任务可视化采集

  2. 采集量图表统计,历史采集状况一看便知

  3. 支持文章评论采集(仅第一页评论)

  4. 支持大多数主题、插件数据采集(任意数据表入库)

  5. 第三方触发自动采集

  6. 多标签页,多线程采集

  7. 文章伪原创(5118、百度翻译)

 

本插件一些规则配置方面,参考了火车头软件

 

免责申明

因为本插件属于“蜘蛛”性质,采集网站请遵守对方的robots.txt规则。如有违反,相应的法律责任由使用者自行承担。

插件使用教程

网站采集神器用户手册

插件截图

插件首页

zblog—网站采集神器,网站采集神器,zblog,第1张,采集,百度,代码,优化,软件,插件,第1张

任务概况

zblog—网站采集神器,网站采集神器,zblog,第2张,采集,百度,代码,优化,软件,插件,第2张

正在采集

zblog—网站采集神器,网站采集神器,zblog,第3张,采集,百度,代码,优化,软件,插件,第3张

未采集到内容

zblog—网站采集神器,网站采集神器,zblog,第4张,采集,百度,代码,优化,软件,插件,第4张

任务规则-第一步(链接采集)

zblog—网站采集神器,网站采集神器,zblog,第5张,采集,百度,代码,优化,软件,插件,第5张

任务规则-第一步(添加有规则的网址)

zblog—网站采集神器,网站采集神器,zblog,第6张,采集,百度,代码,优化,软件,插件,第6张

任务规则-第一步(链接采集预览)

zblog—网站采集神器,网站采集神器,zblog,第7张,采集,百度,代码,优化,软件,插件,第7张

任务规则-第二步(添加内容采集)

zblog—网站采集神器,网站采集神器,zblog,第8张,采集,百度,代码,优化,软件,插件,第8张

任务规则-第二步(测试内容采集)

zblog—网站采集神器,网站采集神器,zblog,第9张,采集,百度,代码,优化,软件,插件,第9张

任务规则-第三步(设置发布规则)

zblog—网站采集神器,网站采集神器,zblog,第10张,采集,百度,代码,优化,软件,插件,第10张

任务规则-第三步(设置自定义内容)

zblog—网站采集神器,网站采集神器,zblog,第11张,采集,百度,代码,优化,软件,插件,第11张

任务规则-第四步(任务杂项配置)

zblog—网站采集神器,网站采集神器,zblog,第12张,采集,百度,代码,优化,软件,插件,第12张

公共配置

zblog—网站采集神器,网站采集神器,zblog,第13张,采集,百度,代码,优化,软件,插件,第13张

入库模块配置

本采集插件正常情况下仅支持单个数据表入库,要同时入库多个表,需要定制入库模块。

什么情况下需要入库模块?比如文章评论,采集到的评论,入库时和文章不在同一个数据表,这时候就要单独的一个入库规则来实现评论发布;或者是需要处理一些其它数据

目前插件已附加两个入库模块

zblog—网站采集神器,网站采集神器,zblog,第14张,采集,百度,代码,优化,软件,插件,第14张

 

更新日志

v1.4.4 2022-04-04 11:15

  1. [修复]无法下载mip图片的问题

  2. [优化]下载图片时,请求头会使用其它配置中的header

v1.4.3 2022-01-23 16:27

  1. [修复]某些图片下载失败的问题

v1.4.2 2022-01-07 11:22

  1. [修复]在zblog1.7下触发自动采集文章入库状态为“没有权限”的问题

v1.4.1 2021-11-19 16:09

  1. 修正文章入库配置“5118伪原创”名称错误的问题,改为“5118一键智能换词API”,API没换,更新后无需处理

  2. [修复]5118一键智能换词API总开关无效的问题

v1.4 2021-11-13 16:13

  1. [优化]5188伪原创同时开始“标题伪原创”和“正文伪原创”时,一次性请求,不会请求两次

  2. [新增]内容采集可以配置“间隔内容”,当匹配到多个内容时,入库时多个内容合并时之间的内容

  3. [新增]发布规则增加“截取字符串”,截取指定范围的字符长度

v1.3 2021-07-06 16:33

  1. [新增]5188一键智能改写API

v1.2.4 2021-03-03 19:36

  1. [修复]链接采集填充异常的问题

v1.2.3 2021-02-27 19:48

  1. [修复]部分网站采集的链接无法正确填充的问题

v1.2.2 2021-02-27 16:10

  1. [修复]问答插件采集分类配置无效的问题

v1.2.1 2021-02-24 11:39

  1. [修复]不信任的ssl证书图片下载失败的问题

v1.2 2021-01-30 22:53

  1. [优化]文章采集“保存到文本”中的内容进行简单的代码格式化

  2. [优化]文章采集“保存到文本”可配置“保存后不发布文章”

  3. [新增]文章采集百度翻译伪原创

  4. [新增]文章采集可配置字数最低限制

v1.1.1 2021-01-04 16:16

  1. [优化]公共配置只的内容替换将会在所有内容处理后最后一步执行

  2. [优化]公共配置内容替换input文本框改为textarea文本框

v1.1.0 2021-01-04 16:03

  1. [修复]链接匹配正则匹配方式无效的问题

v1.0.9 2021-01-01 16:56

  1. [修复]某些情况下排除多个元素部分无法排除的问题

v1.0.8 2020-11-21 10:12

  1. [修复]部分服务器导入的规则数据太长导入失败的问题

v1.0.7 2020-11-09 20:52

  1. [修复]文章发布模块,不能保存txt文件的问题

  2. 插件入口改到顶部导航

v1.0.6 2020-11-03 20:49

  1. [修复]链接采集链接排除中的回车符导致采集不到链接的问题

v1.0.5 2020-10-18 20:47

  1. [新增]规则配置可选择是否调用其它插件接口Filter_Plugin_Upload_SaveBase64File

  2. [修复]前后截取部分情况下无法截取的问题

v1.0.4 2020-10-16 20:55

  1. [修复]部分情况下排除元素消失的问题

v1.0.3 2020-10-14 22:14

  1. [优化]当转存图片时,对方站点证书不匹配造成的失败问题(忽略证书检测)

  2. [新增]插件右上角新增“使用手册”菜单

v1.0.2 2020-10-10 20:59

  1. [新增]文章采集,可以设置保存到txt文件

  2. [新增]链接采集可配置“必须包含”“不能包含”

  3. [新增]链接采集可选择“打乱链接”,采集后的链接不是按照原页面顺序

v1.0.1 2020-10-08 17:59

  1. meta支持数组,结尾用[]表示

v1.0 2020-10-07 20:12

附件
网站采集神器
5.63mb
zba
可风
下载文件
附件购买
售价:468 米币
若无特殊标注皆为互联网收集,仅供用于学习和交流,请勿用于商业用途。如有侵权、不妥之处,请联系站长并出示版权证明以便删除。敬请谅解!