文章目录[隐藏]
第一步、新建任务
第二步、起始网址设置
然后在获取内容网址那栏选择[手动设置规则获取]
在这里获取文章的链接,然后火车头正则匹配一下
然后点击一下网址采集测试看一下效果
这就是获取成功了
如果遇到采集比较乱,就需要在下方的设置区域设置ID这个文章列表整体的唯一class或者ID
这里就不做演示了,接下来写
第三步、内容采集规则
导入我们写好的模块
选不用审核这个就行了
导入完成就可以写规则了,我们先随便点一篇文章链接
复制到这里,进行采集内容的测试
我们先采集标题
复制一整段的h1标签到火车头,文字内容用参数代替
下面标题就采集完了
接下来写内容
原理跟标题一样
下面还有数据处理 自己看着处理,一般把a标签过滤了就行
如果需要内容替换,也是在这个数据处理自己看着弄很多选项不一一介绍了
分类ID就是你栏目的ID
时间格式就填第一种
缩略图就在内容标签提取
注意内容标签跟缩略图标签都要把图片下载到本地然后上传到服务器,你网站的根目录/img 目录下(记得开FTP)
点击测试
在其他设置,图片下载加一个img也就是你的图片目录,顺便去宝塔把ftp开一下
填完之后在去测试一下会发现缩略图标签的图片链接前面会有/img就没问题了
接下来就是
第四步、内容发布设置
然后抓包一下网站后台的cookie值
完~
评论