如何织梦dedecms采集文章详细介绍方法

是用织梦建站的时候,经常会遇到采集文章。要是手动的添加文章需要花费大量的时间,那么使用采集规则如何来采集文章呢

第一步:进入后台 找到 “采集”-》采集节点管理     然后 “新增节点”

新增节点
第二步:单击 “确定”之后 填写相关的参数。
到需要采集的页面右击查看源文件,知道采集的文章的编码格式。
今天我们使用小鱼儿博客园的网站开源CMS教程来举例 http://www.wangjinhai119.com/kyjc/
到这个页面右击查看得知编码格式utf-8的。节点名称:开源CMS教程,编码格式uft-8
单击下一页 我们得知前两页的网址规则是:
http://www.wangjinhai119.com/kyjc/list_3_1.html
http://www.wangjinhai119.com/kyjc/list_3_2.html
其他的页面都一样不一样的就是后面的 1、2数字不相同
所以在匹配的网址把1修改*
若是大家采集的没有规则的话。就选择 手工指定网址列表
第三步:列表网址获取规则写完之后,下面我们来写文章网址匹配规则
若链接含有图片选择 “采集为缩率图”
文章网址匹配规则

点击保存设置进入下一步,可以看到我们获得的文章网址

说明我们获取到正确了
第四步:过滤内容。选择“常用规则”选择对应的进行过滤就可以,然后保存并且开始采集。采集完成就可以了
 
采集完成

 最后一步   导出数据完成

支付宝扫码打赏 微信扫码打赏

如果本文对你有帮助,欢迎打赏本站

喜欢 ()or分享
    匿名评论
  • 评论
人参与,条评论