如何织梦dedecms采集文章详细介绍方法
是用
织梦
建站的时候,经常会遇到采集文章。要是手动的添加文章需要花费大量的时间,那么使用采集规则如何来采集文章呢
第一步:进入后台 找到 “采集”-》采集节点管理 然后 “新增节点”
第二步:单击 “确定”之后 填写相关的参数。
到需要采集的页面右击查看源文件,知道采集的文章的编码格式。
今天我们使用
笔记部落
的网站开源CMS教程来举例 http://www.wangjinhai119.com/kyjc/到这个页面右击查看得知编码格式utf-8的。节点名称:开源CMS教程,编码格式uft-8
单击下一页 我们得知前两页的网址规则是:
http://www.wangjinhai119.com/kyjc/list_3_1.html
http://www.wangjinhai119.com/kyjc/list_3_2.html
其他的页面都一样不一样的就是后面的 1、2数字不相同
所以在匹配的网址把1修改*
若是大家采集的没有规则的话。就选择
手工指定网址列表
第三步:列表网址获取规则写完之后,下面我们来写文章网址匹配规则
若链接含有图片选择 “采集为缩率图”
点击保存设置进入下一步,可以看到我们获得的文章网址
说明我们获取到正确了
第四步:过滤内容。选择“常用规则”选择对应的进行过滤就可以,然后保存并且开始采集。采集完成就可以了
最后一步 导出数据完成