织梦采集侠是一款非常好用的采集工具,能够为各位站长们进行网站数据的采集,用来实时更新网站的数据,有需要的欢迎下载使用。
专门针对织梦后台操作系统的采集工具
使用说明:
采集版分UTF8和GBK两个版本,根据自己使用的dedecms版本来选择!
因文件是用mac系统打包的,会自带_MACOSX、.DS_Store文件,不影响使用,有强迫症的可以删除。覆盖破解文件的时候不用管这些文件。
1,【您自行去采集侠官方下载最新v2.8版本(网址:http://www.caijixia.net/ 如果官网不能打开就用我备份好的,解压后有个采集侠官方插件文件夹,自行选择安装对应的版本),然后安装到您的织梦后台,如果之前安装过2.7版本,请先删除!】
2,注意安装的时候版本千万不要选错了,UTF8就装UTF8,GBK就用GBK的不要混用!
3,【覆盖破解文件】(共三个文件CaiJiXia、include和Plugins)
Plugins : 直接覆盖到网站的根目录
include : 直接覆盖到网站的根目录
CaiJiXia: 网站默认后台是dede,如果你没有修改后台目录的话那就是覆盖 /dede/apps/下面,如果后台访问路径被修改过的话,那就把dede换成你修改的名称。例:dede已修改成test, 那就覆盖/test/apps/目录下
4,【破解程序使用对域名无限制】
5, 【覆盖后需要清理下浏览器缓存, 推荐使用谷歌或者火狐浏览器,不要用IE内核浏览器,清理缓存有时清的不干净】
6, PHP版本必须5.3+
使用方法:
1、设置定向采集
1)、登录您网站后台,模块->采集侠->采集任务,如果您的网站还没有添加栏目,你需要先到织梦的栏目管理里先添加栏目,如果已经添加了栏目,你可能可以看到如下界面
2)、在弹出的页面里选择定向采集,如图所示
3)、点击添加采集规则,这就是添加定向采集规则的页面了,这里我们要详细说下
2、设置 目标页面编码
打开您要采集的网页,点击鼠标右键,点击查看网站源码,搜索charset,查看charset后面紧跟的是utf-8还是gb2312,如图所示即为utf-8
3、设置 列表网址
列表网址就是您要采集的网站的栏目列表地址
如果只是单纯采集列表页的第一页,直接输入该列表URL就行,如我要采集站长之家的优化栏目的第一页,那列表URL就输入:http://www.chinaz.com/web/seo/,即可。采集第一页的内容的好处就是可以不用采集老旧的新闻,而且有新更新也可以及时采集到,如果需要采集该栏目的所有内容,那也可以通过设置通配符的方式,匹配所有列表URL规则。
- PC官方版
- 安卓官方手机版
- IOS官方手机版