使用火车头采集文章教程
在做测试站或外推时会用到采集器采集文章,使用火车头采集某个网站的文章非常方便,下面就跟随小编一起来为自己的测试站和外推采集一些文章吧。
使用工具:火车头采集软件LocoySpider_V7.7
采集方法
1.双击打开火车头,此处采用LocoySpider_V7.7做示范。
2.为自己要采集的文章建立组别和任务:在菜单栏中点击分组-新建分组—命名组,创建分组后新建任务:在菜单栏中点击分组-新建任务—填写任务名。
3.设置采集规则第一步:点击添加-批量多页(如果是采集单页,则选择单条网址)—输入网址、等差数列—添加完成
等差数列的值根据你要采集的列表页数改变,如要采集5页,则填写5;
添加完成后可点击测试网址采集
4.设置采集规则第二步:随意打开采集页上的一篇文章做测试,更改标题、内容规则。
更改标题规则:查看文章源代码-ctrl+f 找到文章标题,将标题前后代码填入标题规则中;如图
更改内容规则:查看文章源代码-ctrl+f 找到文章内容的第一句和最后一句,将第一句前面的唯一代码和最后一句后面的唯一代码填入内容规则中。如图
设置规则完毕后,可测试采集效果
5.设置采集规则第三步:导出采集内容-保存即可
相关文章
- 使用火车头采集文章教程
在做测试站或外推时会用到采集器采集文章,使用火车头采集某个网站的文章非常方便,下面就跟随小编一起来为自己的测试站和外推采集一些文章吧。 使用工具:火车头采集软件LocoySpider_V7.7 采集方法 1.双击打开火车头,此处采用LocoySpider_V7.7做示范。 2.
- 医疗网站编辑工作规范
为让员工理解网站编辑之工作意义,写好每一篇文章,在编辑文章的过程中,理解用户的需求与搜索引擎对页面质量的判断标准,特制订本工作规范。 一、网站编辑的意义 网站编辑在整个优化过程中,是非常重要的一个环节,网站编辑的好与坏,决定着网站能否优化成
- 常用DNS服务器IP地址
公共 DNS 服务器 IP 地址 名称 DNS 服务器 IP 地址 阿里 AliDNS 223.5.5.5 223.6.6.6 CNNIC SDNS 1.2.4.8 210.2.4.8 114 DNS 114.114.114.114 114.114.115.115 oneDNS 112.124.47.27 114.215.126.16 DNS 派 电信/移动/铁通 101.226.4.6 218.30.118.6 DNS 派
- 破解网站文章无法复制
看到别人的网站上有一篇文章写的非常好,想借过来用用,于是按照老办法抄起我的鼠标选择文本复制粘贴,ca,不管用,Ctrl+A,Ctrl+C,也不管用,额,被人家限制复制了,咋办?总不能照着打一遍吧,下面医疗模板库(www.120muban.com)为大家介绍一个破解这种限制
- 如何巧用.htaccess设置网站的压缩与缓存
如何采用.htaccess设置网站的压缩与缓存 在网站根目录下的.htaccess文件中添加以下代码 复制代码 代码如下: IfModule mod_expires.c ExpiresActive On ExpiresByType image/gif A2592000 ExpiresByType image/jpeg A2592000 ExpiresByType image/png A259200
随机推荐
- 使用火车头采集文章教程
在做测试站或外推时会用到采集器采集文章,使用火车头采集某个网站的文章非常方便,下面就跟随小编一起来为自己的测试站和外推采集一些文章吧。 使用工具:火车头采集软件LocoySpider_V7.7 采集方法 1.双击打开火车头,此处采用LocoySpider_V7.7做示范。 2.
- 医疗网站编辑工作规范
为让员工理解网站编辑之工作意义,写好每一篇文章,在编辑文章的过程中,理解用户的需求与搜索引擎对页面质量的判断标准,特制订本工作规范。 一、网站编辑的意义 网站编辑在整个优化过程中,是非常重要的一个环节,网站编辑的好与坏,决定着网站能否优化成
- 常用DNS服务器IP地址
公共 DNS 服务器 IP 地址 名称 DNS 服务器 IP 地址 阿里 AliDNS 223.5.5.5 223.6.6.6 CNNIC SDNS 1.2.4.8 210.2.4.8 114 DNS 114.114.114.114 114.114.115.115 oneDNS 112.124.47.27 114.215.126.16 DNS 派 电信/移动/铁通 101.226.4.6 218.30.118.6 DNS 派
- 破解网站文章无法复制
看到别人的网站上有一篇文章写的非常好,想借过来用用,于是按照老办法抄起我的鼠标选择文本复制粘贴,ca,不管用,Ctrl+A,Ctrl+C,也不管用,额,被人家限制复制了,咋办?总不能照着打一遍吧,下面医疗模板库(www.120muban.com)为大家介绍一个破解这种限制
- 如何巧用.htaccess设置网站的压缩与缓存
如何采用.htaccess设置网站的压缩与缓存 在网站根目录下的.htaccess文件中添加以下代码 复制代码 代码如下: IfModule mod_expires.c ExpiresActive On ExpiresByType image/gif A2592000 ExpiresByType image/jpeg A2592000 ExpiresByType image/png A259200