使用火车头采集文章教程

模板网 2014-09-14

在做测试站或外推时会用到采集器采集文章,使用火车头采集某个网站的文章非常方便,下面就跟随小编一起来为自己的测试站和外推采集一些文章吧。

使用工具:火车头采集软件LocoySpider_V7.7

采集方法

1.双击打开火车头,此处采用LocoySpider_V7.7做示范。

2.为自己要采集的文章建立组别和任务:在菜单栏中点击分组-新建分组—命名组,创建分组后新建任务:在菜单栏中点击分组-新建任务—填写任务名。

3.设置采集规则第一步:点击添加-批量多页(如果是采集单页,则选择单条网址)—输入网址、等差数列—添加完成

等差数列的值根据你要采集的列表页数改变,如要采集5页,则填写5;

添加完成后可点击测试网址采集

4.设置采集规则第二步:随意打开采集页上的一篇文章做测试,更改标题、内容规则。

更改标题规则:查看文章源代码-ctrl+f 找到文章标题,将标题前后代码填入标题规则中;如图

更改内容规则:查看文章源代码-ctrl+f 找到文章内容的第一句和最后一句,将第一句前面的唯一代码和最后一句后面的唯一代码填入内容规则中。如图

设置规则完毕后,可测试采集效果

5.设置采集规则第三步:导出采集内容-保存即可

 

相关文章

  1. 常用DNS服务器IP地址

    公共 DNS 服务器 IP 地址 名称 DNS 服务器 IP 地址 阿里 AliDNS 223.5.5.5 223.6.6.6 CNNIC SDNS 1.2.4.8 210.2.4.8 114 DNS 114.114.114.114 114.114.115.115 oneDNS 112.124.47.27 114.215.126.16 DNS 派 电信/移动/铁通 101.226.4.6 218.30.118.6 DNS 派

  2. JS输出中文乱码怎么办 新闻源调用外部JS输出中文乱码

    在新闻源中调用我们的JS文件,一些新闻源上输出的中文文字会出现乱码的情况,遇到这种情况改怎么解决?

  3. 仿站小工具 V8.0 Beta

    仿站小工具 V8.0 Beta,仿站小工具是通过网址下载静态网页的工具。从输入的网址下载html代码,提取出JS、Css、Image、Picture、Flash等静态文件网址,再从下载完好的Css代码中提取出Image静态文件网址,通过网址下载静态文件,根据软件设置好的保存规则,自

  4. 网站备案不关站的9种方法

    备案这个问题一直困扰很多草根站长,我也不例外。最近很想把空间搬回国内,但是国内的空间都需要备案,众所周知备案中为了提高通过率,接入商都是要求闭站的。所以问题来了,闭站对SEO的影响是十分严重的,涉及到K站的危险。这该如何是好呢?我大概总结了以下

  5. 医疗网站编辑工作规范

    为让员工理解网站编辑之工作意义,写好每一篇文章,在编辑文章的过程中,理解用户的需求与搜索引擎对页面质量的判断标准,特制订本工作规范。 一、网站编辑的意义 网站编辑在整个优化过程中,是非常重要的一个环节,网站编辑的好与坏,决定着网站能否优化成

随机推荐

  1. 常用DNS服务器IP地址

    公共 DNS 服务器 IP 地址 名称 DNS 服务器 IP 地址 阿里 AliDNS 223.5.5.5 223.6.6.6 CNNIC SDNS 1.2.4.8 210.2.4.8 114 DNS 114.114.114.114 114.114.115.115 oneDNS 112.124.47.27 114.215.126.16 DNS 派 电信/移动/铁通 101.226.4.6 218.30.118.6 DNS 派

  2. JS输出中文乱码怎么办 新闻源调用外部JS输出中文乱码

    在新闻源中调用我们的JS文件,一些新闻源上输出的中文文字会出现乱码的情况,遇到这种情况改怎么解决?

  3. 仿站小工具 V8.0 Beta

    仿站小工具 V8.0 Beta,仿站小工具是通过网址下载静态网页的工具。从输入的网址下载html代码,提取出JS、Css、Image、Picture、Flash等静态文件网址,再从下载完好的Css代码中提取出Image静态文件网址,通过网址下载静态文件,根据软件设置好的保存规则,自

  4. 网站备案不关站的9种方法

    备案这个问题一直困扰很多草根站长,我也不例外。最近很想把空间搬回国内,但是国内的空间都需要备案,众所周知备案中为了提高通过率,接入商都是要求闭站的。所以问题来了,闭站对SEO的影响是十分严重的,涉及到K站的危险。这该如何是好呢?我大概总结了以下

  5. 医疗网站编辑工作规范

    为让员工理解网站编辑之工作意义,写好每一篇文章,在编辑文章的过程中,理解用户的需求与搜索引擎对页面质量的判断标准,特制订本工作规范。 一、网站编辑的意义 网站编辑在整个优化过程中,是非常重要的一个环节,网站编辑的好与坏,决定着网站能否优化成