使用火车头采集文章教程

模板网 2014-09-14

在做测试站或外推时会用到采集器采集文章,使用火车头采集某个网站的文章非常方便,下面就跟随小编一起来为自己的测试站和外推采集一些文章吧。

使用工具:火车头采集软件LocoySpider_V7.7

采集方法

1.双击打开火车头,此处采用LocoySpider_V7.7做示范。

2.为自己要采集的文章建立组别和任务:在菜单栏中点击分组-新建分组—命名组,创建分组后新建任务:在菜单栏中点击分组-新建任务—填写任务名。

3.设置采集规则第一步:点击添加-批量多页(如果是采集单页,则选择单条网址)—输入网址、等差数列—添加完成

等差数列的值根据你要采集的列表页数改变,如要采集5页,则填写5;

添加完成后可点击测试网址采集

4.设置采集规则第二步:随意打开采集页上的一篇文章做测试,更改标题、内容规则。

更改标题规则:查看文章源代码-ctrl+f 找到文章标题,将标题前后代码填入标题规则中;如图

更改内容规则:查看文章源代码-ctrl+f 找到文章内容的第一句和最后一句,将第一句前面的唯一代码和最后一句后面的唯一代码填入内容规则中。如图

设置规则完毕后,可测试采集效果

5.设置采集规则第三步:导出采集内容-保存即可

 

相关文章

  1. 医疗网站编辑工作规范

    为让员工理解网站编辑之工作意义,写好每一篇文章,在编辑文章的过程中,理解用户的需求与搜索引擎对页面质量的判断标准,特制订本工作规范。 一、网站编辑的意义 网站编辑在整个优化过程中,是非常重要的一个环节,网站编辑的好与坏,决定着网站能否优化成

  2. MySQL修改root密码的几种方法

    一、在有密码可以登录MySQL的情况下,使用一下几种方式修改: 方法1: 用SET PASSWORD命令 mysql -u root mysql SET PASSWORD FOR root@localhost = PASSWORD(newpass); 方法2:用mysqladmin mysqladmin -u root password newpass 如果root已经设置过密码,

  3. 百度刷下拉关键代码分享

    近日在分析一个网站的时候,看到网站中加了一段加密的代码,遂产生了兴趣,刚好下午没事,就研究这个对其进行解密,最终得到如下代码。 大概的看了一下代码,发现其尽然是刷百度下拉的代码,特分享出来与大家一同学习一下。 复制代码 代码如下: (function()

  4. 仿站小工具 V8.0 Beta

    仿站小工具 V8.0 Beta,仿站小工具是通过网址下载静态网页的工具。从输入的网址下载html代码,提取出JS、Css、Image、Picture、Flash等静态文件网址,再从下载完好的Css代码中提取出Image静态文件网址,通过网址下载静态文件,根据软件设置好的保存规则,自

  5. Flash始终位于最上层的解决方法(让FLASH对象位于DIV层之下)

    很多时候,我们在页面插入FLASH的时候会发现,flash是object,然后页面默认把它始终是放在最上面的,这样flash上面紧贴着的下拉菜单便到后面看不到了。设置层也没有用。 这 样在生成页面的时候就变得很被动,于是我做了个浮动层,原来的页面上有flash,但是

随机推荐

  1. 医疗网站编辑工作规范

    为让员工理解网站编辑之工作意义,写好每一篇文章,在编辑文章的过程中,理解用户的需求与搜索引擎对页面质量的判断标准,特制订本工作规范。 一、网站编辑的意义 网站编辑在整个优化过程中,是非常重要的一个环节,网站编辑的好与坏,决定着网站能否优化成

  2. MySQL修改root密码的几种方法

    一、在有密码可以登录MySQL的情况下,使用一下几种方式修改: 方法1: 用SET PASSWORD命令 mysql -u root mysql SET PASSWORD FOR root@localhost = PASSWORD(newpass); 方法2:用mysqladmin mysqladmin -u root password newpass 如果root已经设置过密码,

  3. 百度刷下拉关键代码分享

    近日在分析一个网站的时候,看到网站中加了一段加密的代码,遂产生了兴趣,刚好下午没事,就研究这个对其进行解密,最终得到如下代码。 大概的看了一下代码,发现其尽然是刷百度下拉的代码,特分享出来与大家一同学习一下。 复制代码 代码如下: (function()

  4. 仿站小工具 V8.0 Beta

    仿站小工具 V8.0 Beta,仿站小工具是通过网址下载静态网页的工具。从输入的网址下载html代码,提取出JS、Css、Image、Picture、Flash等静态文件网址,再从下载完好的Css代码中提取出Image静态文件网址,通过网址下载静态文件,根据软件设置好的保存规则,自

  5. Flash始终位于最上层的解决方法(让FLASH对象位于DIV层之下)

    很多时候,我们在页面插入FLASH的时候会发现,flash是object,然后页面默认把它始终是放在最上面的,这样flash上面紧贴着的下拉菜单便到后面看不到了。设置层也没有用。 这 样在生成页面的时候就变得很被动,于是我做了个浮动层,原来的页面上有flash,但是