当下软件园 / 汇聚当下最新最酷的软件下载站!
当下软件园

您的位置: 首页 > 网络软件 > 网页辅助 > 懒人采集器 V4.0.2 官方最新版

  懒人采集器是一款非常实用的网页信息采集工具,该工具界面整洁、操作简单、功能强大。它的采集配置非常简单,全程可通过内置浏览器可视化选取需要采集的内容,使您可以在短时间内就可以快速创建出一个采集任务,无需分析网页源代码,更不需要熟悉网络协议,只需要点点鼠标就可以完成创建好任务。软件界面简洁,用户可以轻松使用这款软件来帮助自己采集目标网站中的所有信息。懒人采集器使用方法非常的简单,即便是第一次使用都可以轻松的完成信息采集任务,非常实用。

【软件功能】

  零门槛:不懂网络爬虫技术,会上网,就会采集网站数据

  多引擎,高速稳定:内置高速浏览器引擎,还可以切换为HTTP引擎模式运行,采集数据更加高效。还内置了JSON引擎,无需分析JSON数据结构,可视化选取JSON内容。

  适用各种网站 :能够采集互联网99%的网站,包括单页应用Ajax加载等等动态类型网站。

【软件特色】

  软件操作简单,可通过鼠标点击的方式轻松选取要抓取的内容;

  支持三种高速引擎:浏览器引擎、HTTP引擎、JSON引擎,内置优化后的火狐浏览器,加上独创的内存优化使浏览器采集也可以高速运行,甚至可以快速转换为HTTP方式运行,享受更高的采集速度!而在抓取JSON数据时,同样可以使用浏览器可视化方式,通过鼠标点选需要抓取的内容,完全不需要去分析JSON数据结构,使非网页专业设计人士也可以轻松抓取需要的数据;

  不用分析网页请求和源代码,却支持更多的网页采集;

  先进的智能算法,可以一键生成目标元素XPATH、自动识别网页列表、自动识别分页中的下一页按钮……

  支持丰富的数据导出方式,可以导出为txt文件、html文件、csv文件、excel文件,也可以导出到已有的数据库,如sqlite数据库、access数据库、sqlserver数据库、mysql数据库,通过向导的方式简单映射字段,即可轻松导出到目标网站数据库中。

【软件优势】

  可视化向导:所有采集元素,自动生成采集数据

  计划任务:灵活定义运行时间,全自动运行

  多引擎支持:支持多个采集引擎,内置高速浏览器内核、HTTP引擎和JSON引擎

  智能识别:可自动识别网页列表、采集字段和分页等

  拦截请求:自定义拦截域名,方便过滤站外广告,提高采集速度

  多种数据导出:可导出为Txt 、Excel、MySQL、SQLServer、 SQlite、Access、网站等

【怎么设置起始网址】

  要采集一个网站的数据,首先我们要设置从哪些网址进入采集,比如我们要采集一个网站的国内新闻,那么我们就要设置起始网址为国内新闻栏目列表的网址,而一般不会设置网站首页为起始网址,因为首页通常会包含很多列表,比如最新文章、热门文章、推荐文章等等各种列表块,并且这些列表块里显示的内容也是非常有限的,采集这些列表的话一般都无法采集完整信息。

  下面我们以采集新浪新闻为例,从新浪首页找到国内新闻,但该栏目首页内容还是比较杂乱,而且还细分三个子栏目

  我们从进入其中一个子栏目“内地新闻”看一下

  该栏目页包含有一个带分页的内容列表,通过切换分页,我们就可以采集到该栏目下的所有文章,所以这种列表页就非常适合作为我们采集的起始网址。

  现在,我们就复制该列表网址到任务编辑框第一步的文本框中

  如果你要在一个任务中同时采集国内新闻里的其他子栏目,也可以把另两个子栏目列表地址复制进来,因为这些子栏目列表格式都是相似的。但为了便于导出或发布分类数据,一般不建议多个栏目内容混合在一起。

  对于起始网址我们也可以批量添加或从txt文件导入,比如我们要采集前5页,也可以这样自定义五个起始页

  需要注意的是如果这里自定义了多个分页列表,在后面的采集配置里就不要再启用分页了,通常我们要采集某个栏目下的所有文章时,都只需要定义该栏目第一页为起始网址就行了,在后面的采集配置里启用分页,就可以采集到每个分页列表的数据。

【懒人采集器自动生成列表和字段】

  对于某些网页,软件会智能分析出该页的列表,并自动高亮选择网页列表和生成列表数据,如

  然后我们再对这些数据进行修整,比如删掉一些不需要的字段

  点击图示三角符号,会弹出该字段采集详细配置,点击上面的删按钮即可删除该字段,其余参数后面章节会独立介绍。

  如果某些网页自动生成的列表数据并不是我们想要的数据,可以点击“清除字段”,把生成的字段全部清除。

  如果自动分析出的高亮列表也不是我们要采集的列表,那么我们就手动选取列表。要是想取消高亮显示的列表框,可以点击 查找列表 - 列表XPATH,把里面的xpath清空后确定即可。

软件特别说明

标签: 懒人采集器 网页采集

其他版本下载
网友评论
回顶部 去下载

关于本站|下载帮助|下载声明|软件发布|联系我们

Copyright © 2005-2026 www.downxia.com.All rights reserved.

浙ICP备2024132706号-1 浙公网安备33038102330474号