网友评分:
9.7分
杰灵采集器是一款免费的内容采集与信息发布的数据处理软件,支持将数据批量上传至各种CMS(dedecms,帝国 CMS,phpcms),BLOG(wp,zlobg,BBS(discuz,phpwind)等主流程序,内置小巧便捷的发布接口,可扩展至任意程序 (php,asp,C#,java等)。
1:支持手动单页模式,指定URL采集内容。
2:自动过滤重复网址,支持自定义目标网址的过滤规则。
3:支持从列表中抓取信息到内容页中。
4:支持从内容页衍生的(无限)多级页面抓取(多级页支持分页)
5:支持图片或任意附件本地化,图片自动水印,自动提取缩略图,发布文章 自动http上传。
6:支持多任务多线程同时采集不同目标网页信息。
7:支持将采集内容发布到开源程序,目前已内置discuz,dedecms,wordpress,帝国cms。
8:内置发布规则编辑器,轻松管理自定义字段,可扩展发布至任意程序。
9:支持自定义COOKIE、UserAgent等Header头信息。
10:采集内容 支持网页文字前后截取或正则表达式提取。
11:支持设置列表页、内容页、发布时候的时间间隔。
等等,再高级的功能,估计又要过一阵子再写了。
1:采集图片自动增加水印,自定义图片或文字水印设置
2:可以提取首张图片为缩略图
3:发布文章 自动上传图片附件到网站,使用HTTP批量上传,不用安装FTP照样使用!
4:图片附件同步帝国附件表, 支持删除文章同步删除相应附件。
标签: 内容采集