官方定制大数据服务:数据采集、数据清洗、数据标注、机器学习等
界面文章采集(按分类)爬虫
爬虫
  •  Robots协议

爬虫来源于用户发布,如有侵犯您的隐私或版权,请联系我们

版本:v8.1.1(10)
上架时间:2016-05-06
人气:4817
更新时间:2017-11-07
免费使用
套餐限制:个人免费版
获取爬虫
分享到
应用详情
版本信息
爬取数据示例
自定义项
  分类url
应用介绍

界面文章采集(按分类)爬虫,按分类爬取界面(http://www.jiemian.com/)的文章标题、发表时间、话题和内容等,可同时爬取多个分类。

最新版本:v8.1.1(10)更新日期:2017-11-07
更新内容
1. 修复部分内容页的文章发布时间爬取不到的问题
2. 增加字段别名
3. 优化爬虫代码,提高爬虫爬取速率
历史版本
版本号:v8.1(9)更新日期:2017-09-12
更新内容
1. 将缩略图字段从img标签调整为图片地址
2.修复部分爬不到作者的问题
版本号:v8(8)更新日期:2017-07-13
更新内容
1. 修复爬虫,使能爬取到没有作者的文章
版本号:v7(7)更新日期:2017-07-13
更新内容
1. 修复爬虫在爬取指定栏目文章时,还爬取其他栏目文章的问题
版本号:v6(6)更新日期:2016-11-23
更新内容
1、修复代码提交漏掉的bug
版本号:v5(5)更新日期:2016-11-23
更新内容
1、目标网站改版,更新去掉新增的script和广告内容。
2、修复因目标网站改版导致话题爬取失败的问题。
常见问题

* 什么是爬虫?

爬虫可以实时、批量、自动化地抓取网页上的数据,有助于快速获取大量数据和信息。

* 如何使用?查看更详细的教程

注册神箭手账号,登录
获取爬虫(收费爬虫可免费试用爬取十条数据)
管理爬虫,启停爬虫、发布和导出数据等

* 爬取的数据如何导出?

爬取的数据会存在神箭手上,您可以:
1、导出到本地文件;
2、自动或者手动发布到您的数据库/网站/微信公众号/邮箱等;
3、设置Webhook推送给您的服务器;
4、通过GraphQL请求数据
导出方式多样,具体请查阅详细教程哦~

* 售后服务

个人版套餐客户:请通过 控制台的工单系统 提交问题;
企业版套餐客户:请通过 控制台的工单系统 OR 在线客服 提交问题。
为什么选择神箭手

购买神箭手的服务支出<< 技术人员(8000元/月) + 服务器费(500元/月) +...

关注公众号
手机也能控制爬虫
新手指南
业务咨询
返回顶部