合作推广:神箭手-2017全新合作计划 掘金大数据时代 成就财富梦想
百度百家文章采集(按频道)爬虫
爬虫
版本:v6.2(8)
上架时间:2016-04-08
使用人数:1252 人
更新时间:2017-07-13
免费使用
套餐限制:个人免费版
获取爬虫
应用详情
版本信息
用户评论
爬取数据示例
自定义项
  待爬取的文章频道首页url,请参考默认url格式,可爬取多个频道
应用介绍

实时爬取百度百家(http://baijia.baidu.com/)的文章。包括文章标题、封面图片、作者、时间和内容等,可自定义要爬取的文章分类(频道)。

可自动发布到您的数据库或网站,也可以一键导出爬取结果到本地文件~



爬虫特色:

1、云端采集,24小时不间断

神箭手是完全的云采集,爬虫运行24小时不间断,关机也能采~

2、标准格式化数据自动发布和导出,无缝对接您的现有系统

可自动发布和导出数据到您的数据库或网站,同时还支持webhooks,restful接口,无缝快速集成到您的现有系统

3、官方维护,自动更新

神箭手官方出品,品质保证!目标网站改动会自动更新爬虫,让您只需专注于业务增长~

常见问题

* 什么是爬虫?

爬虫可以实时、批量、自动化地抓取网页上的数据,有助于快速获取大量数据和信息。

* 如何使用?

注册神箭手账号,登录
获取爬虫(收费爬虫可免费试用爬取十条数据)
管理爬虫,启停爬虫、发布和导出数据等

* 爬取的数据如何导出?

爬取的数据会存在神箭手上,您可以:
1、导出到本地文件;
2、自动或者手动发布到您的数据库/网站/微信公众号/邮箱等;
3、设置Webhook推送给您的服务器;
4、通过GraphQL请求数据
导出方式多样,具体请查阅详细教程哦~

* 售后服务

个人版套餐客户:请通过 控制台的工单系统 提交问题;
企业版套餐客户:请通过 控制台的工单系统 OR 在线客服 提交问题。
为什么选择神箭手

购买神箭手的服务支出<< 技术人员(8000元/月) + 私密IP代理(900元/月) + 服务器费(500元/月) +...

当前版本:v6.2(8)更新日期:2017-07-13
更新内容
1. 修复爬虫无法爬取数据的问题
2. 去除“文章标签”字段,因为无法爬到了
注:此次更新有字段调整,请谨慎更新
更多更新版本
版本号:v6.1(7)更新日期:2017-06-06
更新内容
1、解决部分文章图片img没有src属性的问题。
版本号:v6(6)更新日期:2017-05-31
更新内容
1.因目标网站改动,更新爬虫代码
注:因百度百家网站改版,更新版本后请在爬虫设置中重新设置新的频道首页url(格式请参考:https://baijia.baidu.com/channel?cat=1)
版本号:v5(5)更新日期:2017-05-12
更新内容
1.增加爬取文章“分类”和"标签"
版本号:v4(4)更新日期:2017-05-10
更新内容
1.增加爬取文章“封面图”
版本号:v3(3)更新日期:2017-02-10
更新内容
1. 新增“阅读量”和“文章url”两个字段
关注公众号
手机也能控制爬虫
新手指南
业务咨询
返回顶部