金融界货币型基金净值采集爬虫开发教程

本文主要介绍在神箭手上开发“金融界货币型基金净值采集爬虫”的过程,爬虫主要实现批量爬取基金数据的功能,爬取字段包括“基金代码”、“基金简称”和“7日年化收益率”等10个字段。

 

金融界的货币型基金数据比较多,基金数据的参数项比较全,参考价值高。

神箭云开放平台上线!开发者可出售应用赚取收入

神箭手一直致力于创建开放共赢的大数据+AI产业生态。2018新年伊始,全新的神箭云开放平台首度上线。开发者可以将在神箭手上开发的爬虫、API、机器学习等大数据应用一键出售到神箭云市场,赚取收入~

目前支持出售的应用包括爬虫和API接口。开发者打开在神箭手上开发的应用,点击“出售”,填写一些基本的信息,便可以快速上架到市场。用户购买开发者出售的应用后,8成的收入会立即充值到神箭手账户收入内,每月可以进行提现~

tim%e6%88%aa%e5%9b%be20180312174058

药智网保健食品采集爬虫开发教程

本文主要介绍在神箭手上开发“药智网保健食品采集爬虫”的过程,爬虫主要实现按关键字批量爬取保健食品数据的功能,爬取字段包括产品名称、保健功能和适宜人群等30个字段。

你还可根据需求调整scanUrl中的“typeid”,采集药品、中药材、医疗器械等类别的数据。

药智网是全国最大的生物医药、化工在线技术交易平台。药智网专门针对生物医药、化工领域推出专业性的知识、技术交易平台,技术需求者可以通过本平台发布技术需求、寻求技术解决方案。

淘宝客高佣金商品采集爬虫开发教程

本文主要介绍在神箭手上开发“淘宝客高佣金商品采集爬虫”的过程,爬虫主要实现批量爬取淘宝客高佣金商品数据的功能,爬取字段包括商品名称、月销、价格和佣金等字段。

 

淘宝客是一种按成交计费的推广模式,淘宝客只要从淘宝客推广专区获取商品代码,任何买家(包括你自己)经过你的推广(链接、个人网站,博客或者社区发的帖子)进入淘宝卖家店铺完成购买后,就可得到由卖家支付的佣金。所以,高佣金的商品对于淘宝客用户来说是非常有用的,在各个渠道推广这些商品都可以获得不错的收益。

不会用rest接口?神箭手SDK来了

很多小伙伴给我们反馈说,神箭手功能很强大,接口也开放了很多。不过写程序对接restful接口的时候,总是会遇到这样那样的问题,调试起来也不太方便,有什么更好的办法吗?

为了方便大家更方便的集成神箭手线上爬虫,清洗的功能,神箭手推出了官方的集成调用的SDK,目前包含Java/Php/Python三种语言,现在封装了神箭手上所有restful接口的调用,将来还将加入GraphQL和API的调用。

SDK的安装方式分别提供了手动下载和对应的集成安装环境(Maven/Composer/pip),大家根据自己熟悉的语言,选择合适的SDK即可。

爱站网关键字挖掘爬虫开发教程

本文主要介绍在神箭手上开发“爱站网关键字挖掘采集爬虫”的过程,爬虫主要实现批量输入关键字并爬取数据的功能,选择性登录功能(登录后爬取的数据更多),爬取字段包括长尾词数量、收录数和优化难度等字段。

 

爱站网是一个站长们经常使用的工具,是因为其具有长尾关键词挖掘的功能,做SEO的童鞋们都知道它的价值,而且对网站内容生产方向、结构规划,TDK编写都十分有帮助。

如何一键获取新浪微博热搜榜排名信息数据?

本文主要介绍神箭手云市场“新浪微博搜索热搜榜API”的调用方法,以及调用前的准备工作和调用过程中可能出现的问题。

 

新浪微博作为一款当前最主流的信息传递和交流工具,在人们日常生活中占据着非常重要的作用,对热搜榜数据的采集可以方便查看时下最热门的事件关键字,为此,神箭手云市场特意推出了这款“热搜榜API”。

百度糯米电影信息采集爬虫开发教程

本文主要介绍“百度糯米电影信息采集爬虫”的开发教程,按三个不同类目爬取影片的基本信息,爬取字段包括电影ID、电影名称和上映时间等字段,文章结尾会附上完整的爬虫代码。

 

采集网站URLhttps://dianying.nuomi.com/movie/movielist