爬虫工程师要求

Python爬虫视频教程零基础小白到scrapy爬虫高手-轻松入门

https://item.taobao.com/item.htm?spm=a1z38n.10677092.0.0.482434a6EmUbbW&id=564564604865

工作职责:

- 参与分布式爬虫和数据采集系统的架构设计和开发;

- 负责网络数据抓取规划、清洗以及汇总的开发工作;

- 定期爬取指定网站的数据,为业务部门提供数据支持;

职位要求:

- 一年以上python开发经验,精通python网络编程,熟悉HTTP传输协议;

- 了解搜索和爬虫开源软件(lucene,solr,mathout,firtex,lemur,indri,nutch,haddopmlarbin,QT webkit)的一种或多种,以及相关原理;

- 精通网页抓取原理及技术,精通正则表达式,从结构化的和非结构化的数据中获取信息;

- 具备信息检索、web挖掘等搜索引擎相关知识,有从事网络爬虫、网页去重、网页信息抓取、网页分类中任一种程序开发经验;

- 熟悉NoSql(MongoDB,Redis,Hbase等),了解大数据,有一定的Hadoop使用经验。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值