临时笔记

SPT-下载爬虫系统和数据分析(7370)职位描述:

 

 

岗位职责:
负责搜索引擎爬虫系统的开发及相关数据的分析挖掘
岗位要求:
2年以上c 编程经验,对算法/数据结构有深刻理解
熟悉linux编程和调试环境
熟悉 socket 网络编程
具备良好的团队协作能力及沟通能力
有大型分布式系统设计开发经验优先
有搜索引擎经验者优先
具有数据挖掘、自然语言处理、信息检索、机器学习、数据统计背景的优先

 

 

 

我们正在创建新一代的智能网页搜索应用。我们在努力寻找优秀的,在文本挖掘、信息抽取、信息检索和自然语言处理等方面的专家级的软件开发人才,帮助我们建立产品数据库来展示我们的“长尾”策略产品。
职责:
1. 负责建立业内最大最全的原标签产品目录;
2. 在不知名的非主流网站上寻找鲜为人知的与众不同的产品;
3. 同团队一起合作为用户提供最完美的体验;
4. 汇报给技术总监;
要求:
1. 精通信息抓取和整合技术,从结构化的和非结构化的数据中获取信息。
2. 熟悉数据分析的统计方法,如PMT,HMM,Naïve Bayes等。自然语言处理技巧和经验尤为重要。
3. 精通与搜索和个性化相关的机器学习算法,大规模网页聚类,分类和提取摘要。
4. 精通大规模推荐系统和内容过滤(large scale recommendation system, content based recommendation and collaborative filtering)。
5. 5年以上Java开发经验,超强的编程技巧。
6. 精通Java技术,如JDBC,servlet,web service,最好熟悉Ruby。
7. 精通关系型数据库,尤其是MySQL, 大数据量的。
8. 熟悉大规模网页爬取,深度网页爬取,熟悉nutch、hadoop等爬虫工具尤佳。
9. 有测试驱动和敏捷开发经验。
10. 能用英文进行日常工作沟通交流。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值