大数据智能采集平台-数据产品需求解析

本文回顾了参与建设大数据管理平台-DMP的经历,并详细介绍了如何从8个具体数据需求出发,进行需求分析与分类,明确了技术需求(如IP代理、分布式部署、验证码识别)和功能需求(如可视化配置、自定义扩展)。该平台定位为技术型产品,服务于内部研究人员,通过清晰的需求理解和文档制定,推动项目的立项与实施。
摘要由CSDN通过智能技术生成

回忆2015年我有幸作为CODER身份参与建设“大数据管理平台-DMP”,一晃4个春夏秋冬已过,遥想2015年房价,现在看来真是合理,如果当时我可以办理公积金贷款,我想我已不至于现在由于,而问题就怪当时的公司会按当时最低工资标准缴纳公积金,而归根结底呢,问题还是在自己身上!为什么不选择其他雇主?,为什么不去稳定的事业机关?,有什么理由在一家只有蓝图的公司呢?我市场安慰我自己:我参与开发和设计过DMP!

冗余的话不多说,现在貌似一切又回到原定,项目组急需一套大数据采集服务,实际采集功能隶属于DMP的一个模块,就这个模块展开,更专精的去尝试设计大数据采集服务平台,不过这次身份是已业务产品的身份参与。

全部项目流程:1需求沟通   2可行性报告(产品需求分析、商业需求分析、市场需求分析-竞品分析)3项目立项  4产品开发 5测试验收 6不断45回滚  7上线运行

S1:简单收到领导从业务部门提出的8个数据需求:

  • 要有IP代理池,避免使用公司主网IP,保证网络稳定
  • 支持JSON、xml半机构化数据结构化解析
  • 验证码识别,支持机器学习自己训练OCR识别算法与打码平台
  • 采集模板
  • 可视化的配置流程,配置支持xpath、CSS选择等
  • 爬虫调度管理策略,要分布式部署采集
  • 图片、视频、压缩文件数据下载,pc、wab、app采集
  • 支持自定义工具开发扩展,支持.PY脚本与现有工具配合使用

综上看起来还比较专业,毕竟这些都是博士分析师提出的需求,拿到这么多需求,确定最

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值