我的个人信息:
本猿92年小生一枚,10级三流本科院校的软件工程专业,今年2013年10月份开始实习,说长不长说短不短的时间混迹在中小型互联网公司,主要从事的java研发工作。更确切一点的职责则是数据方面的实现。
总的来说,还没彻底离开母校魔爪的我,并没有算法界底层级预研大牛们那么深厚的内功,也没有摸爬滚打项目之上十多年狮子(工程师)们那么华丽的招式,但我是一个深爱互联网行业的coder,哪怕是留下一点点足迹,我也要坚持的在这条路上走下去。
我的个人愿望:
希望大神也好、大虾也罢,对数据抓取这一块有研究或有兴趣的人士,能够一起讨论共磋技术、工程、爱好。谢谢!
最近开始进行一些数据的抓取工作,记得不知哪位业内大牛曾经说过:只要是在网页上能看到的东西,都可以获取过来,只是难易程度的问题。
互联网就像是一张充满神秘的大网,无数的行业、无数的机遇、无数的用户、无数的信息(数据)……在其上翻滚、沉涌,它充斥着数不尽的财富,能带给人们的也是不可想象的多。
心生了一个想法,把自己近期对不同网站数据进行的抓取,也有接下来会分析并抓取的
网上数据进行整理归档,也许沉淀久了之后会是一片数据抓取之路,也能和大家进行讨教、讨论和分享。生命不休,学习不止!
零、数据抓取的背景信息: