2017开始学爬虫

最新推荐文章于 2023-07-05 16:24:21 发布

喂鱼W_y

最新推荐文章于 2023-07-05 16:24:21 发布

阅读量1.1k

点赞数

分类专栏：爬虫

爬虫专栏收录该内容

9 篇文章 1 订阅

订阅专栏

记录一下学习打造收集数据网站的过程

　　链接：www.mite8.com，学习如何做出类似这样的网站。

　　这个网站特点主要体现在爬虫＋数据分析＋数据可视化，现在将学习如何打通从收集数据，到处理，到分析，到网站数据可视化整套流程。
　　技术方面需要关注:
　　 1.如何解决数据源的问题：爬，所以需要爬虫知识
　　 2.如何做数据存储：ＭＹＳＱＬ
　　 3.如何做数据分析：ｊａｖａ逻辑处理，数据清洗，再做ＭＹＳＱＬ的统计分析
　　 4.如何构建一个网站：阿里云服务器一枚＋域名一枚＋spring boot。需要一个云服务器，上面搭建数据库、爬虫服务、数据清洗进程，以及网站代码
　　 5.如何做出绚丽的可视化图标：Ｅｃｈａｒｔｓ，百度开发的可视化框架。
　　总结一下：需要爬虫技术ｐｙｔｈｏｎ、ｊａｖａ都行，拿到数据会做抓包分析，会一些基础的破解反爬策略；需要会数据库操作，最基本的ＭＹＳＱＬ得会一点，增删改查，数据储存，建表删表，数据清洗转换；云服务器有点了解ｘｓｈｅｌｌ客户端的使用，登陆服务器设置防火墙；Ｌｉｎｕｘ操作会一点，域名知识了解点，jａｖａ后端框架会一点，前端知识css js 布局需要知道，数据可视化框架需要懂…等等

　　整个数据流程，从数据收集，到数据存储，到处理，到统计分析，到网站，到数据最终展示，设计技术很多，需要打造这个东西需要强大的动力支持。

那么，从爬虫开始我的学习之路。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

喂鱼W_y CSDN认证博客专家 CSDN认证企业博客

码龄8年

34: 原创

74万+: 周排名

146万+: 总排名

24万+: 访问

: 等级

2431: 积分

114: 粉丝

126: 获赞

20: 评论

828: 收藏

私信

关注

热门文章

分类专栏

python 28篇
机器学习 23篇
算法 14篇
日记 7篇
深度学习 10篇
数据库 2篇
爬虫 9篇
自然语言处理 1篇
统计学 1篇
广告推荐 2篇
c++
项目实践
tensorflow 4篇
scala 2篇
spark 2篇
LR 1篇
数据流 1篇

最新评论

python中的zip()函数详解
最后的老实人_: 【*zip()函数是zip()函数的逆过程】大哥你这个搞笑呢么？不应该是 zip 和 zip(*) ？不然你那逻辑都不对
41个机器学习面试题
Chealemon: variable不是变量么，bias好像是超参数偏置来着
python中的zip()函数详解
现在是幻想时刻: ...看完了发现你这句话了
机器学习之优化算法(从SGD到Adam)
GKatHere: 4、AdaGrad “AdaGrad算法的做法是：缩放每个参数反比于其所有梯度历史平方值总和的平方根。” 如果将上值看作方差，也就是方差大的话，降低学习率，使其收敛。
深度学习模型汇总(one)
Tisfy: 看完之后，我激动的心情久久不能平复

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。