日刷抖音三百条,悠悠一笑乐逍遥,夜深忽醒窗外事,不知今夕是何年。
要从上个月说起,那天晚上准备睡觉了,然后朋友突然发来一个抖音热门视频。
一向一本正经苟于工作的我,竟然沉醉于小姐姐的甜蜜的笑容,加之想到抖音好像周边的人都在玩,让我不由地也下了抖音,则立马陶醉于这抖音真对味,这世界真新鲜,这世上竟有如此光鲜亮丽的美女帅哥萌娃的感叹之中,简直没舍得合上眼。
等我准备合眼的时候,看了时间,已经早上4点半了,感叹于抖音的强大,更对抖音的用户产生了浓厚的兴趣(其实就是想看看有多少漂亮的小姐姐),也巧会一点数据分析的皮,养成了小小的职业病,什么问题都希望用数据说话,就开始爬数据分析之旅。
爬数据
爬数据用的工具都比较常见,网上大家一搜的教程一大堆,这里就简单介绍下我爬取过程。
1.引入相关python库包
首先新建python工程,引入本次爬取网页数据和写入MySQL数据库所需要的requests、pymysql、bs4这三个包:
2.获取网页数据
然后如下图所示,通过编写Python代码获取到某抖音排行榜数据网站的网页信息: