- 博客(2)
- 收藏
- 关注
原创 如何解决dataframe里面根据另一列生成一列
开始错误的代码段:1.用lamda根据Program进行修改,其中错误的是没有意识到lambda用法,其中的x就是program,df['first_url'] = df['Program'].apply(lambda x:"http://www.manmankan.com/dy2013/dianshiju/search.shtml?KeyWords={}&t=2"\ .format(urlencode({df['Program']:x})))其中urlencode需.
2021-08-17 17:08:11
387
原创 爬虫乱记乱记
初始界面是这样的,我在开发者工具中找不到视频的链接并且这些视频点开后不完全是以.mp4来结尾,利用简单的python爬excel的形式不可以完全download。1.解决链接,打开检查-network,在动态交互中进行查询,复制respond(注意选择到url的部分时有字典列表的嵌套),使用json模块进行下载。2.解决视频下载问题。其实视频链接选择查看形式也是mp4格式,网页进行二次跳转,有时候还会403。综合上面的因素,增加header(字典形式更为方便),同时allow_redirect.
2021-07-13 15:11:45
188
2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人