Cho_Ko_Nu的博客

私信 关注
Cho_Ko_Nu
码龄1年
  • 5,124
    被访问量
  • 7
    原创文章
  • 415,018
    作者排名
  • 7
    粉丝数量
  • 于 2020-04-28 加入CSDN
获得成就
  • 获得11次点赞
  • 内容获得21次评论
  • 获得66次收藏
荣誉勋章
TA的专栏
  • 爬虫
    3篇
  • 视频爬取
    1篇
  • 自动化爬取
    2篇
  • pandas
    3篇
  • 数据分析
    1篇
  • 最近
  • 文章
  • 资源
  • 问答
  • 课程
  • 帖子
  • 收藏
  • 关注/订阅

用Python爬取b站视频

本文概要爬取B站视频的办法在csdn和B站有很多,但是本文算作是对爬取步骤的一个拆解,同时也算是我的笔记。本代码的参考对象是https://blog.csdn.net/Mr_Ohahah/article/details/108121510#comments_13858657。使用了不少函数,光看的话应该是比较难以看的,所以我将用jupyter对这位大佬的代码进行拆分和说明。(侵删)开始爬取视频首先我们要明确我们要爬的视频,我要爬的是这个https://www.bilibili.com/video/BV
原创
2139阅读
21评论
10点赞
发布博客于 3 月前

爬b站(bilibili)新电影《八佰》短评

爬b站(bilibili)新电影《八佰》短评关于我为什么要爬《八佰》短评这件事2020年11月,b站上映了《八佰》,有不少人去评分区评分和吐槽。该电影在一天之内分数从3.8分涨至5.5分,令人费解。看短评去大多都是1星,有人说是因为5星被人踩了所以排在后面,其实打五星的很多,只是没有人看见。所以我冒着电脑爆炸的风险去爬了这部电影的短评。(注:本代码完成与11月4日16时,当时只有1万7千左右的短评)需要用到的库有:requests、re、pandas、selenium、lxml。还要准备Chr
原创
392阅读
0评论
0点赞
发布博客于 3 月前

scrapy练习_爬“糗事百科”

scrapy练习_爬“糗事百科”scrapy是一个爬虫用的脚手架,和用于搭建网站的vue差不多。具体我也不知道有什么用(~ _ ~ ")。创建scrapy项目首先创一个新建文件夹,之后打开jupyter notebook,虽然可以不打开,直接使用cmd,但是cmd的界面真是不太容易看,而且很乱。在jupyter notebook界面中输入dir,确定我们进入了刚刚创建的文件夹中。输入 ! scrapy startproject qsbk创建名为qsbk的scrapy项目这样它就会为我们
原创
283阅读
0评论
0点赞
发布博客于 8 月前

丞相弩的pandas笔记实战篇——表格合并与分析

pandas表格合并先拿出几个表格df_rawdf_raw = pd.read_csv("fsnd_zb_data.tsv",encoding='utf8',sep='\t', keep_default_na=False,na_values='na_rep', index_col=[0,1,2])display(df_raw) data
原创
361阅读
0评论
0点赞
发布博客于 9 月前

丞相弩的pandas基础笔记

pandas笔记pandas数据分析pandas是Python的一个数据处理的模块,是一个表格处理器。用Python做数据分析,pandas是必不可少的。首先必须要导入这个pandas库:import pandas as pd之后我们就可以开始使用pandas了。首先我们要一个表格,表格的获取有三种办法,第一是用字典方法:第二是用爬虫来爬import requestsimport lxmlimport pandas as pdfrom lxml import etreeres
原创
414阅读
0评论
0点赞
发布博客于 9 月前

高德地图API全家桶python3

高德地图全家桶首先写下这几个标准操作import pandas as pd # 实用的制表标准库from pandas.io.json import json_normalize # 这个可以将json变成表格import requests # 网络爬虫标准配置key ="3f773d**********62d221d"获取地理编码def geocode(address,city...
原创
914阅读
0评论
1点赞
发布博客于 10 月前

Education Pack申请与WordPress

Education Pack申请与WordPressEducation pack申请流程二、GitHub Pack中可以架wordpress网站的资源三、AWS educate、DigitalOcean与阿里云架wordpress架站对比三者均提供类似服务三者差异Education pack申请流程申请学生包URL:[https://education.github.com/pack](h...
原创
486阅读
0评论
0点赞
发布博客于 10 月前