自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 爬b站(bilibili)新电影《八佰》短评

爬b站(bilibili)新电影《八佰》短评 关于我为什么要爬《八佰》短评这件事 2020年11月,b站上映了《八佰》,有不少人去评分区评分和吐槽。该电影在一天之内分数从3.8分涨至5.5分,令人费解。看短评去大多都是1星,有人说是因为5星被人踩了所以排在后面,其实打五星的很多,只是没有人看见。所以我冒着电脑爆炸的风险去爬了这部电影的短评。 (注:本代码完成与11月4日16时,当时只有1万7千左右的短评) 需要用到的库有:requests、re、pandas、selenium、lxml。 还要准备Chr

2020-11-05 21:10:09 793

原创 scrapy练习_爬“糗事百科”

scrapy练习_爬“糗事百科” scrapy是一个爬虫用的脚手架,和用于搭建网站的vue差不多。具体我也不知道有什么用(~ _ ~ ")。 创建scrapy项目 首先创一个新建文件夹,之后打开jupyter notebook,虽然可以不打开,直接使用cmd,但是cmd的界面真是不太容易看,而且很乱。 在jupyter notebook界面中输入dir,确定我们进入了刚刚创建的文件夹中。 输入 ! scrapy startproject qsbk 创建名为qsbk的scrapy项目 这样它就会为我们

2020-06-28 16:44:56 437

原创 丞相弩的pandas笔记实战篇——表格合并与分析

pandas表格合并 先拿出几个表格 df_raw df_raw = pd.read_csv("fsnd_zb_data.tsv",encoding='utf8',sep='\t', keep_default_na=False,na_values='na_rep', index_col=[0,1,2]) display(df_raw) data

2020-05-26 17:41:02 637

原创 丞相弩的pandas基础笔记

pandas笔记 pandas数据分析 pandas是Python的一个数据处理的模块,是一个表格处理器。用Python做数据分析,pandas是必不可少的。 首先必须要导入这个pandas库: import pandas as pd 之后我们就可以开始使用pandas了。首先我们要一个表格,表格的获取有三种办法,第一是用字典方法: 第二是用爬虫来爬 import requests import lxml import pandas as pd from lxml import etree res

2020-05-24 00:28:31 696

原创 高德地图API全家桶python3

高德地图全家桶 首先写下这几个标准操作 import pandas as pd # 实用的制表标准库 from pandas.io.json import json_normalize # 这个可以将json变成表格 import requests # 网络爬虫标准配置 key ="3f773d**********62d221d" 获取地理编码 def geocode(address,city...

2020-04-28 11:00:56 2075

原创 Education Pack申请与WordPress

Education Pack申请与WordPressEducation pack申请流程二、GitHub Pack中可以架wordpress网站的资源三、AWS educate、DigitalOcean与阿里云架wordpress架站对比三者均提供类似服务三者差异 Education pack申请流程 申请学生包URL:[https://education.github.com/pack] (h...

2020-04-28 10:55:35 664

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除