自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 [python]pandas查看和选取数据

查看所有数据 print(df)查看和选取数据常用函数1.print(df.shape) # 查询数据有多少列和行,可以使用shape[0]来获取有多行2. print(df.columns) # 顺序输出每一列的名字,可以用for循环直接获取每一项的名字3.print(df.index) # 顺序输出每一行的名字,index索引值 4.print(df.dtypes) # 可以查询每一列数据是由什么数据类型组成5.print(df.head(3)) # 查看前三行数据,如

2022-06-23 20:30:18 1942

原创 [python]pandas读取文件时常用参数

读取csv文件用函数 pd.read_csv()1.pd.read_csv(filepath_or_buffer = 文件路径) 需要指定读取文件的路径2. pd.read_csv(encoding='gbk') 指定的编码格式3.pd.read_csv(sep=',') sep是表示数据是以什么分割 默认的是逗号4.pd.read_csv(skiprows='1') 跳过第几行开始读取,现在是从第二行开始读取数据5.pd.read_csv(nrows= '15) 表示只读取前15行的数据6.pd

2022-06-22 09:52:36 801 2

原创 [python]正则表达式的使用

首先导入模块,然后用循环来构建出需要爬取的网页的链接,因为已经知道了网页有十页,所以就循环十次,用requests.get()函数获取到一个响应对象,用.text获取到网页源代码. 创建电影名字和评分的正则表达式公式,用到comlile函数 用re.findall函数来寻找出所有的电影名和电影评分并添加到对应的列表 创建出一个空字典,利用循环的方式来将电影名字和对应的评分一一对应放入字典 取出字典的key,并打印key和对应的value等有时间了再仔细学一下正则表达式,把正则常用的函数以及表达

2022-06-20 17:21:07 154 2

原创 [python]字符串的常用操作

str.replace() replace函数是字符串的替换内置函数,其中需要两个参数,第一个参数为需要替换的字符,第二个参数为替换后的字符str.split() split函数是用来分隔字符串的,需要一个参数,参数作用是以什么内容分割,分割后返回的是一个列表去除字符串两边空格或指定字符str.strip() strip函数是用来去除字符串两边字符,常用来去除字符串两边空格,无参数时会去除字符串两边的空格,设置参数时会去除掉字符串两边的指定参数字符查询字符串的长度str.le

2022-06-20 16:51:32 416 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除