![](https://img-blog.csdnimg.cn/20201014180756757.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
pandas
文章平均质量分 56
kingloneye
相信会更好!
展开
-
pandas案例二(统计电影分类情况)
统计电影分类情况import pandas as pdimport numpy as npfrom matplotlib import pyplot as pltdf = pd.read_csv("D:/test/youtube_video_data/IMDB-Movie-Data.csv")print(df.head())print(df.info())#分类print(df["Genre"])"""思路:重新构造一个全为0的数组,列名为全部展开的分类,行为原来数据的长度,如果原创 2020-08-06 10:55:30 · 795 阅读 · 0 评论 -
pandas之缺失数据的处理(五)
import pandas as pdimport numpy as npt1 = pd.DataFrame(np.arange(12).reshape(3,4),index=list("abc"),columns=list("WXYZ"))print(t1)t1.iloc[1:,:2]=np.nanprint(t1)判断当前数组有没有nan 方式一:为nan的返回True#判断当前数组有没有nan 方式一:为nan的返回Trueprint(pd.isnull(t1))判断当前原创 2020-08-06 10:48:58 · 122 阅读 · 0 评论 -
pandas案例(一)
案例:对于这一组电影数据,如果我们想runtime的分布情况,应该如何呈现数据?import pandas as pdfrom matplotlib import pyplot as plt#pandas读取外部数据df = pd.read_csv("D:/test/youtube_video_data/IMDB-Movie-Data.csv")print(df.head())print(df.info())#获取时间列数据runtime_data = df["Runtime (Mi原创 2020-08-06 10:39:41 · 669 阅读 · 0 评论 -
pandas之DataFrame 二维数组创建,行、列索引(三)
DataFrame对象既有行索引,又有列索引行索引:表明不同行,横向索引,叫index,0轴,axis=0列索引:表明不同列,纵向索引,叫columns,1轴,axis=1创建DataFrame 二维数组import pandas as pdimport numpy as np# 创建DataFrame 二维数组t1 = pd.DataFrame(np.arange(12).reshape(3,4))print(t1)创建DataFrame 二维数组,自定义行和列索引# 创建Data原创 2020-08-04 18:07:17 · 6266 阅读 · 0 评论 -
pandas之读取外部数据(二)
pandas 读取外部数据df = pd.read_csv("D:/test/youtube_video_data/dogNames2.csv")print(df.head())print(df.info())统计狗的名字次数最高的 排序df = df.sort_values(by="Count_AnimalName",ascending=False)print(df)统计狗的名字大于800的数据df = df[df["Count_AnimalName"]>800]pr原创 2020-08-04 17:39:33 · 140 阅读 · 0 评论 -
pandas之Series 一维数组(一)
pandas的常用数据类型1.Series 一维,带标签数组2.DataFrame 二维,Series容器创建Series 一维数组import pandas as pd# 创建Series 一维数组t1 = pd.Series([1,2,3,4,5,6])print(t1)0 11 22 33 44 55 6dtype: int64Series 一维数组的类型# Series 一维数组的类型print(type(t1)) //<原创 2020-08-04 17:35:33 · 1462 阅读 · 0 评论