pandas
文章平均质量分 81
A♥海星星
这个作者很懒,什么都没留下…
展开
-
anaconda的安装与环境配置和
因为近期要学习Python数据分析,所以把安装anaconda的配置方法和JupyterNotebook使用教程记录一下,方便后期复习,部分内容来自网络。安装后直接下一步知道安装完成,注意下图中对钩都打上。========================================================================= 不要关闭终端否则会断开连接......原创 2022-06-15 16:10:43 · 240 阅读 · 0 评论 -
去除重复数据、查重
#需求:去除重复数据#1、导入包import pandas as pd#2、找到文件s = pd.read_excel(r"D:\pythonProject\Pandas玩转Excel-源" r"代码\代码\020\Students_Duplicates.xlsx")#3、用drop_duplicates方法# s.drop_duplicates(subset="Name",inplace=True)#查重复,返回True or Falsedupe =原创 2020-12-11 12:26:56 · 185 阅读 · 0 评论 -
求每行每列的平均值和总和
#需求:求分数的平均值和总和#1、导入包import pandas as pds = pd.read_excel(r"D:\pythonProject\Pandas玩转Excel-" r"源代码\代码\019\Students.xlsx",index_col="ID")#2、择需要计算的列temp = s[["Test_1","Test_2","Test_3"]]#3、新建一列,axis选按行计算平均值s["和"] = temp.sum(axis=1)s原创 2020-12-11 11:23:47 · 701 阅读 · 0 评论 -
分割单元格
#需求:分割单元格#1、导入包import pandas as pd#2、使用split,因为列表都有ID,所以使用自己设定的IDe =pd.read_excel(r"D:\pythonProject\Pandas玩转Excel" r"-源代码\代码\018\Employees.xlsx",index_col="ID")df = e["Full Name"].str.split(expand=True)#3、分割后是列表形式,取其中的值,expand 是个啥?原创 2020-12-11 06:12:44 · 188 阅读 · 0 评论 -
校验数值是否在范围内
#校验数据是否正确#1、导入包import pandas as pd#2、制定正确的数据范围,以及错误提示,row.Score啥意思?def pd_error(row): try: assert 0<=row.Score<=100 except: print(f"#{row.ID}\terror")#2.1也可以用if '''if not 0<=row.Score<=100: print(f"#{row.I原创 2020-12-11 05:49:23 · 449 阅读 · 0 评论 -
在sheet1里查询sheet2的值
#需求:在sheet1里查询sheet2的值,没有填0import pandas as pdstudens = pd.read_excel(r"D:\pythonProject\Pandas玩转Excel-源代码" r"\代码\016\Student_Score.xlsx",sheet_name="Students")scores = pd.read_excel(r"D:\pythonProject\Pandas玩转Excel-源代码"原创 2020-12-11 05:10:05 · 537 阅读 · 0 评论 -
趋势图
#趋势图叠加#趋势图import pandas as pdimport matplotlib.pyplot as pltw = pd.read_excel(r"D:\pythonProject\Pandas玩转Excel-源代码\代码\013\Orders.xlsx",index_col="Week")print(w)print(w.columns)#趋势图的标签,aree叠加,去掉就是相对独立的。线条颜色可变w.plot.area(y=['Accessories', 'Bikes', '原创 2020-12-06 07:52:17 · 239 阅读 · 0 评论 -
饼图
饼图和柱状图的区别还没想好#饼图import pandas as pdimport matplotlib.pyplot as plts = pd.read_excel(r"D:\pythonProject\Pandas玩转Excel-源代码\代码\012\Students.xlsx")#绘图,排序,开始角度s['2017'].sort_values().plot.pie(fontsize=8,startangle=-270)#添加标题,设置字体plt.title("人口分布图",font原创 2020-12-06 07:20:20 · 106 阅读 · 0 评论 -
叠加柱状图,竖向横向
#叠加柱状图import pandas as pdimport matplotlib.pyplot as pltuser = pd.read_excel(r"D:\pythonProject\Pandas玩转Excel-源代码\代码\011\Users.xlsx")#新增求和列user['Total'] = user['Oct']+user['Nov']+user['Dec']#按求和列排序,ascending=横向时有它是从小到达,所以去掉user.sort_values(by='Tota原创 2020-12-06 07:00:48 · 434 阅读 · 0 评论 -
深度优化柱状图
# 深度优化柱状图import matplotlib.pyplot as pltdf = pd.read_excel("D:\pythonProject\Pandas玩转Excel-源代码\代码\Students.xlsx")#排序df.sort_values(by="2017",inplace=True,ascending=False)#导入数据df.plot.bar(x="Field",y=["2016","2017"],color=["orange","red"])#设置标题样式plt原创 2020-12-06 06:42:49 · 206 阅读 · 0 评论 -
筛选-排序-初期柱状图
#需求: # 升序排列#sort_values()排序函数,df.sort_values(by="wh",inplace=True,ascending=False)#多条件排序df.sort_values(by=["car","和"],inplace=True,ascending=[True,False]) print(df) #筛选df = pd.read_excel("D:\pythonProject\Pandas玩转Excel-源代码\代码\Students.xlsx",inde原创 2020-12-04 06:27:07 · 171 阅读 · 0 评论 -
pandas基础一
#创建excel文件#导入包import pandas as pd#写入针文件,数据形式:列表嵌套df = pd.DataFrame({"ID":[1,2,3],"Name":["tim","vdio","sing"]})#重置ID列,set_index会创建的,副本df = df.set_index("ID")#方法2df.set_index("ID",inplace=True)#保存df.to_excel("pandas练习.xlsx")print(df)#读取#读取,ind原创 2020-12-04 04:30:37 · 209 阅读 · 0 评论