数据科学
学点统计学,AI,数据科学
waynechard
这个作者很懒,什么都没留下…
展开
-
Data Visualization—group boxplot, seaborn
# 使用seaborn画出分组的boxplotimport matplotlib as pltimport seaborn as snssns.boxplot(x='group', y='values', data=df)# longterm dataimport pandas as pdimport numpy as npimport matplotlib as pltimport seaborn as sns#create long-form datadf = pd..原创 2021-11-26 13:53:01 · 966 阅读 · 0 评论 -
Pandas_常用操作集合
# 删除某一列del df['sub_grade_x']df= df.drop('column_name', 1)原创 2021-11-15 11:29:57 · 226 阅读 · 0 评论 -
Pandas_C3_分组cheat sheet
总览1. groupby2. 聚合,过滤与变换3. apply细节1. groupby# groupby# 按着某一列进行分组grouped_single = df.groupby('School')# 分组之后选取某一个特定的组grouped_single.get_group('S_1').head()# 按照多列进行分组grouped_mul = df.groupby(['School','Class'])# 多列分组之后选取某一个特定的组grouped_mul原创 2021-10-26 17:17:50 · 67 阅读 · 0 评论 -
Pandas_C2_数据索引cheat sheet
总览1. 单级索引2. 多级索引3. 索引设定4. 常用索引型函数5. 重复数值处理6. 抽样函数细节1. 单级索引# loc方法行操作df.loc[1103]df.loc[[1102,2304]]df.loc[1304:2103].head() # loc的选择是左右都闭的df.loc[2402::-1].head()列操作df.loc[:,'Height'].head()df.loc[:,['Height','Math']].head()df.lo原创 2021-10-22 14:10:50 · 103 阅读 · 0 评论 -
Pandas_C1_数据文件存取以及数据探索cheat sheet
总览:1. 数据的读取与写入2. 基本数据结构3. 常用的基本函数及操作4. 排序细节:1. 数据的读取与写入读取为dfdf = pd.read_csv('data/table.csv')df_txt = pd.read_table('data/table.txt') #可设置sep分隔符参数df_excel = pd.read_excel('data/table.xlsx')写出df.to_csv('data/new_table.csv')df.to_excel原创 2021-10-21 17:48:49 · 94 阅读 · 0 评论 -
SQL50题
测试表格--1.学生表Student(S#,Sname,Sage,Ssex)--S# 学生编号,Sname 学生姓名,Sage 出生年月,Ssex 学生性别--2.课程表Course(C#,Cname,T#)--C# --课程编号,Cname 课程名称,T# 教师编号--3.教师表Teacher(T#,Tname)--T# 教师编号,Tname 教师姓名--4.成绩表SC(S#,C#,score)--S# 学生编号,C# 课程编原创 2021-10-14 09:15:37 · 86 阅读 · 0 评论 -
Jupyter Notebook笔记本的两种模式
Jupyter Notebook笔记本的两种模式快捷键notebook 自带一组快捷键,能让你快速使用键盘与单元格交互,而无需使用鼠标和工具栏。熟悉这些快捷键需要花费一点时间,但如果能熟练掌握,将大大加快你在 notebook 中的工作速度。所有的快捷键就不在这里展示了,因为这些快捷键可以通过单元格 蓝色 状态下按 "h" 来查看:① 命令模式命令模式将键盘命令与Jupyter Notebook笔记本命令相结合,可以通过键盘不同键的组合运行笔记本的命令。 按esc键进入命令模式。原创 2021-10-14 09:09:29 · 1179 阅读 · 0 评论