pandas
文章平均质量分 63
aka.炼金术士
这个作者很懒,什么都没留下…
展开
-
pandas进行时间处理
pandas处理横向时间数组,并计算时间间隔原创 2022-05-20 09:38:47 · 437 阅读 · 0 评论 -
pandas复习(3)
pandas一些操作去重df_unique = df.drop_duplicates(['A'], keep='last') # 根据A去重只留下最后一次出现的隔行取数据方法1:每隔20行取数,把每20行的id取出来a=[]for i in range(0,len(df),20): a.append(i) new_df= df.iloc[a]方法2:直接调用read_csv()里的参数skiprowsdf = pd.read_csv('test.csv',header =原创 2022-04-19 08:33:10 · 152 阅读 · 0 评论 -
数据分析——泰坦尼克号预测
之前在学校做过课程设计,但是对流程比较一知半解,现在看完了机器学习实战这本书,带着自己的理解重新做一遍。import pandas as pdimport numpy as npimport matplotlib.pyplot as plt数据导入观察数据的具体情况,可以发现年龄变量Age和Cabin有缺失,然后Name,sex,Ticket,cabin和Embark是object类型,在后续的数据处理中要进行调整。data_train = pd.read_csv(r'C:/Users/ly-原创 2022-04-09 09:20:48 · 1622 阅读 · 0 评论 -
pandas复习(2)
pandas用法(学习自用)原创 2022-03-08 19:28:49 · 1126 阅读 · 0 评论 -
大数据处理知识点总结
大数据处理知识点一.Request库基础知识二.Numpy和Pandas库基础一.Request库基础知识方法说明返回对象.request ()构造请求.get()获取HTML网页,对应HTTP的GET返回的response对象包含服务器的所有资源.head()获取网页头信息,对应HEAD.post()提交POST请求.put()提交PUT请求.patch()提交局部修改请求,对应PATCH.delete()提交删除请求原创 2021-05-24 16:36:00 · 509 阅读 · 0 评论 -
数据分析——员工离职预测
员工离职预测一. 题目描述二. 数据说明三. 步骤实现1.导入并查看2.数据探索性分析3.数据处理4.模型分析5.结果分析(1) 可视化的结果分析(2)特征选择结果分析(3)多模型交叉验证结果分析一. 题目描述员工是否准备离职是困扰用人单位的问题,其关系到单位业务的开展及新人员的招聘,及时的分析出有离职倾向的员工成为关键的因素。数据主要包括影响员工离职的各种因素(工资、出差、工作环境满意度、工作投入度、是否加班、是否升职、工资提升比例等)以及员工是否已经离职的对应记录。二. 数据说明数据分为训练数据原创 2021-04-05 12:57:05 · 12145 阅读 · 31 评论 -
Pandas复习(1)
1.数据导入df=pd.read_csv('Pokemon.csv',encoding="ISO-8859-1")df.head()2.查看数据df.shapedf.shape[0]df.shape[1]df.columns #列名df.index #行名df.dtypesdf.head()df.tail()df.sample()df.describe()pd.set_option('max_colwidth',8) #设置每一行的最大宽度,恢复原设置方法pd.reset_o原创 2021-04-04 17:10:04 · 116 阅读 · 0 评论