![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Da
weixin_45827577
这个作者很懒,什么都没留下…
展开
-
2021-6-23
import pandas as pd import numpy as np import seaborn as sns import matplotlib.pyplot as plt from IPython.display import Image #读取训练数据集 train = pd.read_csv(‘C:/Users/L/Desktop/da_data/part3/train.csv’) train.head() 缺失值填充 对分类变量缺失值:填充某个缺失值字符(NA)、用最多的类别进行填充原创 2021-06-23 22:36:57 · 77 阅读 · 0 评论 -
6-21matplotlib
import numpy as np import pandas as pd import matplotlib.pyplot as plt text = pd.read_csv(‘C:/Users/L/Desktop/da_data/part2/data/result.csv’) text.head() #柱状图 sex = text.groupby(‘Sex’)[‘Survived’].sum() sex.plot.bar()原创 2021-06-21 21:36:26 · 31 阅读 · 0 评论 -
数据重构6-18
数据的合并 1.concat方向链接 2.join 3.merge 4.append import numpy as np import pandas as pd #载入数据 text_left_up = pd.read_csv(‘C:/Users/L/Desktop/da_data/part2/data/train-left-up.csv’) text_right_up = pd.read_csv(‘C:/Users/L/Desktop/da_data/part2/data/train-right-up.原创 2021-06-19 22:12:23 · 58 阅读 · 0 评论 -
2021-06-17
#加载所需数据库 import numpy as np import pandas as pd #加载数据 df = pd.read_csv(‘C:/Users/L/Desktop/da_data/part 1/train.csv’) df.head() 一.缺失值观察与处理 1.缺失值观察 df.info() dataframe 使用 series不可使用 df.isnull().sum() 2.缺失值处理 删除 df.dropna() 填充 df.fillna() 二.重复值观察与处理 1.重复原创 2021-06-17 21:27:18 · 82 阅读 · 0 评论 -
2021-06-14
Part 1 数据加载 、、、 //address = ‘C:/Users/L/Desktop/da_data/part 1/train.csv’ df = pd.read_csv(address,names = [‘乘客ID’,‘是否幸存’,‘仓位等级’,‘姓名’,‘性别’,‘年龄’,‘兄弟姐妹个数’,‘父母子女个数’,‘船票信息’,‘票价’,‘客舱’,‘登船港口’],index_col = ‘乘客ID’,header = 0) df.head() address = ‘C:/Users/L/Deskto原创 2021-06-15 22:20:34 · 67 阅读 · 0 评论