动手学数据分析
佛系
研究方向:序列推荐算法
应届毕业生一枚,学习后端中~
展开
-
第二章:第二节数据重构1
复习:在前面我们已经学习了Pandas基础,第二章我们开始进入数据分析的业务部分,在第二章第一节的内容中,我们学习了数据的清洗,这一部分十分重要,只有数据变得相对干净,我们之后对数据的分析才可以更有力。而这一节,我们要做的是数据重构,数据重构依旧属于数据理解(准备)的范围。# 导入基本库import numpy as npimport pandas as pd# 载入data文件中的:train-left-up.csvtext = pd.read_csv('/Users/chenandong/D原创 2020-08-23 23:53:53 · 198 阅读 · 0 评论 -
动手学数据分析-task2数据清洗及特征处理
数据分析主要是包括:数据清洗数据的特征处理数据重构数据可视化开始之前,导入numpy、pandas包和数据#加载所需的库import numpy as npimport pandas as pd#加载数据train.csvtrain_data = pd.read_csv('../titanic/train.csv')2 数据清洗及特征处理我们拿到的数据通常是不干净的,所谓的不干净,就是数据中有缺失值,有一些异常点等,需要经过一定的处理才能继续做后面的分析或建模,所以拿到数据的原创 2020-08-22 01:57:52 · 278 阅读 · 0 评论 -
动手学数据分析——Task01_数据加载
前言这是一门诞生于datawhale的课程,学习它的时候搭配datawhale所配备其他资源会更好,项目地址:https://github.com/datawhalechina/hands-on-data-analysis数据集下载:https://www.kaggle.com/c/titanic/overviewimport numpy as npimport pandas as pdimport osos.getcwd()'C:\\Users\\lyj\\Desktop\\pyproj原创 2020-08-16 17:55:34 · 615 阅读 · 0 评论