![](https://img-blog.csdnimg.cn/20201014180756780.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据分析
文章平均质量分 64
hifuture_
这个作者很懒,什么都没留下…
展开
-
动手学数据分析5-数据建模及模型评估
数据建模及模型评估 数据分析的目的就是,运用数据结合业务来得到得到或评估我们需要知道的结果。经过前面的学习,我们学会了数据清洗,可视化等操作。下面我们来进行数据建模,搭建一个预测模型或者其他模型,从这个模型的到结果,我们还要分析模型是不是足够的可靠,也就是评估这个模型。 我们利用泰坦尼克号的数据集,来完成泰坦尼克号存活预测任务。 数据建模 # 读取原数据数集 train = pd.read_csv('train.csv') train.shape 我们利用前面数据清洗的方法对原始数据进行清洗 去除无用的原创 2021-06-22 23:55:08 · 1040 阅读 · 0 评论 -
动手学数据分析4-数据可视化
数据可视化原创 2021-06-21 22:30:11 · 126 阅读 · 0 评论 -
动手学数据分析3-数据重构
数据重构 一、数据合并 我们将之前的train.csv分成了四部分 前左(left-up) 前右(right-up) 后左(left-down) 后右 (right-down) text_left_up = pd.read_csv("data/train-left-up.csv") text_left_down = pd.read_csv("data/train-left-down.csv") text_right_up = pd.read_csv("data/train-rig原创 2021-06-19 16:49:06 · 146 阅读 · 0 评论 -
动手学数据分析2-数据清洗及特征处理
数据清洗 在把数据拿来做分析前,通常我们要做数据清洗,因为我们拿到的原始数据通常是不干净的,所谓的不干净,就是数据中有异常值,缺失值或存在不能直接使用的值等,需要经过一定的处理才能继续做分析或建模。所以拿到数据的第一步是进行数据清洗,对缺失值、重复值、字符串等做数据清理转换等操作,将数据清洗成可以分析或建模的样子。 观察缺失值 import numpy as np import pandas as pd df = pd.read_csv("train.csv") # 通过info查看数据信息 df.info原创 2021-06-17 21:56:53 · 290 阅读 · 0 评论 -
动手学数据分析1-数据加载及探索性数据分析
动手学数据分析1-数据加载及探索性数据分析 数据加载 # 导入numpy和pandas import numpy as np import pandas as pd # 读入整个csv文件数据 df = pd.read_csv('train.csv') # 显示前5条 print(df.head(5) # 也可以按每100为一个数据模块,逐块读取 chunker=pd.read_csv("train.csv",chunksize=100) while True: try: df=原创 2021-06-14 14:31:12 · 106 阅读 · 1 评论