AI训练营金融风控Task2 数据分析部分学习笔记

本学习笔记为阿里云天池龙珠计划金融风控训练营的学习内容,学习链接为:https://tianchi.aliyun.com/specials/activity/promotion/aicampfr

一、 学习知识点概要

EDA(Exploratory Data Analysis)相关步骤:

  • 数据总览
    • 读取数据
    • 查看异常值(缺失值、唯一值)
  • 数据分布
  • 数据间的关系

二、学习内容

  1. 读取文件
    # 调用pandas库读取csv文件,os.getcwd()
    import pandas as pd
    data = pd.read_csv("data.csv")
    
    Tips:
TSVCSV
分割符\t,
python参数delimiter=’\t’默认
  1. 查看样本数和维度
# 查看样本数和维度
data.shape
#查看列名
data.columns
# 查看每列的数据类型
data.info()
# 查看各特征的基本统计量(mean,count,std,min,max等)
data.describe()
  1. 查看缺失值
# 计算有几列特征值有缺失值
data.isnull().any().sum()

三、学习问题与解答

四、学习思考与总结

数据探索性分析初步了解数据,熟悉数据为特征工程做准备的阶段,甚至很多时候EDA阶段提取出来的特征可以直接当作规则来用。可见EDA的重要性,这个阶段的主要工作还是借助于各个简单的统计量来对数据整体的了解,分析各个类型变量相互之间的关系,以及用合适的图形可视化出来直观观察。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

没有人给他写信的牡丹程序猿

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值