- 博客(7)
- 问答 (1)
- 收藏
- 关注
原创 RFM模型——数据实操
原理:通过用户的行为对用户进行分层,3个维度:R最近一次,F:频次,M:金额。数据清洗:RFM取值的离散化处理,原理看懂了。实操还不行。待定。
2021-08-23 00:28:42 223
原创 python 0基础学数据分析-数据可视化
调用新的库:matplotlib介绍:matplotlib官方文档pdf_Matplotlib数据可视化:入门及组件介绍_weixin_39860201的博客-CSDN博客Usage Guide — Matplotlib 3.4.2 documentation%matplotlib inlineimport numpy as npimport pandas as pdimport matplotlib.pyplot as plttext = pd.read_csv(r'result.cs.
2021-07-19 21:56:12 96
原创 python0基础学数据分析-数据清洗
重点:1.缺失值空值的处理1.1空值的查看函数: df[df.Cabin.isna()]info()isnull().sum()1.2空值处理1.2.1空值的删除 函数:dropna()1.2.2空值的替换 函数:df[df['Age']==None]=0df[df['Age'].isnull()] = 0df[df['Age'] == np.nan] = 0df[df.Age.isna()]注意:空缺值的数据类型为float64所以用None一般索引不到,比
2021-07-17 22:56:12 317
原创 python0基础学数据分析-第二单元
第二章:第一节数据清洗及特征处理重点:空值,重复值的统计第二章:第二节数据清洗及特征处理重点部分:表合并的函数concatjoinappend#表横向拼接:使用concat( ,axis=1)方法:将数据train-left-up.csv和train-right-up.csv横向axis=1合并为一张表,并保存这张表为result_uplist_up = [text_left_up,text_right_up]result_up = pd.conc...
2021-07-16 00:41:17 144
原创 python0基础学数据分析
一、数据载入及初步观察import numpy as npimport pandas as pd#绝对路径载入数据df = pd.read_csv(r'C:\Users\didi\Documents\python\hands-on-data-analysis-master\第二章项目集合\train.csv')df.head(3)附加部分:自动直接打开一个文件夹里的所有excelimport osdir = '文件夹路径'list = os.listdir(dir) # 列出文件夹
2021-07-13 17:06:33 90
空空如也
python数据分析:null、np.nan 和isnull() 的空值替换问题
2022-03-08
TA创建的收藏夹 TA关注的收藏夹
TA关注的人