import pandas as pd
import numpy as np
from pandas_profiling import ProfileReport #数据分析新模块
df = pd.read_csv('./data/1#FJ.csv')# 读取csv文档
df.v = df.v.astype('str')# 转换df中['v']的数据类型,int,float64,float32...
df['Price'] = df.apply(lambda x: (x['v'].replace('.', '')),axis=1)# 将df中['v']中的小数点去掉,df.v中数据需是str类型
#数据分析
df.describe(include='all')# 数据分析:中位数、最大最小值等
profile = ProfileReport(df)# 进阶版数据分析工具
profile.to_file("./data/Analysis.html")# 输出html格式分析文档
pandas数据分析工具-pandas_profiling
最新推荐文章于 2024-04-25 09:33:18 发布
该博客介绍了使用Python的pandas库进行数据读取和类型转换,通过`df.replace()`方法去除数值中的小数点,然后利用`df.apply()`函数进行数据处理。此外,运用pandas_profiling进行高级数据分析,生成了详细的报告并保存为HTML文件,便于进一步的数据探索和理解。
摘要由CSDN通过智能技术生成