![](https://img-blog.csdnimg.cn/20201014180756757.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据分析
文章平均质量分 53
champion-yang
这个作者很懒,什么都没留下…
展开
-
pandas可视化图表操作
def _boxplot(): """ 箱线图:分析年龄分布。 """ import pandas as pd import matplotlib.pyplot as plt train = pd.read_csv('./titanic.csv', encoding="gbk") any(train.age.isnull()) # 检查年龄是否有缺失 # train.dropna(subset=["age"], inplace=True) # 删除含有缺失.原创 2020-07-08 13:50:11 · 343 阅读 · 0 评论 -
数据分析-数据处理-pandas处理特征值重复的数据
import pandas as pddf = pd.read_csv('H:/JupyterWork/数据分析/数据分析概述/datafile/data4.csv', sep=',', encoding='gbk')df = df.fillna(method='ffill')df.loc[0,'k3'] = 11k5 = df.insert(4,'k5',df['k4'])# 求...原创 2020-02-06 15:11:05 · 982 阅读 · 0 评论 -
数据分析-数据处理-pandas处理重复值
# 处理重复数据import pandas as pd# 创建一个具有重复数据的DataFrame对象df = pd.DataFrame({'k1':["one", "two"]*3+["two"]*2, "k2":[1,1,2,3,3,4,4,4]})df k1 k2 0 ...原创 2020-02-04 19:01:23 · 1045 阅读 · 0 评论 -
数据分析-数据处理-pandas处理缺失值
缺失值处理找出缺失值# 处理缺失值import pandas as pdimport numpy as np# 创建含有缺失值的DateFramedf = pd.DataFrame(np.random.randn(10,6))df.iloc[:4, 1] = Nonedf.iloc[:2, 4:6] = Nonedf.iloc[6, 3:5] = Nonedf.iloc[8,...原创 2020-02-04 19:00:25 · 305 阅读 · 0 评论 -
数据分析-pandas处理json文件
data_dict = { "zs":{ "name": "zs", "addr": "sx", "age": 23, "hobbies": [ "basketball", "billiards", ...原创 2020-02-04 18:57:55 · 883 阅读 · 0 评论 -
数据分析-pandas处理excel文件
import pandas as pddf = pd.read_excel('datafile/文件名.xlsx')# sheet_name 读取指定的表 str, int, list, 默认为0df.loc(:5, ["name1","name2"])# 将读取出来的数据进行截取 前 5 行 , 列名为 name1, name2 的列...原创 2020-02-04 18:56:45 · 187 阅读 · 0 评论 -
数据分析-pandas存储文本文件
import pandas as pddf = pd.read_csv('datafile/data4.csv')print(df) k1 k2 k3 k40 one a 1.0 11.01 one b 2.0 NaN2 one c 3.0 13.03 one d NaN 14.04 one e 5.0 15.05 ...原创 2020-02-04 18:54:48 · 479 阅读 · 0 评论 -
数据分析-pandas读取文本文件
import pandas as pddf = pd.read_csv('datafile/data1.csv')# 有标题行print(df) a b c d e total0 1 12 23 42 223 3011 453 4 7 34 453 9512 453 7 5 78 3 54...原创 2020-02-04 18:53:02 · 742 阅读 · 0 评论 -
数据分析 -- python 处理 csv 文件 和 json 文件
任重而道远本实例依旧参考 《python 数据分析》import csvcsvfile = open('data-text.csv', 'r')# 这样读出来的文件是数组格式# reader = csv.reader(csvfile)# 转化为 python 的字典格式reader = csv.DictReader(csvfile)for row in reader:...原创 2020-01-28 12:17:01 · 229 阅读 · 0 评论 -
数据分析 -- python 读取 excel 文件 输出 json 格式数据
这个春节好无聊啊,流感不能出门,所以在家学数据分析咯# 使用 xlrd 模块速去 xlsx 文件import xlrd# windows 下使用绝对路径的方式打开文件,相对路径的方式我不知为何打不开book = xlrd.open_workbook(r'C:\Users\Champion\Desktop\vscode\holiday_demo\excel\SOWC 2014 Stat ...原创 2020-01-27 23:10:21 · 554 阅读 · 0 评论