JSON和CSV文件

本文介绍了如何使用Python的pandas库处理JSON和CSV文件,包括JSON对象和数组的解析,以及如何将这些数据转换为pandasDataFrame以便进行数据分析和操作。
摘要由CSDN通过智能技术生成

1、JSON文件

//JSON
//json对象(只能是字符串作为键(键不能重复,必须双引号包围),值可以为:字符串、数字、布尔值(true/false)、数组、对象、空值(null))->字典
{
    "id":"1",
    "type":"article",
    "title":"working with JSON data",
    "created":"2099-12-18T14:56:29.000Z"
}
//json数组(值可以为:字符串、数字、布尔值(true/false)、数组、对象、空值(null)->列表
[
    {
        
    },
    {
        
    }
]
//解析+转换(pandas):JSON数据->python数据(DataFrame)
import pandas as pd
wenjian = pd.read_json("文件路径")

2、CSV文件

//csv(类似于二维表,像一个表格,体积小)
# 姓名,考试1,考试2,考试3
# 小陈,85,95,92
# 小李,91,92,94
# 小王,86,81,89
注意:txt、csv、json都是纯文本
//用pandas转换为csv(用于大量数据集,可以看前几行)
import pandas as pd
df = pd_read_csv("csv文件路径")//读取csv文件
df = pd_read_csv("csv文件路径",header=None)//默认没有列名
df = pd_read_csv("csv文件路径",index_col="player_id")//把某一列作为标签索引
pd.set_option("display.max_columns",150)//当有很多列时导致展示不全,可以指定展示多少列将数据展示全
pd.set_option("display_max_colwidth",500)//当值很长时导致展示不全,用该方法规定将值小于500的都展示出来
df.head(3)//获取前3行(默认5行)
df.tail(2)//获取结尾2行(默认5行)
df.info()//获得DataFrame的概况(类型、索引的范围、列的数量等等)
df.describe()//计算DataFrame的统计信息(最大值、最小值、平均值等等)
df.sample(10)//选出随机选出的多行
  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值