数据预处理

一般例如json数据可以用Pandas进行数据处理
with open('xxx.json','r', encoding = 'utf-8') as filename

import json
import pandas as pd
# 读取JSON文件, utf-8保留中文
with open('json/prompt.json', 'r', encoding='utf-8') as file:
    data = json.load(file)
# 存储提取的内容
extracted_data = []

# 遍历
for item in data:
	if item['kwargs'] != "{}":  # 或者 if 'kwargs' in item:
		kwargs_dict = item
		extracted_data.append(kwargs_dict)

# 写入新的JSON文件,可以同时写多个,ensure_ascii false保留中文,index 缩进4格
with open('new1.json','w',encoding = 'utf-8') as newfile1, with open ('new2.json','w',encoding = 'utf-8') as newfile2:
	json.dump(extracted_data, newfile1, ensure_ascii = False, index = 4)

# df格式
df = pd.DataFrame(data)
# csv保存
# 如果需要保存为CSV文件
df.to_csv('output.csv', index=False, encoding='utf-8') # 此处index是索引,,不包含索引
		

Pandas DataFrame 提供了丰富的数据处理和查看方法。以下是一些常见的方法和示例代码:

查看数据

  1. 查看前几行数据

    df.head()
    

    查看前5行数据。

  2. 查看后几行数据

    df.tail()
    

    查看后5行数据。

  3. 查看数据的基本信息

    df.info()
    

    显示数据类型、非空值计数等信息。

  4. 查看描述性统计信息

    df.describe()
    

    显示数据的统计信息,如平均值、标准差等。

处理缺失值

  1. 查找缺失值

    df.isnull().sum()
    

    查看每列缺失值的数量。

  2. 删除包含缺失值的行

    df.dropna()
    

    删除包含任何缺失值的行。

  3. 填充缺失值

    df.fillna(value)
    

    用指定值填充缺失值。例如,用0填充:

    df.fillna(0)
    

数据选择与过滤

  1. 选择列

    df['column_name']
    

    选择单列数据。

    df[['column1', 'column2']]
    

    选择多列数据。

  2. 选择行

    使用行索引选择行:

    df.loc[0]
    

    使用条件过滤行:

    df[df['column_name'] > value]
    

数据操作

  1. 添加新列

    df['new_column'] = df['column1'] + df['column2']
    
  2. 删除列

    df.drop(columns=['column_name'])
    
  3. 重命名列

    df.rename(columns={'old_name': 'new_name'}, inplace=True)
    
  4. 数据排序

    df.sort_values(by='column_name', ascending=False)
    

数据合并

  1. 按列合并

    df1.merge(df2, on='common_column')
    
  2. 按行合并

    pd.concat([df1, df2])
    
  • 9
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
校园失物招领系统管理系统按照操作主体分为管理员和用户。管理员的功能包括字典管理、论坛管理、公告信息管理、失物招领管理、失物认领管理、寻物启示管理、寻物认领管理、用户管理、管理员管理。用户的功能等。该系统采用了Mysql数据库,Java语言,Spring Boot框架等技术进行编程实现。 校园失物招领系统管理系统可以提高校园失物招领系统信息管理问题的解决效率,优化校园失物招领系统信息处理流程,保证校园失物招领系统信息数据的安全,它是一个非常可靠,非常安全的应用程序。 ,管理员权限操作的功能包括管理公告,管理校园失物招领系统信息,包括失物招领管理,培训管理,寻物启事管理,薪资管理等,可以管理公告。 失物招领管理界面,管理员在失物招领管理界面中可以对界面中显示,可以对失物招领信息的失物招领状态进行查看,可以添加新的失物招领信息等。寻物启事管理界面,管理员在寻物启事管理界面中查看寻物启事种类信息,寻物启事描述信息,新增寻物启事信息等。公告管理界面,管理员在公告管理界面中新增公告,可以删除公告。公告类型管理界面,管理员在公告类型管理界面查看公告的工作状态,可以对公告的数据进行导出,可以添加新公告的信息,可以编辑公告信息,删除公告信息。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值