python 数据处理

数据处理需求:从smu获取的约为5000个点的电流数据中,为了清理掉可能混入的分时开启的点,需要去除掉瞬时电流过大过小的点,去除的数量可以配置。
例如:current2 = data_process(current =[],ratio=0.01)
参数:current待处理的电流值列表
ratio 去掉点的比例
返回值:current2 处理后的电流值列表

import pandas as pd
#定义过滤函数
def filter_current_values(current_values sigma_factor=3,iterations=3):
	for_in range(iterations):
		mean = current_values.mean()
		std = current_values.std()
		if std == θ:
			break 
		lower_bound = mean-sigma_factor*std
		upper_bound = mean + sigma_factor*std
		current_values current_values[(current_values > lower_bound)&(current_values < upper_bound)] 
		return current_values#返回过滤后的值,而不是平均值
#设置Excel文件路径
input_file_path ='C:\\test\15555.xlsx'#替换为您的Excel文件路径output_file_path ='C:\\test\\6666.xlsx'#輸出文件的路径
#读取Excel文件中的特定列数据
df = pd.read_excel(input_file_path,usecols='B',skiprows=1,nrows=5004,engine='openpyxl'
#将数据转换为数值类型,忽略非数值值
current_values = pd.to_numeric(df.iloc[:,0],errors='coerce'.dropna()
#过滤数据,得到一个Series
filtered_values = filter_current_values(current_values)
#准备一个新的DataFrame,其索引与过滤后的数据的索引相同
output_df = pd.DataFrame(index=filtered_values.index)
output_df['B']= filtered_values#将过滤后的数据放到'B'列
#将新DataFrame写入到新的Excel文件中
output_df.to_excel(output_file_path,index=False
  • 8
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
当然可以!Python是一种非常适合数据处理语言,它具有强大的库和工具,可以轻松地处理和分析数据。以下是一些Python数据处理项目的介绍和示例: 1. 数据清洗和预处理:数据清洗和预处理是数据处理过程中的重要步骤,可以帮助我们去除噪声、缺失值、重复值等,并准备数据以供进一步分析。一个常见的项目是使用Python中的Pandas库来清洗和处理CSV文件或Excel文件中的数据。 示例:假设你有一个包含多个CSV文件的文件夹,每个文件包含不同类型的数据。你可以使用Pandas库来读取这些文件,清洗和处理数据,并将它们合并成一个数据框。 2. 数据可视化:数据可视化是数据处理过程中的重要步骤之一,可以帮助我们更好地理解数据并发现其中的模式和趋势。Python中的Matplotlib和Seaborn库是常用的数据可视化工具,可以轻松地创建各种图表和图形。 示例:你可以使用Python中的Matplotlib库来创建散点图、折线图等,展示一组数据的变化趋势。 3. 数据分析:数据分析是数据处理过程中的另一个重要步骤,可以帮助我们发现数据中的模式、关联和趋势。Python中的Pandas和Scikit-learn库是常用的数据分析工具,可以轻松地执行各种统计分析和机器学习算法。 示例:你可以使用Pandas库来对一组数据进行描述性统计,并使用Scikit-learn库中的分类器进行分类分析。 4. 数据挖掘和机器学习:数据挖掘和机器学习是数据处理过程中的高级步骤,可以帮助我们从大量数据中提取有价值的信息并创建预测模型。Python中的Scikit-learn、TensorFlow和PyTorch等库是常用的数据挖掘和机器学习工具,可以轻松地实现各种算法和模型。 示例:你可以使用Python中的机器学习库来训练一个分类器模型,并根据一组预测变量预测另一组响应变量的值。 这些是一些常见的Python数据处理项目,但具体项目可以根据实际需求进行调整和扩展。需要注意的是,数据处理需要具备一定的编程知识和技能,以及相关领域的知识和经验。建议先了解Python的基本语法和库功能,再逐步深入学习和实践。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值