PU数据集CSV文件（格式已经准备好）PU数据集转CSV

qq_35676389

已于 2025-03-04 13:08:00 修改

阅读量215

点赞数 4

文章标签： python 算法

于 2025-03-04 10:29:25 首次发布

本文链接：https://blog.csdn.net/qq_35676389/article/details/146007810

版权

很多做轴承故障诊断的小伙伴应该都遇到，PU数据集是.mat文件，里面有很多层。对于大多数新手来说，转为.csv文件容易遇到很多问题。这里直接给大家准备好啦。

转出为振动信号，所有的数据都有。

点击链接获取：https://m.tb.cn/h.TvkY6Wv?tk=WXoNelVPLnq

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

qq_35676389

关注关注

4
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

全国大学生数据统计与分析竞赛2021年【本科组】-B题：基于 PU-bagging 与 Gini 决策树的用户行为预测与价值判别

getusushu的博客

07-27

394

本模型利用题目中已经购买用户的的数据，基于Bagging集成的算法对平台其余用户的购买决策做出预测，研究结果证明模型预测的正确率较高，泛化性能较好。与随机选取未购买用户样本及结合聚类方法选取未购买样本相比，基于PULearning的半监督学习方法充分利用了数据的特点，降低了将未标记样本直接作为负例样本进行训练带来的经验风险。而同时Bagging集成为模型的建立引入了随机因子，并通过对大量弱学习器的并行化结合，获得比单一学习器显著优越的泛化性能，PUBagging就是巧妙地利用。

大数据多维分析在电商行业的典型应用案例

最新发布

AI天才研究院

04-18

918

随着电子商务的快速发展，电商平台每天都会产生海量的用户行为数据、交易数据和商品数据。如何从这些数据中提取有价值的信息，支持业务决策，成为电商企业面临的重要挑战。大数据多维分析技术为解决这一问题提供了有效手段。本文旨在全面介绍大数据多维分析技术在电商行业的典型应用案例，包括技术原理、实现方法和实际应用。用户行为分析和画像构建个性化商品推荐系统库存优化和供应链管理销售预测和营销策略制定本文首先介绍大数据多维分析的核心概念和技术原理，然后深入探讨电商行业的典型应用案例。

1 条评论您还未登录，请先登录后发表或查看评论

将PU（帕德博恩）数据集处理为CSV并绘制时频图

Dkzlh的博客

01-15

2055

为方便deeplearner学习，将PU数据集（.mat）处理为csv格式并绘制时频图以观察数据特征

PU轴承数据集分析

3hex的博客

11-22

831

提取码: 1111。

PU帕德伯恩大学轴承数据集可视化

Bearingz的博客

03-10

878

选择部分PU帕德伯恩大学轴承数据文件的前2048个数据点进行可视化

帕德伯恩大学轴承数据集（PU）介绍

m0_47180208的博客

06-27

2万+

PU数据集介绍一、帕德伯恩大学轴承数据集故障类别说明二、关于损伤描述2.1 损伤组合：2.2 重复和多重损伤的安排:2.3 几何尺寸2.4 损伤程度2.5损伤特征数据集损伤类别三、人为损坏轴承3.1 最常用的人为损伤制造方法是：3.2 本数据集使用的人工损坏是由三种不同方法引起的四、通过加速寿命试验产生真正的轴承损坏样本一、帕德伯恩大学轴承数据集 数据集下载地址从帕德伯恩大学获得的PU数据集是一个6203轴承数据集，包括人为诱发的和真实的损害。采用压电加速度计采集轴承座的振动信号，采样频率为64 kHz

带标签的数据集转换成csv格式的标签

qq_16721557的博客

07-16

201

【代码】带标签的数据集转换成csv格式的标签。

制备高光谱与多光谱融合数据集Pavia University (PU) 用于CNMF算法融合教程

热爱分享，热爱记录

07-16

2177

高光谱与多光谱融合是遥感图像处理中的一个技术，用于结合高光谱图像和多光谱图像的优点，从而生成具有高空间分辨率和高光谱分辨率的图像。这种融合技术在遥感、环境监测、农业、城市规划等领域有着广泛的应用。高光谱图像 (HSI)特点：高光谱图像捕捉了光谱的许多细小波段，通常在几十到几百个波段之间，因此具有高光谱分辨率。优点：能够捕捉更多的光谱信息，有助于更准确地识别和分类不同的物质。缺点：空间分辨率较低，即图像的空间细节较少。多光谱图像 (MSI)特点。

从数据集读取原始PU信号数据（使用第1列前50000行信号进行实验），根据噪声信号生成原理，分别生成主用户信号H_1(正样本)和次用户信号 H_0（负样本）...

weixin_35755640的博客

12-31

425

你可以使用 Python 中的 pandas 库来读取数据集并选择前50000行信号。你可以这样做： import pandas as pd# 读取数据集 df = pd.read_csv("数据集路径") # 选择第1列并取前50000行信号 signal = df['第1列名称'][:50000] 根据噪声信号生成原理，可以使用相关的算法来生成主用户信号H_1和次用户信号 H_0。具体的生...

【数据分析报告】携程客户分析与流失预测

热门推荐

changreal的博客

08-11

7万+

目录一、项目背景与目的二、探索性分析2.1 数据指标预览2.2 数据概况2.3 数据分布2.3.1 数据分布总览2.3.2 预定日期和入住日期2.3.3 访问时间段2.3.4 客户价值2.3.5 消费能力指数2.3.6 价格敏感指数分布2.3.6 入住酒店平均价格2.3.7 酒店星级偏好2.3.8 订单取消率2.3.9 用户年订单数分布2.3.10 新老客户流失率三、数据预处理3.1 去除不需要的字段与重复字段3.2 数据类型转换3.3 异常值处理3.3.1负数处理3.3.2 极值处理3.4 缺失值处理3.

轴承数据，10种不同类型的轴承数据集

07-07

轴承数据集

基于CatBoost的推荐系统开发：实现智能化推荐

AI天才研究院

07-27

1100

将深度学习的特征表示能力与CatBoost的预测能力相结合，构建更加强大的推荐系统。利用强化学习技术，根据用户的实时反馈动态调整推荐策略，提升推荐效果。提高推荐系统的可解释性，增强用户对推荐结果的信任度。本文将通过详细介绍CatBoost的原理及实践应用，并结合实际场景案例，来全面剖析推荐系统的各个环节及其挑战。CatBoost是什么?为什么需要用CatBoost?如何使用CatBoost训练模型？使用CatBoost训练出来的模型怎么做推荐?为什么推荐效果不佳?有哪些原因?

Python 有哪些好的学习资料或者博客？

m0_57290404的博客

08-16

793

第一阶段：python基础入门黑马程序员最新Python教程，8天python从入门到精通，学python看这套就够了_哔哩哔哩_bilibili黑马程序员最新Python教程，8天python从入门到精通，学python看这套就够了共计110条视频，包括：Python导学视频、第一章-01-初识Python、第一章-02-什么是编程语言、第一章-03-Python环境安装(Windows)、第一章-04-【拓展】-Python环境安装(MacOS)、第一章-05-【拓展】-Python环境安装(Linu

PU-Learning

qq_20095389的博客

12-23

643

速读论文：Learning From Positive and Unlabeled Data: A Survey 从方法上讲，主要有两种。 two step: 先对数据用聚类或者任一相关算法分类（选出可信度高的neg案例），然后再放到任一分类网络里训练，然后再根据训练的结果分类未标记，再次训练，直到模型稳定或者loss较小。基于可分性和连续性假设 biased learning: 全部将未标...

故障诊断数据集研究

weixin_44749271的博客

11-20

3584

论文中的处理方法：取真实故障中的13类故障，每个mat文件中y方向的数据进行提取。一个文件的样子：N15_M07_F10_KA04_1.mat。

非常好！超齐全的故障诊断数据集及相关实验平台介绍

weixin_39458727的博客

02-27

1万+

故障诊断数据集库收集了故障诊断领域常用的轴承及齿轮箱数据集，对应每个数据集，在本篇概述中介绍了数据集的适用的场景 , 数据集采集实验台, 数据集的组成及其包含的样本类别。原始数据集数据读取及数据预处理API, 及其使用说明数据集说明文档数据集相关文献。

德国帕德博恩大学 Bearing DataCenter

weixin_39458727的博客

02-27

4736

数据下载链接：https://mb.uni-paderborn.de/kat/forschung/datacenter/bearing-datacenter/研究所和KAt-DataCenter链接的名称：Christian Lessmeier等，KAt-DataCenter：mb.uni-paderborn.de/kat/datacenter， PU数据集由Christian Lessmeier 等人提供，用于数据驱动的轴承故障诊断。

轴承图片数据集分类效果测试

weixin_50642818的博客

11-29

1932

前面展示了很多将一维数据二维图片化的方法，但是具体效果如何还待定，今天我把简单测试的结果放出来供大家参考。还有一种灰度图我觉得价值不大，因为它本质上是把一维数据乘以255后转化为图片，读取以后再除以255转换为原始二维数据。这是何苦呢，大家都只有一个通道，直接读取不就行了，何必换来换去的折腾。以上几种图我在之前的文章里都单独列举了，首先直观的看，小波和短时傅里叶的特征是最明显的，其他图片的特征目测已经不是一般人类能把握的了。

PU数据集解读

03-09

### PU 数据集介绍 PU 学习（Positive and Unlabeled learning），即正样本和未标记样本的学习，是一种特殊类型的半监督学习方法。在这种设置下，只有正类标签被提供给算法，而负类则完全未知或者混杂在未标注的数据集中[^1]。对于 PU 数据集而言，其主要特点在于只有一部分数据被认为是已知的正例，其余大部分都是来自混合分布的未标记样例集合。这些未标记的例子可能既包含真正的反面案例也可能隐藏着额外正面情况。因此，在构建 PU 数据库时，通常会遵循如下原则： - **正样本**：明确标识为属于目标分类的对象； - **未标记样本**：不确定类别归属的一组对象，其中一部分可能是正向实例也有可能是负面实例。这种结构使得 PU 数据集非常适合处理那些难以获得全面标注的情况，比如金融欺诈检测、医疗诊断等领域内的风险控制问题。 ### 应用实例分析以信贷审批为例来说明 PU 学习的应用场景。银行希望开发一种能够有效识别潜在违约客户的预测模型，但由于成本高昂以及隐私保护等原因，并不是所有的客户记录都能得到详尽审查并打上相应标签。此时可以采用 PU 方法来进行建模尝试——利用一小批已经确认过良好还款历史的优质借款人作为 “正样本”，加上大量未经审核的新申请者资料组成 “未标记样本”。通过这种方式建立起来的风险评估体系不仅能够在一定程度上弥补传统全量标注方式所带来的局限性，还具备更高的灵活性与适应能力。当面对不断变化市场环境下的新型威胁挑战时，基于 PU 的解决方案往往能展现出更优的表现特性。 ```python import numpy as np from sklearn.model_selection import train_test_split # 假设我们有一个二元分类任务的数据集 X 和 y， # 其中 y 中有两类：0 表示未标记, 1 表示正样本 X_positive = ... # 已知的正样本特征矩阵 y_positive = np.ones(len(X_positive)) # 对应的标签全部置为 1 X_unlabeled = ... # 未标记样本特征矩阵 y_unlabeled = np.zeros(len(X_unlabeled)) # 初始假设所有未标记都为负类 # 合并两个子集形成完整的训练集 X_train = np.vstack((X_positive, X_unlabeled)) y_train = np.hstack((y_positive, y_un labeled)) # 将数据划分为训练/测试两部分 X_train_final, X_test, y_train_final, y_test = train_test_split( X_train, y_train, test_size=0.2, random_state=42) print("Training set shape:", X_train_final.shape) print("Testing set shape:", X_test.shape) ```