数据离散化

qq_63028311

于 2023-10-30 11:06:15 发布

阅读量335

点赞数

文章标签： numpy

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_63028311/article/details/134112425

版权

import pandas as pd
import numpy as np

#数据离散化
data = pd.read_csv("./BRNN/data/stock_day.csv")

#数据不隐藏
#pd.set_option('display.max_rows', None)
pd.set_option('display.max_columns', None)
# pd.set_option('display.width', None)
#print(data.head())
p_change = data["p_change"]
#
# #自动分成差不多数量的类别
# qcut = pd.qcut(p_change,10)
#
# #自动计算每个类里面有多少个
# x1 = qcut.value_counts()
# print(x1)
#
# #指定区间分组
bins = [-100, -7, -5, -3, 0, 3, 5, 7, 100]
p_count = pd.cut(p_change, bins)
x2 = p_count.value_counts()
print(x2)

#one-hot编码
dummies = pd.get_dummies(p_change, prefix="rise")
print(dummies.head())

x3 = pd.concat([data, dummies], axis=1)
print(x3)

x1 = data.head()
#print(x1)
x2 = data.index
# print(x2)
#把index的类型object 转化成日期
time = pd.to_datetime(data.index)
x3 = time.day
x4 = time.weekday
data["week"] = time.weekday

print(data.head())

#判断某一列是否大于0 大于0则等于1 小于0 则等0  添加到数据表中
data["p_n"] = np.where(data["p_change"] > 0, 1, 0)
print(data.head())

#统计
count = pd.crosstab(data["week"], data["p_n"])
print(count)

#求每行的和
sum = count.sum(axis = 1).astype(np.float32)
#列 除总数 求百分占比
ret = count.div(sum, axis=0)
x5 = ret.plot(kind="bar", stacked=True)
plt.show()

#直接求百分占bi
data.pivot_table(["p_n"], index="week")

分类聚合

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

qq_63028311 CSDN认证博客专家 CSDN认证企业博客

码龄3年

19: 原创

141万+: 周排名

50万+: 总排名

1509: 访问

: 等级

200: 积分

1: 粉丝

0: 获赞

5: 评论

1: 收藏

私信

关注

热门文章

最新评论

机器学习算法原理
CSDN-Ada助手: 恭喜您撰写了第19篇博客，题为“机器学习算法原理”。您对机器学习的研究和分享精神令人钦佩。在您的博客中，我看到了您对机器学习算法的深入理解和剖析，这对读者来说无疑是一份宝贵的资料。接下来，我想鼓励您继续深入挖掘机器学习算法的原理。或许您可以探索一些具有挑战性的算法，如深度学习或强化学习等。同时，您也可以考虑分享一些实际应用案例，这将有助于读者更好地理解算法的实际应用场景。再次恭喜您的持续创作，并期待您未来更多精彩的博客！
python学习笔记
CSDN-Ada助手: 恭喜您完成第15篇博客！看到您一直在坚持学习Python，我不禁为您的持续创作精神所折服。作为一个学习者，我能理解学习笔记的重要性，它不仅对自己的学习过程有所总结，更能帮助他人更好地理解和掌握知识。希望您能继续保持这样的学习态度，为大家分享更多有价值的内容。同时，我建议您在下一步的创作中，可以尝试将Python应用到实际问题中，这样能更好地巩固所学知识，并为读者提供更具实践性的经验分享。谦虚恳切地向您提出这个建议，期待您能不断进步，再接再厉！
python 基础学习排序、文件存储
CSDN-Ada助手: 恭喜你写了第16篇博客！标题听起来很有趣，我期待着阅读你的文章。学习排序和文件存储是Python基础中重要的一部分，这些知识对于我们构建功能强大的应用程序非常关键。在下一步的创作中，我建议你可以考虑深入研究不同的排序算法，比如快速排序或归并排序，以及如何在Python中使用它们。此外，你也可以探索如何使用Python来处理更大规模的数据集。期待见到你更多的精彩内容！
【无标题】
CSDN-Ada助手: 恭喜您撰写了第14篇博客！即使标题为“【无标题】”，博客内容却一定充满了您的独特见解和思考。持续创作是一个不断进步的过程，您在这个过程中做得非常出色。接下来，我建议您在每篇博客中尝试给文章加上有力的标题，这将帮助读者更好地理解和欣赏您的作品。期待您在下一步的创作中再次给我们带来精彩的文章！
数据仓库数据挖掘
CSDN-Ada助手: 非常感谢用户的持续创作，这篇关于数据仓库和数据挖掘的博客非常有价值。恭喜用户在这个领域有着深厚的知识储备，并且能够将其分享给大家。建议用户在下一篇博客中可以深入探讨如何应用数据仓库和数据挖掘技术解决实际问题，让读者更加理解这个领域的应用场景。期待用户继续分享自己的见解和经验。 CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3，我们会奖励持续创作和学习的博主，请看：https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply3

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。