python中离散数据插到格点_Python 数据离散化

最新推荐文章于 2022-10-18 22:22:36 发布

weixin_39667797

最新推荐文章于 2022-10-18 22:22:36 发布

阅读量198

点赞数

文章标签： python中离散数据插到格点

本文链接：https://blog.csdn.net/weixin_39667797/article/details/111512626

版权

本文介绍了如何在Python中对离散数据进行处理，包括使用pandas的等宽离散化和等频离散化方法，以及通过KMeans聚类实现数据离散化。通过示例展示了数据分段效果，并用图表进行了可视化展示。

摘要由CSDN通过智能技术生成

import pandas as pd

data =

pd.read_excel(r"F:\BaiduYunDownload\python数据分析和挖掘实战\chapter4\chapter4\demo\data\discretization_data.xls")

data = data['肝气郁结证型系数']

k = 4

#等宽离散化

d1 = pd.cut(data, k, labels = range(k))

#等频离散化

w = [i/k for i in range(k+1)]

w = data.describe(percentiles = w)[4:4+k+1]

w[0] = w[0]*(1 - le - 10)

d2 = pd.cut(data, w, labels = range(k))

#(一维)聚类

from sklearn.cluster import KMeans

kmodel = KMeans(n_clusters = k, n_jobs = 8)

kmodel.fit(data.reshape((len(data), 1)))

c =

pd.DataFrame(kmodel.cluster_centers_).sort(0)

w = pd.rolling_mean(c, 2).iloc[1:]

w = [0] + list(w[0]) + [data.max()]

d3 = pd.cut(data, w, labels = range(k))

#绘图

def cluster_plot(d, k):

import

matplotlib.pyplot as plt

plt.rcParams['font.sans-serif'] = ['SimHei']

plt.rcParams['axes.unicode_minus'] = False

plt.figure(figsize =

(8, 3))

for j in range(0,

k):

plt.plot(data[d == j], [j for i in d[d==j]],

'o')

plt.ylim(-0.5,

k-0.5)

return

plt

cluster_plot(d1, k).show()

cluster_plot(d2, k).show()

cluster_plot(d3, k).show()

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_39667797

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

python数据可视化之离散化气泡图

一键难忘的博客

04-10

2781

要创建离散化气泡图（Bubble Chart）并进行数据可视化，你可以使用Python中的一些流行的数据可视化库，如matplotlib和seaborn。在这个例子中，我使用了一个包含类别、X坐标、Y坐标和气泡大小的示例数据框架。然后，使用函数绘制了气泡图，其中size参数用于指定气泡的大小，hue参数用于指定类别，sizes参数用于调整气泡的大小范围，palette参数用于指定颜色调色板。

python中离散数据插到格点_如何在Python中将散乱数据插入到常规网格中？

weixin_31207903的博客

12-30

1578

我有来自英国分散气象站的经度，纬度和温度的三个txt文件(或者说三个列表lon，lat，temp)。我想首先插入这些数据，以获得一个漂亮的彩色温度图。然后，我想在土地面具上绘制这个内插温度层(因此在英国岛上，而不是在海上)。这可能与Python有关吗？这听起来像是一个GIS堆栈交换的问题 - [farrenthorpe于](https://earthscience.stackexchange.c...

参与评论您还未登录，请先登录后发表或查看评论

python三维插值从规则网格到散点_python-3.x

weixin_39783771的博客

12-12

276

数据让我们使用欧洲的首都。我们使用Pandas从Excel中读取它们：import pandas as pddg0 = pd.read_excel('psc_StaedteEuropa_coord.xlsx') # ,header=Nonedg0.head()City Inhabit xK yK0 Andorra 24574.0 42.506...

python中离散数据插到格点_如何在python中将2D数据插值（或映射）到规则的齐次网格（如250x250）...

weixin_42347869的博客

02-03

664

我正在努力将两个1D数组插值到常规的2D网格中。在A =[[ 193.05 192.55 192.06 ..., 191.21 190.73 190.26][ 193.05 192.55 192.06 ..., 191.21 190.73 190.26][ 193.05 192.55 192.06 ..., 191.21 190.73 190.26]...,[ 193...

python中离散数据插到格点_python – 根据每个点的最近邻居距离,在最佳网格上插入非结构化的X,Y,Z数据...

weixin_39914243的博客

12-19

467

在我使用的show final solution的答案之后编辑了这个问题我有来自不同来源的非结构化2D数据集,例如：这些数据集是3 numpy.ndarray(X,Y坐标和Z值).我的最终目标是在网格上插入这些数据以转换为图像/矩阵.所以,我需要找到插入这些数据的“最佳网格”.而且,为此,我需要在该网格的像素之间找到最佳的X和Y步长.根据点之间的欧氏距离确定步骤：使用每个点与其最近邻居之间的欧几...

python等值面图平滑_离散点插值方法、等值线的绘制及平滑技巧

weixin_39614521的博客

12-08

1593

离散点插值方法、等值线的绘制及平滑技巧2008-06-1022:45由于等值线图看起来非常直观、形象,因此在天气预报、气候预测分析等方面用得非常多,已成为预报员不可缺少的工具之一。如各等压面层的位势高度图、高空环流、温度及降水分布图等等。目前也有一些非常好的微机用绘图软件,如SUFER、GRADS等。这些软件一般都只有DOS版,在流行的WINDOWS平台上,虽然可以调用,但不能使用鼠标操作,故不...

python格点插值到离散点_插值算法特点的研究

weixin_39523887的博客

01-01

575

插值法又称"内插法"，是利用函数f (x)在某区间中已知的若干点的函数值，作出适当的特定函数，在区间的其他点上用这特定函数的值作为函数f (x)的近似值，这种方法称为插值法。如果这特定函数是多项式，就称它为插值多项式。不同插值法的特点介绍：1、距离倒数乘方法距离倒数乘方格网化方法是一个加权平均插值法，可以进行确切的或者圆滑的方式插值。方次参数控制着权系数如何随着离开一个格网结点距离的增加而下降...

python数据分析数据标准化及离散化详解

09-20

Python数据分析中的数据标准化和离散化是两个关键的预处理步骤，它们对于后续的数据建模和分析至关重要。数据标准化和离散化都是为了使数据更适合分析，减少不同尺度或分布特性对模型性能的影响。首先，我们来看...

python格点插值到离散点_【统计学】三种方法进行连续属性离散化处理

weixin_32864391的博客

01-01

470

最近在读《python数据分析与挖掘实战（张良均等）》这本书，发现里面有很多很不错的数据分析方法，但是在重新敲代码的过程中，发现原书也有一些错误，不过正好让我重新熟悉了pandas和matplotlib以及numpy的操作。数据的预处理是数据分析过程中非常重要的一部分，具体结构如图所示：前面两篇文章梳理了用箱线图标注异常值和用拉格朗日插值法进行空白值填充的方法：zakki：箱线图异变标注zhua...

离散点数据插值方法及等值线绘制技术的应用

11-20

根据离散点数据插值到矩形网格点的几种方法，着重阐述了矩形网格化的距离加权最小二乘插值方法

python数据离散化

热门推荐

吕雪松的专栏

01-03

1万+

<br />上一篇讨论了离散点如何生成等值线的思路，其需求基本上是根据特定的数值计算坐标，即计算插值线的位置。而也有需求是根据坐标求数值，即将离散点的空白处全部插值生成平滑过流的栅格矩阵。<br /> <br />离散点插值的算法非常多，最经典的如克里金插值，它是最合理的区域地理空间离散点插值算法，而这里介绍的是最常用最直观最简单的距离倒数加权平方插值算法。算法名字很难理解，其实说白了就是根据所求点坐标与所有（或指定区域范围内）离散点的距离作为权重影响数值来计算，离采样点越远的点，受采样点的影响越小，也就是

格点插值为站点数据批量处理

weixin_30836759的博客

05-11

3723

可以利用脚本程序（MeteoInfoLab环境下）来批量处理格点数据插值为站点数据。示例脚本程序如下，已经注释得很清楚了，这里就不多说了。脚本程序： #Open station file as table data stdata = readtable('D:/Temp/China_Prec_2010101420.csv', delimiter=',', format='%s%f...

bar图设置距离 python_Python可视化 | 反距离加权法插值及可视化绘制

weixin_39715926的博客

12-18

601

本期推文，我们将介绍IDW(反距离加权法(Inverse Distance Weighted))插值的Python计算方法及插值结果的可视化绘制过程。主要涉及的知识点如下：IDW简介自定义Python代码计算空间IDW分别使用plotnine、Basemap进行IDW插值结果可视化绘制IDW简介反距离权重 (IDW)插值假设：彼此距离较近的事物要比彼此距离较远的事物更相似。当为任何未测量的位置预...

数据离散化

sinat_17588957的博客

04-24

789

今天运行"数据离散化"部分代码时出错，环境python3.6+pycharm，网上各种查找资料后发现原代码主要是三个地方需要修改（下面红色部分，原有问题代码被注释掉了）。修改并添加了部分注释。 #-*- coding: utf-8 -*- #数据规范化 import pandas as pd datafile = '../data/discretization_data.xls' #参数初始...

Python数据分析与挖掘进阶篇3——数据的预处理（清洗、集成、变换）附实例！

别看我只是一只羊

11-28

3783

初探Python数据分析day4 自我介绍一下，我是一名大四应届毕业生对数据挖掘方面很感兴趣，最近开始着手系统学习，在这里与大家分享我的学习笔记与心得，如果不足或错误请大家指出，感谢。一、数据的预处理在数据挖掘中，海量的原始数据中存在着大量不完整(有缺失值)、不一致、有异常的数据，严重影响到数据挖掘建模的执行效率，甚至...

python数据分析2

zhenjiangxzy的博客

05-13

1067

数据分析1中记录了我学习Python一些库函数以及常用数据预处理的手段。这一部分将更加详细的介绍数据预处理的相关知识。2.1数据清洗2.2.1缺失值有3类数据缺失值的处理方法：删除记录，数据插补和不处理。主要使用拉格朗日插值法和牛顿插值法——使用现成的库函数进行拉格朗日插值。#coding:utf-8import pandas as pd from scipy.interpolate

Tensorflow2.0泰坦尼克数据分析：Python处理与离散化

“Tensorflow2.0泰坦尼克数据集的python分析以及离散化数据处理（含数据集下载地址）” 在本项目中，我们将使用TensorFlow 2.0框架结合Python进行泰坦尼克号数据集的分析。泰坦尼克数据集是一个经典的机器学习问题...