数据统计与分析
文章平均质量分 74
结合数据统计与分析的相关原理与多种方法,基于各类软件与算法,进行数据统计、分析实战。
疯狂学习GIS
我们一起疯狂学习GIS!
展开
-
批量从Excel某一列中找到符合要求的值并提取其对应数据
本文介绍在Excel中,从某一列数据中找到与已知数据对应的字段,并提取这个字段对应数值的方法~原创 2024-11-10 23:48:02 · 373 阅读 · 0 评论 -
Python中matplotlib绘制密度散点图的方法
本文介绍基于Python语言的matplotlib模块,对Excel表格文件中的指定数据,加以密度散点图绘制的方法~原创 2024-04-26 16:12:24 · 557 阅读 · 2 评论 -
Python计算多个表格中多列数据的平均值与标准差并导出为新的Excel文件
本文介绍基于Python语言,对一个或多个表格文件中多列数据分别计算平均值与标准差,随后将多列数据对应的这2个数据结果导出为新的表格文件的方法~原创 2024-04-08 22:09:50 · 865 阅读 · 0 评论 -
中国工商银行数据中心科技菁英校园招聘面试经历与体检情况
本文介绍2024届秋招中,中国工商银行的科技菁英岗位一面的面试基本情况、提问问题等~原创 2023-12-09 16:49:47 · 1772 阅读 · 0 评论 -
Python为Excel中每一个单元格计算其在多个文件中的平均值
本文介绍基于Python语言,对大量不同的Excel文件加以跨文件、逐单元格平均值计算的方法~原创 2023-10-06 14:43:32 · 783 阅读 · 0 评论 -
Python逐日填补Excel中的日期并用0值填充缺失日期的数据
本文介绍基于Python语言,读取一个不同的列表示不同的日期的.csv格式文件,将其中缺失的日期数值加以填补;并用0值对这些缺失日期对应的数据加以填充的方法~原创 2023-10-05 15:38:38 · 883 阅读 · 0 评论 -
Python用若干列的数据多条件筛选、去除Excel数据并批量绘制直方图
本文介绍基于Python,读取Excel数据,以一列数据的值为标准,对这一列数据处于指定范围的所有行,再用其他几列数据数值,加以筛选与剔除;同时,对筛选与剔除前、后的数据分别绘制若干直方图,并将结果数据导出保存为一个新的Excel表格文件的方法~原创 2023-09-15 00:22:46 · 838 阅读 · 0 评论 -
Python自动计算Excel数据指定范围内的区间最大值
本文介绍基于Python语言,基于Excel表格文件内某一列的数据,计算这一列数据在每一个指定数量的行的范围内(例如每一个4行的范围内)的区间最大值的方法~原创 2023-07-29 16:03:39 · 1145 阅读 · 0 评论 -
Python批量将Excel内指定列的数据向上移动一行
本文介绍基于Python语言,针对一个文件夹下大量的Excel表格文件,对其中的每一个文件加以操作——将其中指定的若干列的数据部分都向上移动一行,并将所有操作完毕的Excel表格文件中的数据加以合并,生成一个新的Excel文件的方法~原创 2023-07-29 14:20:55 · 1358 阅读 · 0 评论 -
Python对Excel不同的行分别复制不同的次数
本文介绍基于Python语言,读取Excel表格文件数据,并将其中符合我们特定要求的那一行加以复制指定的次数,而不符合要求的那一行则不复制;并将所得结果保存为新的Excel表格文件的方法~原创 2023-07-17 16:54:31 · 1594 阅读 · 0 评论 -
R语言实现SMOTE与SMOGN算法解决不平衡数据的回归问题
本文介绍基于R语言中的UBL包,读取.csv格式的Excel表格文件,实现SMOTE算法与SMOGN算法,对机器学习、深度学习回归中,训练数据集不平衡的情况加以解决的具体方法~原创 2023-07-12 19:42:29 · 2447 阅读 · 11 评论 -
Python实现SMOGN算法解决不平衡数据的回归问题
本文介绍基于Python语言中的smogn包,读取.csv格式的Excel表格文件,实现SMOGN算法,对机器学习、深度学习回归中,训练数据集不平衡的情况加以解决的具体方法~原创 2023-07-12 14:16:48 · 1561 阅读 · 24 评论 -
Anaconda配置可视化绘图库seaborn的方法
本文介绍在Anaconda的环境中,安装Python语言中,常用的一个绘图库seaborn模块的方法~原创 2023-07-10 18:36:31 · 1880 阅读 · 1 评论 -
Python读取指定的TXT文本文件并从中提取指定数据的方法
本文介绍基于Python语言,遍历文件夹并从中找到文件名称符合我们需求的多个.txt格式文本文件,并从上述每一个文本文件中,找到我们需要的指定数据,最后得到所有文本文件中我们需要的数据的合集的方法~原创 2023-07-09 23:46:40 · 19421 阅读 · 3 评论 -
Python读取Excel文件并复制指定的数据行
本文介绍基于Python语言,读取Excel表格文件数据,并基于其中某一列数据的值,将这一数据处于指定范围的那一行加以复制,并将所得结果保存为新的Excel表格文件的方法~原创 2023-07-08 19:36:11 · 1475 阅读 · 0 评论 -
Python基于指定范围筛选并剔除Excel表格中的数据
本文介绍基于Python语言,读取Excel表格文件,基于我们给定的规则,对其中的数据加以筛选,将不在指定数据范围内的数据剔除,保留符合我们需要的数据的方法~原创 2023-06-08 20:17:29 · 2147 阅读 · 0 评论 -
numpy库报错has no attribute ‘_no_nep50_warning‘的解决
本文介绍在Python中,numpy库出现报错module 'numpy' has no attribute '_no_nep50_warning'的解决方法~原创 2023-05-26 17:54:05 · 3339 阅读 · 0 评论 -
Python从多个表格中随机抽取数据加以处理后合并全部数据
本文介绍基于Python语言,针对一个文件夹下大量的Excel表格文件,基于其中每一个文件,随机从其中选取一部分数据,并将全部文件中随机获取的数据合并为一个新的Excel表格文件的方法~原创 2023-05-23 15:58:03 · 760 阅读 · 0 评论 -
Python对大量表格文件加以数据截取、逐行求差、跨文件合并等处理的方法
本文介绍基于Python语言,针对一个文件夹下大量的Excel表格文件,基于其中每一个文件,首先依据某一列数据的特征截取我们需要的数据,随后对截取出来的数据逐行求差,并基于其他多个文件夹中同样大量的Excel表格文件,进行数据跨文件合并的具体方法~原创 2023-05-22 21:40:07 · 748 阅读 · 0 评论 -
Python遍历大量表格文件并筛选出表格内数据缺失率低的文件
本文介绍基于Python语言,针对一个文件夹下大量的Excel表格文件,基于其中每一个文件内、某一列数据的特征,对其加以筛选,并将符合要求与不符合要求的文件分别复制到另外两个新的文件夹中的方法~原创 2023-05-16 21:50:31 · 626 阅读 · 0 评论 -
Anaconda配置Python科学计算库SciPy的方法
本文介绍在Anaconda环境中,安装Python语言SciPy模块的方法~原创 2023-03-09 16:32:15 · 6679 阅读 · 0 评论 -
Anaconda环境配置Python数据分析库Pandas的方法
本文介绍在Anaconda环境中,安装Python语言pandas模块的方法~原创 2023-03-09 13:48:22 · 7811 阅读 · 0 评论 -
R语言Ternary包绘制三元图、RGB三色空间分布图的方法
本文介绍基于R语言中的Ternary包,绘制三元图(Ternary Plot)的详细方法;其中,我们就以RGB三色分布图为例来具体介绍~原创 2023-02-16 20:37:31 · 1185 阅读 · 4 评论 -
R语言读取Excel表格数据并绘制多系列柱状图、条形图
本文介绍基于R语言中的readxl包与ggplot2包,读取Excel表格文件数据,并绘制具有多个系列的柱状图、条形图的方法~原创 2023-02-12 00:07:08 · 6526 阅读 · 9 评论 -
Anaconda环境Python中xlrd库的配置方法
本文介绍在Anaconda环境下,安装Python读取.xls格式表格文件的库xlrd的方法~原创 2023-02-03 21:58:10 · 4059 阅读 · 4 评论 -
R语言raster包批量读取单一或大量栅格图像
本文介绍基于R语言中的raster包,读取单张或批量读取多张栅格图像,并对栅格图像数据加以基本处理的方法~原创 2022-12-30 17:07:19 · 8949 阅读 · 30 评论 -
Armadillo与OpenCV矩阵数据mat、vec与Mat的相互转换
本文介绍在C++语言中,矩阵库Armadillo的mat、vec格式数据与计算机视觉库OpenCV的Mat格式数据相互转换的方法~原创 2022-12-11 14:08:07 · 1260 阅读 · 0 评论 -
Python中matplotlib为多个列表数据绘制小提琴图
本文介绍基于Python中matplotlib模块与seaborn模块,利用多个列表中的数据,绘制小提琴图(Violin Plot)的方法~原创 2022-12-03 20:28:48 · 1334 阅读 · 0 评论 -
R语言与RStudio的下载与安装方法
本文介绍R语言及其集成开发环境RStudio的下载、安装方法~原创 2022-11-27 21:14:01 · 3854 阅读 · 2 评论 -
Geodetector软件下载、地理探测器的应用实践与结果解读
本文介绍Geodetector软件的下载方法,以及地理探测器分析的完整操作,并对其结果加以解读~原创 2022-05-01 20:41:52 · 11372 阅读 · 62 评论 -
基于Python获取文件夹中文件数量与其子文件夹中文件数量
最近,需要对多个文件夹统计其内部文件数量。其中,这多个需要统计文件数量的文件夹都放在一个总文件夹内。 这一操作基于Python来实现是非常方便、快捷的。话不多说,我们对相关的Python代码来进行详细介绍。import ostarget_path='H:/2020/'all_content=os.listdir(target_path)print('All content numbers is',len(all_content))count_num=1for content in原创 2021-05-12 13:49:35 · 2706 阅读 · 2 评论 -
Python中matplotlib.pyplot柱状图条形图上下或左右边距调整
最近,绘制了一个水平柱状图,但是发现图的上、下边距(不是柱子相互之间的间距,而是最上、下方柱子与图边缘的距离)相对较大,非常影响美观;同时,这里纵坐标变量是代表变量名称的不同的字符串,而不是简单的数据范围,如下图所示: 因此,需要对其加以调整。 经过尝试,调整所需代码其实非常简单,仅仅需要两行:y_num=np.arange(len(train_X_column_name))plt.ylim(min(y_num)-1,max(y_num)+1) 其中,train_X_column_原创 2021-05-09 21:55:57 · 4977 阅读 · 0 评论 -
基于SPSS的经典统计学分析与偏度峰度等常用统计学指标计算
本文所述数据经典统计学分析包括计算数据的极值、平均值、中位数、标准差、方差、变异系数、偏度与峰度等常用统计学指标。 首先,打开SPSS软件。 第一步需要将数据导入SPSS中。选择“文件”,然后选择“数据”。 在弹出的窗口选择要导入的数据格式,随后选择数据路径与数据文件,最后点击“打开”。本文所用数据为.csv格式,因此选择文件类型为CSV(*.csv)。 随后进入“文本导入向导”窗口。在这里需要依据导入的数据的实际情况加以配置。 例如,本文所用.csv数据的第一行为列名称,因此原创 2021-05-04 21:25:40 · 5459 阅读 · 0 评论 -
Excel表格文件行与列均用数字而非字母表示的方法
在各种Excel文件中,默认用数字表示行数,用字母表示列数,如下图: 而在列数较多时,用字母表示列数较为不直观,无法很好判断列的具体数量,如下图: 对此,我们可以将Excel文件中的行与列均用数字来表示,方法如下。 首先,选择“文件”。 选择“选项”。 选择“公式”,勾选“R1C1引用样式”,然后点击“确定”。 此时可以看到,Excel文件的行与列均用数字来表示了,可以清晰看到具体的列数,非常直观。...原创 2021-05-04 16:59:19 · 2308 阅读 · 0 评论 -
基于Python读取Excel表格文件数据并转换为字典dict格式
有时我们需要将一个Excel表格文件中的全部或一部分数据导入到Python并转换为字典格式,如何实现呢? 我们以如下所示的一个表格(.xlsx格式)作为简单的示例。其中,表格共有两列,第一列为学号,第二列为姓名,且每一行的学号都不重复;同时表格的第一行为表头。 假设我们需要将第一列的学号数据作为字典的键,而第二列姓名数据作为字典的值。 首先,导入必要的库。from openpyxl import load_workbook 随后,列出需要转换为字典格式数据的Excel文件的路径与名原创 2021-04-19 14:54:21 · 8922 阅读 · 2 评论 -
基于Python读取多个Excel文件数据并跨越不同xlsx表格文件计算平均值
又到了一年一度的算综测时间,其中一大难点就是计算全班同学相互打分的平均值;而若借助Python,这一问题便迎刃而解。 目前有一个文件夹,其中存放了大量Excel文件;文件名称是每一位同学的名字,即文件名称没有任何规律。 而每一个文件都是一位同学对全班除了自己之外的其他同学的各项打分,我们以其中一个Excel文件为例来看: 可以看到,全班同学人数(即表格行数)很多、需要打分的项目(即表格列数)有11个(不算总分);同时,由于不能给自己打分,导致每一份表格中会有一行没有数据。 而我们需要原创 2021-04-08 23:10:48 · 2382 阅读 · 0 评论 -
Python下数值型与字符型类别变量独热编码(One-hot Encoding)实现
首先导入必要的模块。import pandas as pdfrom sklearn.preprocessing import OneHotEncoder其中,OneHotEncoder是我们实现独热编码的关键模块。接下来,导入并显示数据前五行。test_data_1=pd.read_csv('G:/CropYield/03_DL/00_Data/onehot_test.csv',header=0)test_data_1.head(5)关于这里导入数据代码的解释,大家可以查看博客1与博客2,原创 2021-03-30 23:32:44 · 4254 阅读 · 10 评论 -
Python下多变量联合分布图(pairplot)绘制——seaborn
联合分布(Joint Distribution)图是一种查看两个或两个以上变量之间两两相互关系的可视化形式,在数据分析中经常需要用到。一幅好看的联合分布图可以使得我们的数据分析更加具有可视性,让大家眼前一亮。 那么,本文就将用seaborn来实现联合分布图的绘制。seaborn是一个基于matplotlib的Python数据可视化模块,借助于其,我们可以通过较为简单的操作,绘制出各类动人的图片。 首先,引入需要的模块。import pandas as pdimport seaborn as原创 2021-03-11 21:07:12 · 10942 阅读 · 2 评论 -
基于Amos路径分析的模型修正与调整
基于Amos路径分析的模型修正与调整1 模型验证2 模型修正与调整2.1 基于MI修正2.1.1 MI修正原理2.1.2 MI修正方法2.2 基于已有路径修正2.2.1 显著性水平较低路径2.2.2 正负关系不合理路径 前面三篇博客,分别对Amos的基本操作与模型、参数等加以详细介绍,点击下方即可进入对应文章。 博客1:基于Amos的路径分析与模型参数详解 博客2:基于Amos路径分析的输出结果参数详解 博客3:基于Amos路径分析的模型拟合参数详解 得到路径分析模型以后,并不一定可以获原创 2021-03-05 14:48:12 · 36236 阅读 · 34 评论 -
基于Amos路径分析的模型拟合参数详解
本文由模型拟合度指标入手,对Amos所得到的路径分析模型结果加以度量~原创 2021-03-04 23:02:32 · 43707 阅读 · 29 评论
分享