统计与数据分析素养max
文章平均质量分 79
该栏目为作者自用,主要是记录学习心得,并定期打卡,督促自己进步。
其中包含了第1章 数据描述性分析;第2章 参数估计;第3章 假设检验;第4章 回归分析;第5章 方差分析;第6章 判别分析与聚类分析;第7章 主成分分析、因子分析与典型相关分析;第8章 非参数统计
封印师请假去地球钓鱼
-双非崽血拼研究生!️
-肩鸿任钜踏歌行,功不唐捐玉汝成。
-参与2023亚马逊云科技中国峰会等会议,入围2023博客之星等。
-撰写博客多次入选内容前沿榜、热榜、CSDN每天值得看等多种榜单。
展开
-
大数据分析|大数据分析的十大应用领域
本博客介绍了BDA适用的各种分析技术领域。原创 2024-02-04 22:25:07 · 1050 阅读 · 0 评论 -
大数据分析|大数据分析的三类核心技术
本文主要介绍大数据分析所使用的三类核心技术。主要包括机器学习、统计分析以及数据挖掘。原创 2024-02-02 15:13:42 · 911 阅读 · 0 评论 -
大数据分析|设计大数据分析的三个阶段
本博客主要介绍如何设计BDA-DM(Big data analytics & decision-making framework (BDA-DMF))框架。大数据分析是一种数据密集型架构,它提供了用于数据生成、数据采集、数据存储、高级数据分析、可视化和价值创造决策等各个阶段的各种技术和平台。原创 2024-02-02 15:01:59 · 1386 阅读 · 0 评论 -
大数据分析|从七个特征理解大数据分析
本文主要介绍大数据分析最重要的七个特征是什么以及大数据分析的发展特征。七个特征是“Volume”(支持非常高的数据量)、“Velocity”(数据流的快速分析)、“Variety”(支持不同类型的数据)、“Veracity”(支持高数据质量)、“Value”(见解和利益的价值)、“Variability”(支持不断变化)和“Valence”(支持数据中的连通性)。原创 2024-01-31 13:55:25 · 1274 阅读 · 0 评论 -
因果推断经验研究中的中介效应与调节效应
中介效应分析与调节效应分析是国内经济学因果推断经验研究中被广泛采用的两种研究手段,但是存在不同程度的误用。前者的主要问题在于过度使用中介效应逐步法检验,后者的主要问题是对其在因果识别中的作用阐发不足。为此,本文深入讨论了中介效应检验的偏误、如何正确开展中介效应分析,以及如何使用调节效应分析来强化因果关系论证,并针对当前的使用现状提出了相应的操作建议。原创 2024-01-16 13:50:03 · 1134 阅读 · 0 评论 -
商务智能|描述性统计分析与数据可视化
本文还介绍了数据分类、数据来源和数据分布的概念及其处理方法。文章还介绍了集中趋势、离散趋势和相关性的测度方法,以及中位数的概念和应用。另外,本文还详细介绍了众数和多峰分布、方差和标准差、离散问题中的极差等概念及其应用。最后,本文讲解了数据可视化和相关性分析的步骤和方法,并强调了可视化在数据分析中的重要性。原创 2024-01-06 08:40:46 · 1144 阅读 · 0 评论 -
计量经济学|学习笔记以及学习感悟
本博文介绍了初级和中级计量经济学的不同内容和重点。初级计量经济学注重介绍基本的统计工具和经济模型,帮助人们理解经济数据和经济现象之间的关系。这包括回归分析、假设检验和预测方法等。中级计量经济学则更加深入研究这些方法的理论基础和实际应用,探讨更复杂的模型和技术,如面板数据分析、时间序列分析和因果推断等。同时,中级课程还会涉及更多计量经济学理论,比如内生性问题、工具变量和因果推断的困难等。通过学习中级计量经济学,人们可以更全面地理解。该博文旨在通过系列更改搭建起计量经济学的大厦。原创 2023-12-28 12:54:50 · 1189 阅读 · 1 评论 -
Python实战小项目分享
这篇博客是将我接触过的python实战项目进行汇总,项目来源于卖网课的机构,但是其代码在一定程度上是不可实现的,因为他们的代码注释是特意进行了删除,然后代码中缺少关键代码行,因为在网上较难找到所以放在这里有需要的友友可以自取,然后我也给出了几条代码调试路线以供大家使用。原创 2023-10-23 14:09:16 · 736 阅读 · 1 评论 -
标准差椭圆算法实现
python实现标准差椭圆分析的代码,但个人推荐使用Arc Map,这个软件只需要通过数据连接、设置简单系数即可(参见引用文献二),操作便捷度比python要高。原创 2023-10-05 12:50:24 · 4008 阅读 · 0 评论 -
python实用小代码(数据分析向)
内含:python实现31省市名称替换、转化为面板数据、数据分类、设置图例(不定期更新)原创 2023-10-02 11:42:44 · 719 阅读 · 1 评论 -
Data analysis|Tableau基本介绍及可实现功能
关于Tableau软件的使用。本博客主要是介绍Tableau的操作界面和主要功能那个,并对其中的一些常见功能的实现进行的介绍,可以作为入门使用。写该博客是因为之前在实习中接触过该软件,写下了此篇博客主要目的在于在搜索se的多维展现形式。原创 2023-08-07 13:49:54 · 1174 阅读 · 0 评论 -
python实现多表格数据的不精确匹配
这段代码实现了两个表格的数据匹配和合并,并根据匹配情况进行了标记,最终将合并结果保存到一个新的表格中。原创 2023-07-04 15:48:30 · 253 阅读 · 1 评论 -
Python实现考虑非期望产出的超效率SBM模型
本文主要介绍了考虑非期望产出的超效率模型的原理及实现过程,需要提醒的是非期望产出的模型集中的非期望产出一般对于自己的系统是负向影响。原创 2023-06-29 12:52:49 · 3759 阅读 · 1 评论 -
1.3概率分布函数的图形(day4)
此处以正态分布、F分布和卡方分布为例,使用python绘制各自的概率密度函数曲线。原创 2023-05-15 20:03:06 · 320 阅读 · 1 评论 -
1.1描述统计量(day2)
数据是信息的载体,从数据到信息,需要先分析数据的主要特征,这些特征包括数据的位置度量、分散程度度量、关系度量以及分布形状的度量.1.使用均值、均值、分位数、方差、标准差、极差与标准误用以度量数据的位置与是分散程度。2.通过协方差矩阵和相关系数矩阵度量变量之间的关系。(即相关性有多大)3.使用偏度和风度来度量图像的形状。4.总体描述——使用st.decribe()函数来进行变量的总体描述;使用st.shapiro()来进行正态性检验描述。原创 2023-05-08 20:47:21 · 80 阅读 · 0 评论 -
全文导学(Day1)
各Python包的学习网站如下:Numpy: https://numpy.org/doc/stable/Scipy: https://docs.scipy.org/doc/scipy/reference/Pandas: https://pandas.pydata.org/Matplotlib: https://matplotlib.org/StatsModels: https://www.statsmodels.org/stable/index.htmlPatsy: https://patsy.原创 2023-05-08 19:58:24 · 36 阅读 · 1 评论