自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(282)
  • 收藏
  • 关注

原创 stata中inlist2命令(划分区域的简洁命令)

【代码】stata中inlist2命令(划分区域的简洁命令)

2024-03-11 21:21:53 729

转载 stata数据管理器中文乱码、标签乱码

stata标签乱码

2023-04-24 20:55:57 3085 1

原创 对stata数据中的缺失值分组进行处理(用非空前值填充、对累计值缺失值的处理)

【代码】对stata数据中的缺失值分组进行处理(用非空前值填充、对累计值缺失值的处理)

2023-03-30 12:21:02 4763

原创 stata17中double类型与float类型的区别(变量的存储格式和显示格式、数值运算出错、转换数值格式、字符型数据转换为数值型数据)

【代码】stata17中double类型与float类型的区别(变量的存储格式和显示格式、数值运算出错、转换数值格式、字符型数据转换为数值型数据)

2023-03-28 16:38:30 5538

原创 多时点DID实证流程笔记(Aggregate Effects from Public Works: Evidence from India)

文章选题大致背景:评估2006-2008年分三批实施的NREGS政策效应。在看这篇文章之前,最好先下载:王锋,葛星.低碳转型冲击就业吗——来自低碳城市试点的经验证据[J].中国工业经济,2022,(05):81-99.这篇工业经济的文章运用的也是多时点DID模型,但是在模型的处理上与这篇英文文章存在较大差异。数据结构:这里的政策变量是nregs,如果某个街区受到受到了政策影响,则取值为1,否则取值为0;

2022-12-12 17:46:00 5780 1

原创 bysort分组求和不成功的原因(求和变量为字符串类型)

bysort分组求和不成功的原因

2022-11-17 16:33:41 1466

转载 stata使用merge函数类型不匹配的解决办法、去除空格

stata使用merge函数类型不匹配的解决办法

2022-11-16 21:32:00 9180 1

转载 由于某种原因,PowerPoint 无法加载MathType..... (亲测有效)

PowerPoint无法加载D:\MathType

2022-11-09 19:06:24 6524 1

转载 Error - must have ivreg2/ivreg28/ivreg29/ivreg210 version 2.1.15 or greater installed

Error - must have ivreg2/ivreg28/ivreg29/ivreg210 version 2.1.15 or greater installed。

2022-11-03 16:02:34 4837 1

原创 WebDriverException: Message: unknown error: cannot find Chrome binary(ChromeDriver及谷歌官网下载地址)

ChromeDriver版本不匹配问题的解决方法

2022-11-02 20:36:11 745

转载 stata整数型日期之间的互相转换

stata整数型日期之间的互相转换

2022-10-29 17:50:59 1167

转载 已经在控制面板中卸载了mathtype,但是crtl+v仍然报错53

已经在控制面板中卸载了mathtype,但是crtl+v仍然报错53

2022-10-21 19:54:48 1402 1

原创 python使用query函数报错:UndefinedVariableError

UndefinedVariableError

2022-10-20 09:52:07 862

转载 整理了10个经典的Pandas数据查询案例(附原始数据\多个条件过滤\日期条件过滤)

我希望在阅读本文后,您可以更频繁,流利地使用Pandas中的query()函数,因为它可以方便以过滤数据集。这些查询的函数我每天都会或多或少的使用。

2022-10-17 16:09:14 878 1

转载 Python轻松实现PDF格式转换(附详细源码)

【代码】Python轻松实现PDF格式转换(附详细源码)

2022-10-15 20:03:42 2136

转载 电商用户行为数据可视化分析实战(频率分布直方图、箱限图、小提琴图、分组函数(groupby)、sns.FacetGrid))

电商用户行为数据可视化分析实战

2022-10-10 21:23:48 1131 1

转载 安慰剂检验(stata)

使用 permute 命令,我们基本可以一行代码搞定安慰剂检验。这个命令有两个明显的优点。其一,我们可以实时观看抽样进度,不用在电脑面前瞎等。同时,该命令也会提供单侧检验与双侧检验的 p 值,帮助我们直接判断安慰剂检验是否通过,相比于肉眼的直观判断更为客观。

2022-10-06 19:21:31 34284 5

转载 R包安装时出现有某个辑程包不存在(R包本地安装gecon不成功的解决办法)

R包本地安装gEcon

2022-09-07 12:33:41 4914 2

原创 二手房房价分析与预测(图表绘制避免中文乱码、饼形图、折线图、条形图(柱形图)、enumerate函数、数据清洗(lambda\map)、二手房预测(scikit-learn))

二手房房价预测

2022-07-17 20:43:43 6048 6

原创 电商销售数据分析与预测(日期数据统计、按天统计、按月统计)

电商销售数据与预测

2022-07-17 10:56:36 9873 7

原创 机器学习库Scikit-Learn(线性模型、岭回归、插入一列数据(insert)、提取所需列、向量机(SVM)、聚类)

机器学习库Scikit-Learn

2022-07-16 20:34:59 4250

原创 数据统计分析案例(对比分析、销量定比分析、同比、双坐标图、环比、shift、贡献度分析(帕累托法则)、差异化分析、resample、季节性波动分析)

数据分析案例

2022-07-16 09:59:35 5086

转载 ValueError: The number of FixedLocator locations (7), usually from a call to set_ticks, does not mat

雷达图不显示标签

2022-07-15 21:11:36 10088 2

原创 图解数组计算模块NumPy下(三角函数、四舍五入函数(around)、取整、将弧度转化为角度、统计分析函数、中位数、数组的排序、argsort()、lexsort())

图解数组计算模块NumPy

2022-07-15 10:00:44 1029

原创 图解数组计算模块Numpy上(指定数值类型、数值类型、二维数组索引、二维数组切片索引、数组重塑、数组的增、删、改、查、矩阵运算(mat)、矩阵求逆)

图解数组计算模块NumPy

2022-07-14 20:45:02 1383

原创 第三方可视化数据分析图表Pyecharts(下载保存图片(生成的html图片)、zip函数(将数据转换为列表加元组的格式)、南丁格尔玫瑰图、双y轴可视化、饼形图和环形图)

第三方可视化数据分析图表Pyecharts

2022-07-13 10:21:16 2198

原创 Seaborn可视化数据分析图表(折线图、直方图、条形图、散点图、线性回归模型、箱体图(箱形图)、核密度图、提琴图、字符串切分(str.split))、横向表合并、热力图)

Seaborn可视化数据分析图表

2022-07-12 17:33:18 2992 1

原创 Matplotlib可视化数据分析图表下(常用图表的绘制、折线图、柱形图、直方图、饼形图、散点图、面积图、热力图、箱形图、3D图表、绘制多个图表、双y轴可视化图表、颜色渐变图)

Matplotlib可视化数据分析图表

2022-07-11 20:56:23 5200

原创 Matplotlib可视化数据分析图表上(解决中文乱码、解决负号不显示问题、round函数、为图表中各个数据点添加文本标签、坐标轴范围、添加文本标签、设置标题和图例、添加注释)

matplotlib可视化图表

2022-07-07 21:07:48 2133

原创 Pandas统计分析下(日期数据处理、时间序列、降采样、升采样(resample)、Excel多表合并、股票行情数据分析、解决中文乱码)

Pandas统计分析

2022-07-06 19:15:29 2687

原创 Pandas统计分析中(数据计算、数据格式化、数据分组统计、数据移位、数据转换、数据合并、数据导出)

Pandas统计分析

2022-07-06 10:28:25 4540

转载 Markdown 中设置图片图注

Markdown中设置图片图注

2022-07-05 10:46:16 2480

原创 pandas统计分析上(导入excel数据、Series对象、DataFrame对象、绝对路径和相对路径、多个html表格的拼接及排序、loc与iloc的区别、数据的增修改和删除、数据清洗、异常值)

pandas数据分析3.Series切片索引用标签索引做切片,包头包尾(即包含索引开始位置的数据,也包含索引结束位置的索引)。通过标签切片索引“明日同学”至“七月流火”获取数据。程序代码如下:用位...

2022-07-02 21:13:27 1736

原创 第2章 构建自定义语料库

构建自定义语料库

2022-06-26 16:37:43 4367

原创 使用文本分析识别一段文本中的主要性别

使用文本分析一段文本中出现的性别比例

2022-06-24 10:44:25 630

原创 语料库数据处理个案实例(读取多个文本文件、读取一个文件夹下面指定的多个文件、解码错误、读取多个子文件夹文本、多个文件批量改名)

读取同一文件夹下的多个文件、读取多个子文件夹文本

2022-06-23 15:43:50 1001

原创 语料库数据处理个案实例(句子检索相关个案)

语料库句子检索相关个案

2022-06-23 11:12:44 1309

原创 语料库数据处理个案实例(计算机搭配强度、删除表中的停用词、词料检索的KWIC实现)

语料库数据处理个案实例

2022-06-22 15:46:54 1638

原创 语料库数据处理个案实例(词性赋码、词性还原)

词性赋码、词性还原从结果可见,nltk.word_tokenize()函数词性赋码后,返回一个列表,该列表的每一个元素是一个元组,每个元组又有两个元素,分别是单词和它的词性码。如果直接打印或输出上述结果,可读性不好。为了提高结果的可读性,我们可以将之处理成如"单词_词性"的形式。因此,可以使用如下代码...

2022-06-22 11:24:19 2225

原创 语料库数据处理个案实例(分词和分句、词频统计、排序)

分词和分句,nltk

2022-06-21 21:29:15 1927

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除