solar333-CSDN博客

选中，右击，选择“打开属性表格”，在打开的属性表格中单击最左边的按钮，选择“添加字段”定义新的字段为浮点型变量，定义变量名为area（这里可以根据需要调整）；选中新定义的变量，右击选中“计算几何”另：字段计算器可以做一些其他的辅助计算。先定义一个新的变量，例如：area。弹出对话框，点击“确定”；arcgis 计算面积。

2024-01-27 07:47:32 1386 1

原创多期DID ，最新双重差分命令(LPDID)

多期DID，解决不同时间接受处理的组之间的处理效应可能存在异质性的方法，lpdid在LP方法的基础上，增加了样本限制，通过设定规则删去部分样本，强制构造“干净控制组”。

2024-01-02 10:54:51 941

原创 Arcgis根据经纬度匹配地级市，并将数据导出至excel(arcgis定义投影报错的解决办法)

Arcgis中根据经纬度进行数据匹配或汇总计算，并将匹配结果导出至excel

2023-12-27 18:00:41 772

原创 arcgis 图例变灰无法添加图例的处理方式（同样适用于指北针、比例尺等）

当arcgis图例、指北针等变灰无法操作时，点焦点数据框选项，可进行操作

2023-04-30 19:53:27 13634

原创 stata 面板数据

设定面板：xtset stkcd timextreg y x1 x2 x3 i.time i.stkcd # 固定时间、企业xtreg y x1 x2 x3 i.time # 固定时间xtreg y x1 x2 x3 i.stkcd # 固定企业xtreg y x1 x2 x3 i.industry # 固定行业xtreg y x1 x2 x3 ,fe # 固定企业

2021-10-22 15:05:25 1881

原创 stata滞后、前置、异质性

滞后滞后一阶：gen lx=L.x滞后两阶：gen l2x=L2.x前置前置一阶：gen fx=F.x前置两阶：gen f2x=F2.X异质性reg y x if z==1reg y x if z==0

2021-10-13 21:33:35 12395

原创 stata排除自身计算的行业均值

by time industry : egen total_x=total(x)by time industry : egen number=count(x)gen xx=total_x-xgen mean_x=xx/(number-1)x可替换为目标变量名

2021-10-13 21:29:31 6031 4

原创 stata面板数据聚类及数据导入处理、虚拟变量等

stata导入数据import excel using “C:/Users/lenovo/Desktop/竞争0627.xls”, firstrow clearstata定义虚拟变量tab make，gen（m）

2021-08-06 14:55:11 6664 1

原创 R匹配错误原因

可能原因：1，数据格式不对，12-12-30这种无法匹配，最好分列处理一下：2.第二行的中文解释可删除3.表格中除匹配列外含有完全相同的变量名

2021-06-13 10:40:56 345

在C2输入公式：=IF(AND(A2=“A”,B2>210),“Y”,"")知识点说明：AND()函数语法是这样的，AND(条件1=标准1，条件2=标准2……)，每个条件和标准都去判断是否相等，如果等于返回TRUE，否则返回FALSE。只有所有的条件和判断均返回TRUE，也就是所有条件都满足时AND()函数才会返回TRUE。https://jingyan.baidu.com/article/22a299b51c13d69e19376a3e.html在C2单元格输入公式：=IF(OR(A2=

2021-04-17 10:40:04 861

原创 amos不显示路径系数原因

amos每个潜变量对应至少三个显变量amos不显示路径系数原因至少一个显变量对应因子载荷为1设定方式：点击箭头或显变量，设定regression weight为1

2021-03-28 15:01:30 9664

原创 stata令相关系数加显著性

pwcorr a1 a2,sig star(0.01)

2021-03-25 18:50:20 7408

原创 stata数据格式转换，缩尾

stata转换数据格式gen num3=real(num)encode num, gen(num1)destring num, gen(num2)固定效应出现错误，可能为样本过大添加代码set matsize 5000

2021-03-19 21:27:39 2121

原创关联分析和聚类

http://c.biancheng.net/view/3703.html关联规则支持度一般要求一定支持度以上，才有分析价值，一般最小支持度不易太低，规则一：支持度大于xx一般地，只需关心那些不被其他频繁项集所包含的所谓最大频繁项集的集合。发现所有的频繁项集是形成关联规则的基础。例外情况，稀有模式挖掘eg：爱马仕和劳力士置信度规则二：置信度（一般分析强关联，保留高置信度）支持度：几个关联的数据在数据集中出现的次数占总数据集的比重置信度：一个数据出现后，另一个数据出现的概率，或者说数

2021-03-19 21:24:38 2289

原创如何在尾注后插入附录，并将附录分页

1.将原先的尾注转化为脚注2.在文章最后插入分节符3.将需要插入的附录放在文章最后（2.3顺序可换）4，将脚注转化为尾注，设置值格式为节的末尾

2021-02-25 13:05:11 2624

原创 stata格式导出-面板数据

statastata格式变换stata格式变换help outreg找outreg2开头的网址clike here to install‘’’reg y xest store m1#保存结果outreg2 [m1] using test.doc,replaceoutreg2 [m1] using test.xls,replacepwd #查看文件储存位置处理面板数据回归，固定效应encode enddate,gen(time)xtset stkcd timextdesxts

2021-01-16 19:32:37 2919

原创 R语言没有GARCH函数的解决

library(tseries)#拟合GARCH(1,1)模型r.fit<-garch(a$residual,order=c(1,1))summary(r.fit)#绘制波动置信区间r.pred<-predict(r.fit)plot(r.pred)

2020-12-27 23:14:29 2428

原创 numpy3数组操作

数组操作更改形状numpy.ndarray.shape表示数组的维度，返回一个元组，这个元组的长度就是维度的数目，即 ndim 属性(秩)。通过修改 shape 属性来改变数组的形状。import numpy as npx = np.array([1, 2, 9, 4, 5, 6, 7, 8])print(x.shape) # (8,)x.shape = [2, 4]#将x矩阵改为两行三列print(x)# [[1 2 9 4]# [5 6 7 8]]x = np.array(

2020-10-25 20:55:34 275

原创 numpy2

索引、切片与迭代-1.numpy.ndarray.copy() 函数创建一个副本。对副本数据进行修改，不会影响到原始数据，它们物理内存不在同一位置。import numpy as npx = np.array([1, 2, 3, 4, 5, 6, 7, 8])y = xy[0] = -1#第一项乘-1，x原本的被覆盖print(x)#[-1 2 3 4 5 6 7 8]print(y)#[-1 2 3 4 5 6 7 8]x = np.array([1,

2020-10-23 23:45:38 132

原创 2020-10-21

numpy学习1-11.1numpy.nan表示空值。【例】两个 numpy.nan 是不相等的。1. numpy.isnan(x, *args, **kwargs) Test element-wise for NaN and return result as a boolean array.【例】 1.2numpy.inf表示正无穷大。【例】1nan = NaN = NAN import numpy as np print(np.nan == np.nan) # False print

2020-10-23 23:02:42 130

原创 R可视化学习笔记1-数据导入

#import data#导入CSV数据，header=T则首行有列名，heater=FALSE 则首行无列名x<-read.table("D:/Desktop/sj.csv",sep=",",header=T)gdp<-x$gdpg1<-x$g1g2<-x$g2g3<-x$g3#若无行名，进行行名定义data <-read.csv('datafile.csv',header=FALSE)names(data)<-c('Column1','co

2020-09-17 17:26:20 328

原创 ggplot2箱线图+小提琴图

箱线图1槽口1.在geom_boxplot（）括号中加入notch=TRUE即可在箱子上生成槽口，即geom_boxplot(notch=TRUE，notchwidth=0.8)#notchwidth越小则越往里凹2.均值标记箱线中的均值标记常以钻石来表示，所以命令为stat_summary(fun.y=“mean”,geom=“point”,shape=23,size=3,fill=“white”)3.加入最大最小值线想要使ggplot2所绘制的箱线图带有最大最小值线，可用stat_b

2020-09-17 14:38:06 4371

原创 ggplot2折线图（时间坐标.坐标轴设置）

1.导入时间数据2.坐标轴间隔#导入数据x<-read.table("D:/Desktop/ten1.csv",sep=",",header=T)CountryName <- factor(x$CountryName)StringencyIndex<-x$StringencyIndexConfirmedCase<-x$ConfirmedCasedate<-as.Date(x$Date)#作为时间序列引入cdata<-data.frame(CountryNa

2020-08-05 17:35:00 3681

原创从零开始NLP--task6

学习目标• 了解Transformer的原理和基于预训练语言模型（Bert）的词表示• 学会Bert的使用，具体包括pretrain和finetune1.Transformer1.1Transformer的编码部分和解码部分分别是一组编码器或者解码器的堆叠。https://jalammar.github.io/illustrated-transformer/11.2Self-Attention中使用多头机制，使得不同的attention heads所关注的的部分不同1.3编码器结构中每个子层

2020-08-04 23:28:45 211

原创从零开始nlp-task5

一.通过word2vec学习词向量word2vec是对出现在上下文环境的词进行预测，选取一个上下文窗口和一个中心词，基于中心词预测窗口中其他词出现频率，因此可以从新增语料中，学到新增词的向量表达。Skip-grams (SG):给定input word预测上下文Continuous Bag of Words (CBOW)̀:给定上下文预测目标单词Hierarchical softmax和 Negative sampling是两种更高效的训练方法。二.文本特征提取1.TEXTCNN 是利用

2020-07-31 19:55:31 105

原创从零开始nlp-task4及fasttext安装

fasttext安装分类模型用验证集调参1.pip install fasttext失败重启后conda install fasttext失败https://www.lfd.uci.edu/~gohlke/pythonlibs/#fasttext找到自己python对应的版本，我的是python3.7，所以下载的是fasttext-0.9.2-cp37-cp37m-win_amd64.whl2.分类模型import pandas as pdfrom sklearn.metrics im

2020-07-27 23:04:40 117

原创 nlp-task3

首先安装sklearncmd： pip install -U scikit-learn一、文本表示方法1.One-hot我：[1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]爱：[0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0]…海：[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1]2.Bag of Words（Count Vectors）句⼦1：我爱北京天安⻔转换为 [1, 1, 1, 1, 1, 1, 1, 0, 0,

2020-07-23 23:20:38 99

原创从零开始NLP-task2

%pylab inline是matplotlib的代码，但只有jupyter notbook,要用到plt未定义，用import matplotlib.pyplot as plt#定义pltimport pandas as pdtrain_df = pd.read_csv('F:/NLP/train_set.csv', sep='\t', nrows=100)train_df.head()#句子长度分析train_df['text_len'] = train_df['text'].app

2020-07-22 23:12:17 181 1

weixin_47072998的博客

原创 stata 数据匹配

原创 arcgis 无法编辑元素的解决办法（无法删除元素或者缺失值替换）

原创 arcgis 点连接到面（以地级市图层为例）

原创 arcgis数据导出到excel

原创 arcgis 计算某点到其他城市的距离，含要素转点（以北京市到各个地级市的距离为例）

原创 arcgis栅格数据处理3——定义投影（同样适用于其他类型文件）

原创 arcgis 栅格数据处理2——栅格转地级市（栅格转矢量图）

原创 arcgis 栅格数据处理1——无法执行所选工具

原创 arcgis 计算面积（计算经纬度、算数等同理）