自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(36)
  • 收藏
  • 关注

原创 stata 数据匹配

stata 数据匹配merge and append

2024-04-07 22:04:02 510

原创 arcgis 无法编辑元素的解决办法(无法删除元素或者缺失值替换)

arcgis 无法编辑元素的解决办法(无法删除元素或者缺失值替换)

2024-03-31 21:14:25 1025

原创 arcgis 点连接到面(以地级市图层为例)

arcgis 点连接到面(以地级市图层为例)

2024-03-18 17:05:18 1274 1

原创 arcgis数据导出到excel

将arcgis属性数据导出到excel

2024-03-18 17:00:35 1687 2

原创 arcgis 计算某点到其他城市的距离,含要素转点(以北京市到各个地级市的距离为例)

arcgis 计算某点到其他城市的距离,含要素转点(以北京市到各个地级市的距离为例)

2024-03-15 23:58:47 808

原创 arcgis栅格数据处理3——定义投影(同样适用于其他类型文件)

设置投影以便连接不同数据

2024-03-10 00:30:29 1058 1

原创 arcgis 栅格数据处理2——栅格转地级市(栅格转矢量图)

栅格数据转地级市数据,并输出excel数据

2024-03-09 22:55:36 986 1

原创 arcgis 栅格数据处理1——无法执行所选工具

arcgis 无法执行所选工具,没有所选工具所需的许可处理办法

2024-03-09 21:28:48 707 1

原创 arcgis 计算面积(计算经纬度、算数等同理)

选中,右击,选择“打开属性表格”,在打开的属性表格中单击最左边的按钮,选择“添加字段”定义新的字段为浮点型变量,定义变量名为area(这里可以根据需要调整);选中新定义的变量,右击选中“计算几何”另:字段计算器可以做一些其他的辅助计算。先定义一个新的变量,例如:area。弹出对话框,点击“确定”;arcgis 计算面积。

2024-01-27 07:47:32 1350 1

原创 多期DID ,最新双重差分命令(LPDID)

多期DID,解决不同时间接受处理的组之间的处理效应可能存在异质性的方法,lpdid在LP方法的基础上,增加了样本限制,通过设定规则删去部分样本,强制构造“干净控制组”。

2024-01-02 10:54:51 935

原创 Arcgis根据经纬度匹配地级市,并将数据导出至excel(arcgis定义投影报错的解决办法)

Arcgis中根据经纬度进行数据匹配或汇总计算,并将匹配结果导出至excel

2023-12-27 18:00:41 761

原创 arcgis 图例变灰无法添加图例的处理方式(同样适用于指北针、比例尺等)

当arcgis图例、指北针等变灰无法操作时,点焦点数据框选项,可进行操作

2023-04-30 19:53:27 13508

原创 stata 面板数据

设定面板:xtset stkcd timextreg y x1 x2 x3 i.time i.stkcd # 固定时间、企业xtreg y x1 x2 x3 i.time # 固定时间xtreg y x1 x2 x3 i.stkcd # 固定企业xtreg y x1 x2 x3 i.industry # 固定行业xtreg y x1 x2 x3 ,fe # 固定企业

2021-10-22 15:05:25 1873

原创 stata滞后、前置、异质性

滞后滞后一阶:gen lx=L.x滞后两阶:gen l2x=L2.x前置前置一阶:gen fx=F.x前置两阶:gen f2x=F2.X异质性reg y x if z==1reg y x if z==0

2021-10-13 21:33:35 12371

原创 stata排除自身计算的行业均值

by time industry : egen total_x=total(x)by time industry : egen number=count(x)gen xx=total_x-xgen mean_x=xx/(number-1)x可替换为目标变量名

2021-10-13 21:29:31 5992 4

原创 stata面板数据聚类及数据导入处理、虚拟变量等

stata导入数据import excel using “C:/Users/lenovo/Desktop/竞争0627.xls”, firstrow clearstata定义虚拟变量tab make,gen(m)

2021-08-06 14:55:11 6655 1

原创 R匹配错误原因

可能原因:1,数据格式不对,12-12-30这种无法匹配,最好分列处理一下:2.第二行的中文解释可删除3.表格中除匹配列外含有完全相同的变量名

2021-06-13 10:40:56 345

原创 excel多条件if语句

在C2输入公式:=IF(AND(A2=“A”,B2>210),“Y”,"")知识点说明:AND()函数语法是这样的,AND(条件1=标准1,条件2=标准2……),每个条件和标准都去判断是否相等,如果等于返回TRUE,否则返回FALSE。只有所有的条件和判断均返回TRUE,也就是所有条件都满足时AND()函数才会返回TRUE。https://jingyan.baidu.com/article/22a299b51c13d69e19376a3e.html在C2单元格输入公式:=IF(OR(A2=

2021-04-17 10:40:04 858

原创 amos不显示路径系数原因

amos每个潜变量对应至少三个显变量amos不显示路径系数原因至少一个显变量对应因子载荷为1设定方式:点击箭头或显变量,设定regression weight为1

2021-03-28 15:01:30 9639

原创 stata令相关系数加显著性

pwcorr a1 a2,sig star(0.01)

2021-03-25 18:50:20 7397

原创 stata数据格式转换,缩尾

stata转换数据格式gen num3=real(num)encode num, gen(num1)destring num, gen(num2)固定效应出现错误,可能为样本过大添加代码set matsize 5000

2021-03-19 21:27:39 2117

原创 关联分析和聚类

http://c.biancheng.net/view/3703.html关联规则支持度一般要求一定支持度以上,才有分析价值,一般最小支持度不易太低,规则一:支持度大于xx一般地,只需关心那些不被其他频繁项集所包含的所谓最大频繁项集的集合。发现所有的频繁项集是形成关联规则的基础。例外情况,稀有模式挖掘eg:爱马仕和劳力士置信度规则二:置信度(一般分析强关联,保留高置信度)支持度:几个关联的数据在数据集中出现的次数占总数据集的比重置信度:一个数据出现后,另一个数据出现的概率,或者说数

2021-03-19 21:24:38 2289

原创 如何在尾注后插入附录,并将附录分页

1.将原先的尾注转化为脚注2.在文章最后插入分节符3.将需要插入的附录放在文章最后(2.3顺序可换)4,将脚注转化为尾注,设置值格式为节的末尾

2021-02-25 13:05:11 2619

原创 stata格式导出-面板数据

statastata格式变换stata格式变换help outreg找outreg2开头的网址clike here to install‘’’reg y xest store m1#保存结果outreg2 [m1] using test.doc,replaceoutreg2 [m1] using test.xls,replacepwd #查看文件储存位置处理面板数据回归,固定效应encode enddate,gen(time)xtset stkcd timextdesxts

2021-01-16 19:32:37 2917

原创 R语言没有GARCH函数的解决

library(tseries)#拟合GARCH(1,1)模型r.fit<-garch(a$residual,order=c(1,1))summary(r.fit)#绘制波动置信区间r.pred<-predict(r.fit)plot(r.pred)

2020-12-27 23:14:29 2428

原创 numpy3数组操作

数组操作更改形状numpy.ndarray.shape表示数组的维度,返回一个元组,这个元组的长度就是维度的数目,即 ndim 属性(秩)。通过修改 shape 属性来改变数组的形状。import numpy as npx = np.array([1, 2, 9, 4, 5, 6, 7, 8])print(x.shape) # (8,)x.shape = [2, 4]#将x矩阵改为两行三列print(x)# [[1 2 9 4]# [5 6 7 8]]x = np.array(

2020-10-25 20:55:34 275

原创 numpy2

索引、切片与迭代-1.numpy.ndarray.copy() 函数创建一个副本。 对副本数据进行修改,不会影响到原始数据,它们物理内存不在同一位置。import numpy as npx = np.array([1, 2, 3, 4, 5, 6, 7, 8])y = xy[0] = -1#第一项乘-1,x原本的被覆盖print(x)#[-1 2 3 4 5 6 7 8]print(y)#[-1 2 3 4 5 6 7 8]x = np.array([1,

2020-10-23 23:45:38 132

原创 2020-10-21

numpy学习1-11.1numpy.nan表示空值。【例】两个 numpy.nan 是不相等的。1. numpy.isnan(x, *args, **kwargs) Test element-wise for NaN and return result as a boolean array.【例】 1.2numpy.inf表示正无穷大。【例】1nan = NaN = NAN import numpy as np print(np.nan == np.nan) # False print

2020-10-23 23:02:42 130

原创 R可视化学习笔记1-数据导入

#import data#导入CSV数据,header=T则首行有列名,heater=FALSE 则首行无列名x<-read.table("D:/Desktop/sj.csv",sep=",",header=T)gdp<-x$gdpg1<-x$g1g2<-x$g2g3<-x$g3#若无行名,进行行名定义data <-read.csv('datafile.csv',header=FALSE)names(data)<-c('Column1','co

2020-09-17 17:26:20 328

原创 ggplot2箱线图+小提琴图

箱线图1槽口1.在geom_boxplot()括号中加入notch=TRUE即可在箱子上生成槽口,即geom_boxplot(notch=TRUE,notchwidth=0.8)#notchwidth越小则越往里凹2.均值标记箱线中的均值标记常以钻石来表示,所以命令为stat_summary(fun.y=“mean”,geom=“point”,shape=23,size=3,fill=“white”)3.加入最大最小值线想要使ggplot2所绘制的箱线图带有最大最小值线,可用stat_b

2020-09-17 14:38:06 4362

原创 ggplot2折线图(时间坐标.坐标轴设置)

1.导入时间数据2.坐标轴间隔#导入数据x<-read.table("D:/Desktop/ten1.csv",sep=",",header=T)CountryName <- factor(x$CountryName)StringencyIndex<-x$StringencyIndexConfirmedCase<-x$ConfirmedCasedate<-as.Date(x$Date)#作为时间序列引入cdata<-data.frame(CountryNa

2020-08-05 17:35:00 3678

原创 从零开始NLP--task6

学习目标• 了解Transformer的原理和基于预训练语言模型(Bert)的词表示• 学会Bert的使用,具体包括pretrain和finetune1.Transformer1.1Transformer的编码部分和解码部分分别是一组编码器或者解码器的堆叠。https://jalammar.github.io/illustrated-transformer/11.2Self-Attention中使用多头机制,使得不同的attention heads所关注的的部分不同1.3编码器结构中每个子层

2020-08-04 23:28:45 211

原创 从零开始nlp-task5

一.通过word2vec学习词向量word2vec是对出现在上下文环境的词进行预测,选取一个上下文窗口和一个中心词,基于中心词预测窗口中其他词出现频率, 因此可以从新增语料中,学到新增词的向量表达。Skip-grams (SG):给定input word预测上下文Continuous Bag of Words (CBOW)̀:给定上下文预测目标单词Hierarchical softmax和 Negative sampling是两种更高效的训练方法。二.文本特征提取1.TEXTCNN 是利用

2020-07-31 19:55:31 105

原创 从零开始nlp-task4及fasttext安装

fasttext安装分类模型用验证集调参1.pip install fasttext失败重启后conda install fasttext失败https://www.lfd.uci.edu/~gohlke/pythonlibs/#fasttext找到自己python对应的版本,我的是python3.7,所以下载的是fasttext-0.9.2-cp37-cp37m-win_amd64.whl2.分类模型import pandas as pdfrom sklearn.metrics im

2020-07-27 23:04:40 115

原创 nlp-task3

首先安装sklearncmd: pip install -U scikit-learn一、文本表示方法1.One-hot我:[1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]爱:[0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0]…海:[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1]2.Bag of Words(Count Vectors)句⼦1:我 爱 北 京 天 安 ⻔转换为 [1, 1, 1, 1, 1, 1, 1, 0, 0,

2020-07-23 23:20:38 99

原创 从零开始NLP-task2

%pylab inline是matplotlib的代码,但只有jupyter notbook,要用到plt未定义,用import matplotlib.pyplot as plt#定义pltimport pandas as pdtrain_df = pd.read_csv('F:/NLP/train_set.csv', sep='\t', nrows=100)train_df.head()#句子长度分析train_df['text_len'] = train_df['text'].app

2020-07-22 23:12:17 179 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除