- 博客(5)
- 收藏
- 关注
原创 安装jieba超时(Read timed out)
安装jieba超时(Read timed out)解决办法:设置安装时限pip install --default -timeout=100 install jieba
2020-09-04 14:27:23
4389
1
原创 文本分析学习笔记
文本分析学习笔记文本中所蕴含信息的层次词条是否在文本中出现——各种基于词袋的模型词条的各种内在关联——各种字典词序信息——N-gram语言模型语法信息——待探索区域NLP的基本思路传统:基于字典(wordnet)现代:基于统计模型原始语料数据化时需要考虑的工作基本目的:在将分词去除停用词词根识别、同义词/近义词识别术语识别情感标注词性标注语法分析语义分析Python的常见IDE/集成开发环境简介什么是语料库多文档——文档-词条矩阵单文档——分词原理简介基于字符串的匹配基于统计以及机器学习的分词方式结巴分词的
2020-09-04 14:22:01
330
原创 “国有-非国有”是否真的好用?
企业产权性质经常作为调节变量出现在实证研究中,似乎无论什么研究,加入“国有-非国有”这一虚拟变量后,都能得到一个显著的回归系数,还能说出一大通道理来。事实上,抛开产权性质本身,国有-非国有企业在许多基础性的特征上就已具有结构性差异,比如大量国有企业处于产业链上游,而非国有企业相反。那么,至少在一些研究中,随意的加入产权性质这一虚拟变量所得结论就值得怀疑了。或许,在加入产权性质变量时,也应当考虑...
2019-02-19 20:34:17
945
原创 采用双重差分需要注意的问题——双重差分项与随机误差项无关
使用双重差分需要注意的问题——双重差分项与随机误差项无关即“共同趋势”,也就是共同的时间趋势分组的随机性分组时可能存在的内生性控制可能对政策实施造成影响的因素。政策预期加入以前年份虚拟变量和分组虚拟变量的交叉项,若该交叉项系数不显著而主要回归系数仍显著,则排除政策预期影响。...
2019-02-16 11:39:09
4066
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人