![](https://img-blog.csdnimg.cn/20201014180756738.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
stata
七天笔记本
银行打工人
展开
-
在公众平台1年内发出20+篇推文之后,数据分析小白学到了什么?
目录前言Python:re:selenium:自动登录自动下载selenium基础知识爬虫xpathPDF处理pandas--表格数据处理Stata:爬虫:merge--表格数据处理总结前言从2019年5月起,我开始在公众平台下学习软件。到2020年7月卸任,一年多的时间,我从对代码模糊向往的小白,变成了别人口中会写(一点点)代码的大神(不是)。感触很深,人走得太快,也要偶尔等一等自己的灵魂,回头看看走过的路,所以下面做一下总结。.原创 2020-11-07 14:38:46 · 268 阅读 · 0 评论 -
养家之人:原来和平如此珍贵!Stata豆瓣影评爬取并画词云图
《养家之人》20年后约定在海边相见。--那时候我都认不出你了。--你可以把蓝宝石高价卖给我。今天看了《养家之人》,十分触动。所以爬了下豆瓣影评并且画了个词云图来看看。*豆瓣影评*一、单个网页获取时间、链接、标题*infix读入clearcap mkdir "G:/豆瓣影评" //创建目标文件夹cd "G:/豆瓣影评" //更改当前工作路径到此文件夹copy "https://movie.douban.com/subject/26...原创 2020-07-31 00:23:46 · 1326 阅读 · 1 评论 -
wordstat中help文件extraction of topics部分 英文
Extraction of Topics ContentsMenuScroll to Top of Page Print Topic Show/Hide ExpandersThe Topic Extraction feature of WordStat attempts to uncover the hidden thematic structure of a text collection by applying a combination o...原创 2020-06-14 20:58:25 · 248 阅读 · 0 评论 -
wordstat中帮助文件翻译版(一)extraction of topics部分
提取的话题stat的主题提取特征试图通过自然语言处理和统计分析相结合的方法来揭示文本集合中隐藏主题结构。 WordStat中用于主题提取的主要统计过程是因子分析。从技术上讲,这种抽取是通过按文档频率矩阵计算单词来实现的,或者也可以通过将文档分割成更小的块并按段频率矩阵计算单词来实现的。一旦得到了这个矩阵,就需要进行可变旋转的因子分析,以提取少量的因子所有因子加载高于特定标准的单词将作为提取主题的一部分进行检索层聚类分析,一个词可能只岀现在一个集群中,话题建模使用因子分析可能导致一个词与多个因素有关, p原创 2020-06-14 20:57:04 · 982 阅读 · 0 评论 -
stata中超好用小命令:一键将excel文件转换成dta文件
xls2dta命令:将excel文件转换成dta文件在stata应用中,往往需要对多个excel中的数据进行处理,这就需将excel格式的数据转化为stata格式的数据,通常的做法是读入(import excel)、保存为dta(save)、合并(append)三步走。今天为大家介绍的xls2dta命令可以一步到位地将一个或多个excel转化为stata格式的dta文件,并可以同时实现横纵向合并...原创 2020-04-06 17:05:04 · 42116 阅读 · 5 评论