数据提取
文章平均质量分 85
Fenrir9999
/*n*/
展开
-
VBA统计WORD文档中汉字、英文及其组合出现的次数,并输出
使用前,需要在word内插入一个textbox1和一个commandbutton1,然后去掉文档中的标点符号。笔者比较懒,未加入剔除标点的代码。理论上下述代码可以统计999个字符(含标点)的文本,如需增加文本数量,则只需要增加数组体积即可。代码只是通过比较简单的for ,do循环实现,没啥技术含量哈。Sub Button1_click() '统计词频 Dim input_wo...原创 2019-02-21 15:09:21 · 2104 阅读 · 0 评论 -
VBA word自动排版(9)——通过相互嵌套的With Selection.Find进行海量替换
在提取数据时,会遇到具有相似格式的内容,例如同一个word文档中出现了“(C01B35/06优先)”、(C01C11/00优先),(C01C18/00优先)……等,其存在相似的通配符格式,即"\(*优先\)",但如果直接全部替换,又有可能误删数据。必须先将所有符合这种格式的数据找出后形成数组,然后进行批量替换,如果手动录入会非常麻烦,那么可以用到下述代码。以下以字符长度L为第二判别条件实现降噪,......原创 2019-02-24 23:22:23 · 6559 阅读 · 0 评论 -
VBA word自动排版(8)——批量自动搜索并提取带有特定关键词的内容
在做数据筛选时,会要求提取带有特定关键词的短句。楼主比较懒,代码只提供了提取关键词短句的部分,并未加入重复检测功能待提取的word文档格式如下:(关键词为XX)aaaxxaabbbxxbbsssssccccxxccsddssfsdfsdfsdfxxdddd以下代码能够实现批量提取出word文档内的带有关键词的数据Sub 提取内容() Dim temp_text, tex...原创 2019-02-19 15:50:22 · 7497 阅读 · 1 评论 -
VBA excel数据提取(1)——从某一列中提取所需内容区间,并赋值给另一列
笔者最近在做一个数据库项目,其中需要从EXCEL中提取关键字段。提取内容如下图所示,需要将图中加粗部分单独提出后进行去噪处理。如果通过word处理,文字量小的时候尚可实现,但几十万字的处理量很容易就造成假死。因此采用了EXCEL进行数据处理。代码如下:功能是将B列中的数据筛选后存入C列Sub 提取内容()Dim searchtextDim textlongDim str_startD...原创 2019-03-07 23:50:57 · 12306 阅读 · 1 评论