原文发布时间:2017/8/2 16:38:54
1. 前言
本文所需数据及相关文件共享于百度云盘:
链接:http://pan.baidu.com/s/1dFKSlmp
密码:yo3p
2. 数据来源
数据为百度热搜榜的几段文本,分别放在不同的路径下,如下图所示:
3. 模板概览
4. 思路
a) 读入txt文本,先使用String Searcher对搜索指数进行提取,对提取后的指数进行编号,待用;
b) a步骤中的非指数部分含有热搜词汇,再使用一个String Searcher进行提取,编号,待用;
c) 使用FeatureMerger对热搜词汇与指数进行挂接;
d) 对挂接后的数据进行条件赋值,输出。
5. 脚本
Py脚本使用了os包,具体步骤如下:
a) 获取当前路径;
b) 使用a中的路径,得到文本路径;
c) 使用a中的路径,得到输出路径;
d) 使用a中的路径,得到模板路径;
e) 使用os.walk函数,得到b路径下所有的文本;
f) 得出fme执行所需参数;
g) 使用os.system执行模板,进行批处理。
6. Bat文件
使用Bat文件,调用python执行脚本。
7. 环境
系统 :Win10 64位 1703;
FME : 32位 17280;
Python :32位 3.5.2。