- 博客(2)
- 收藏
- 关注
原创 批量下载搜狗词库
用于对知识的整理,方便后来者。第一步: 用python爬取每个搜狗词库的基本信息,以及下载链接。搜狗词库细胞库链接:http://pinyin.sogou.com/dict/cate/index/167生成12个文件,用以下代码合并文件,并按照类别加入type字段,同时对官方推荐的词库进行标记。#encoding=utf-8import sysdefaultencod
2017-05-08 14:28:08
3047
1
原创 SAS 将文件自动导入,并自动获取文件名
这个是我最近解决的问题,欢迎大家批评指点哈!概述:SAS 可以用input,在指定column 名字的情况下,load数据;可以用proc import 来导入未知column个数的数据,他会自动生成每一列的格式,但有个弊端,就是针对空的列,他会assign char的格式,如果我要append同样格式的文件到第一个文件,第二个文件中那个列不为空,这时,就会出现问题。下面的方法可以
2014-12-19 19:07:51
1975
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人