- 博客(2)
- 资源 (29)
- 收藏
- 关注
转载 强大的 sed 和 gawk 处理日志文件
Linux 中,我们经常会遇到对文件进行处理的需要,例如从大量日志文件中抽取目标信息进行分析等。这时就需要一款有力的工具,能够轻松实现文件信息的提取,修改。幸运的是 Linux 为我们提供了两个这样的工具。sed 和 gawk 几乎可以满足我们日常工作中99%以上的日志处理要求。sed 编辑器 (stream editor)从名字看出,sed 是针对文件流做处理的命令。它有如下特点:一...
2019-04-26 11:36:26 435
转载 Python数据清洗--类型转换和冗余数据删除
数据分析过程中最头疼也是工作量最大的部分算是探索和清洗了,探索的目的是了解数据,了解数据背后隐藏的规律,清洗的目的则是为了让干净的数据进入分析或建模的下一个环节。作者将通过三篇文章,详细讲解工作中常规的数据清洗方法,包括数据类型的转换,重复数据的处理,缺失值的处理以及异常数据的识别和处理。这是第一篇文章,主要分享的内容包括,文中涉及到的数据可以至文末查看下载链接:数据类型的转换...
2019-04-26 11:29:58 1059
Word2007转换PDF和XPS插件资源.rar
2020-01-02
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人