数据分析必备
一城山水
所有的改变都是一种深思熟虑过后的奇迹,每一瞬间奇迹都在发生。
展开
-
再也不用担心自己处理Excel表格的效率了
Python3一键合并Excel 以下为实战经验分享: 如果是需要先处理在合并的话 ,只需在merge_file()方法下进行调整。 Windows 下 这里推荐使用search() 方法查找文件,非 Windows 可以使用下面的get_file()方法,具体原因可以查阅关于pathlib 包。 Windows 下查找路径下某类型的文件 import os def search(dirname, filename): """ :param dirname: 需要查找的目录原创 2021-05-16 17:33:16 · 127 阅读 · 0 评论 -
UnicodeDecodeError: ‘ascii‘ codec can‘t decode byte 8xd8 in position 0 : ordinal not in range(128)
导读 最近在批量处理Excel数据的时候遇到Pandas读取老版本Excel失败,以下是我解决问题的方法,仅供参考。 报错原因如下: 网上大多数对这个问题的解决方法都是针对Python 2 的 解决思路,把老版本的excel 批量copy 一份,再进行pandas 批量处理 def copy_file(filename): """ :param filename: 文件名 :return: """ # 指定编码为gbk file1 = xlrd.ope.原创 2021-05-16 17:08:17 · 264 阅读 · 0 评论 -
Python 找出某个路径下 xlsx、txt、pdf 等等文件结尾
Python 找出某个路径下 xlsx、txt、pdf 等等文件结尾 导读 快速找到一个路径所有相同文件,这有助于自动化处理 使用Python 内置包 pathlib 这里写的是交互模式,也可以自定义路径参数 然后传入 # 获取指定目录下 所有的xlsx , txt 等文件 具体看需求 def get_file(patterns , path): all_files=[] p=Path(path) for item in patterns: file_name原创 2020-11-29 14:46:58 · 1035 阅读 · 2 评论 -
R语言自学笔记(一)
导读 今天是2020年10月24日——纪念程序员的节日 我们一定要记住这群人,他们用知识改变世界的人,在当今时代,如果没有程序员,就没有支付宝,没有微信,没有淘宝,包括疫情期间的健康码,他们是推动社会发展的核心力量,改变时代的领军者。 笔记(一) 一、R语言的介绍 二、创建数据集 第一章 R语言介绍 本章内容:R的安装、熟悉R语言、运行R程序 1、一个R会话示例 > age<- c(1,3,5,2,11,9,3,9,12,3) > weight<- c(4.4,5.3,7.原创 2020-10-24 20:59:17 · 628 阅读 · 0 评论 -
认识jupyter notebook 和 Matplotlib的基本用法
1、认识jupyter notebook jupyter notebook:一款编程/文档/笔记/展示软件,具有很好的交互性,大量减少了调式的时间,这里暂不介绍 jupyter lab 。 启动命令:jupyter notebook 具体安装网上有教程 这里不细说 想在MAC终端启动并在后台挂起请输入 nohup jupyter notebook& jobs :查看当前有多少在后台运行的命令 使用 jobs -l 可以显示进程号 , kill -9 pid 可以终止运行的命令。 2、认原创 2020-10-11 20:17:58 · 1891 阅读 · 2 评论