![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据处理
文章平均质量分 55
有人喜欢你
2017年开始接触MySQL,hive,2018年开始学习Python,2020年学习linux、html、css,2021年学习golang
展开
-
2021-10-27 pandas的填充fillna 与 pandas的df[columns_list]重新生成datafrmae的踩坑指南
先上标题!!!踩坑记录 - pandas填充和非填充的区别以及df=df[cols_list]的重点注意事项以下疑难杂症,你可能永远不会遇到,就像我以前只是用pandas做自己熟悉的事情,使用相对成熟、稳定的数据源。然鹅,某一天开始工作转向了,开始要用到一些非标的数据、人工定义的一些数据。悲剧就开始发生了df_fillna0 = pd.read_excel('filename',sheet_name='xxx').fillna(0)df_nofillna = pd.read_excel('filena原创 2021-10-27 21:10:22 · 604 阅读 · 0 评论 -
matplotlib、seaborn 绘制多图
matplotlib、seaborn 绘制多图-函数编写思路对于这种不常用,但有时候做分析又会用的到,因为绘图用的少,总是会在生产中被卡壳。谨以此记录python 的漫漫路对于这种不常用,但有时候做分析又会用的到,因为绘图用的少,总是会在生产中被卡壳。谨以此记录python 的漫漫路源代码是在jupyter-lab上面写的,为了方便阅读,就全部放在了一起。import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimp原创 2021-04-22 20:41:10 · 5754 阅读 · 1 评论 -
使用python将pdf文档转换为txt、docx文档
使用python将pdf文档转换为txt、docx文档感谢@IT农民工1。提供了好用简洁的第三方库,实测有效。一开始试了好几个,环境变量都不支持,捣腾起来太费劲了。github又太会用。# -*- coding: utf-8 -*-"""Created on Tue Dec 15 20:49:28 2020@author: heater"""import osos.chdir(r'D:\study\linux')import docximport pdfplumberdef pd原创 2021-03-17 22:42:57 · 503 阅读 · 0 评论 -
菜鸟爬虫一_接数据简单整理并发送邮件_主要是打通流程
接爬虫练习,利用smtplib包发送邮件。最近刚好工作中需要python处理报表的自动发送任务,就chao到了smtplib的资料。主要三步:一、pandas读取数据转换为DataFrame格式,做好清洗。这是邮件的主体部分二、写好html的css样式,包在head头部里。三、调试smtp包的发送函数。整个是怎么实现的,老实讲不懂。不过感觉邮件内容主要是文本内容,所以非常好的支持html文本标记语言,css样式+to_html后的内容+html的标签,实现起来也比较直观。截图部分取了邮件的标题、原创 2020-10-28 23:21:21 · 567 阅读 · 0 评论