Python
文章平均质量分 51
技术宅不宅
这个作者很懒,什么都没留下…
展开
-
墨西哥区域相关的西班牙语日期的处理方案。。
西班牙语带有月份缩写的日期处理原创 2022-01-25 16:34:39 · 409 阅读 · 0 评论 -
pandas处理excel相关,插入折线图并保存xlsx文件用的,搬运一篇外网文章里的内容吧。
先放英文原文链接:原文链接这里好像并没有用到matplotlib,而是直接用了pandas里面的产生insert_chart()的方法。大致过程如下:首先嘛,导包之后,先用xlsxwriter(第三方库,如果没有的话需要pip安装)作为engine,声明一个writer=pd.DataFrame(r’文件绝对路径’ , engine=‘xlsxwriter’)然后就是往writer里df.to_excel(writer , sheet_name=‘工作表名字’),这里的df就是pandas的dat原创 2021-04-16 15:36:16 · 1200 阅读 · 0 评论 -
python中关于面向对象的一些小感悟,库的import问题
python之禅中有“Simple is better than complex.”这么一句话。理解为“简洁比繁琐好”,我觉得是没啥问题的。日常写脚本的时候,导库一般都会统一写在最开头,并且会通过换行,加以区分(无论看视频还是看书,很多示例都会有这样的特点。当然也有例外,但那种可以理解为一段代码里分成不同的功能区域,《轻量级Django》中,第一章部分代码就是这样。)那么如果在写类的时候,里面每写一个方法,都得import一次库,且不说用起来怎么样,光是写的时候,每个方法的开头都得from datet原创 2021-04-08 12:23:23 · 153 阅读 · 0 评论 -
关于pandas+sql使用中的小坑:三个数字列转成字符串,然后补零拼接成新字符串
由于数据库存储日期数据时,年份,月份,日份这三个字段均保存成了整形(int),直接做拼接的话会导致结果出现诡异的情况。。首先,不做转换的话,会直接变成数字相加:year|month|day2021|4|6table[‘year’]+table[‘month’]+table[‘day’]出来的结果是2031。。然后,做了强制转化:year|month|day2021|3|102021|4|6table['date']=table['year'].astype('str')+table['mo原创 2021-04-06 11:10:24 · 522 阅读 · 0 评论 -
记录一下最近在使用pd.pivot_table时遇到的坑:pivot_table的index参数中的列,如果存在nan值,该行记录将会被不计算
如题。最近在做个简易的统计脚本,思路大致描述一下:用到的工具:mysql,selenium.webdriverpymysql,sqlalchemy,pandas,numpymysql的建库建表部份就直接省略了:1,毕竟与这个主题是弱关系;2,大部份的问题都能直接从百度上,甚至直接在CSDN网站里检索到;3,关于mysql报错还是提一嘴吧,执行sql语句报错时候会有个报错数字号码(一般为4位数),可以直接按照关键词格式“数据库软件名(空格)报错数字号码”,在搜索引擎(如百度,谷歌,CSDN的原创 2021-03-10 12:19:56 · 3101 阅读 · 0 评论 -
pandas处理欧洲区域数据的csv文件,直接通过形参指定千分位和小数点
最近在做数据处理的时候,碰上了欧洲区域的账单,他们的千分位和小数点是这个样子的:可以看到:他们的小数点是英文逗号,而他们的千分位,则是小数点。。当场裂开。。但从pandas的官方文档中,查到pd.read_csv的参数中,有这两项:这意味着,可以通过参数传入,指定千分位和小数点。而原文的括号中,也直接说明了“例如从欧洲地区获取的数据”所以实际上可以通过如下代码解决:import pandas as pdeu_csv_table=pd.read_csv(r'eu_csv.csv',e原创 2021-03-08 16:35:40 · 604 阅读 · 0 评论 -
PANDAS处理英文日期的笨办法
好吧,工作中碰上了这种情况:这是用pandas读取表格后,日期/时间列里面的东西。。>>> order_only_asin_unhvp['date/time']4 Jul 29, 2020 6:18:30 AM PDT>>> type(order_only_asin_unhvp['date/time'][4])<class 'str'>更恶心的是,我还得把这个日期给重新换成日期格式才能继续干活。。看来真就只能做切割了。。。目前原创 2020-09-29 18:52:19 · 1065 阅读 · 1 评论 -
selenium 元素定位 增加超时timeout设置
这其实算是我上课之后的收获吧,听了康神的爬虫课,get了这么个技能。这里厚颜无耻地链上康神的博客哈~康神的CSDN博客地址实际上我在使用链式编程解决“将日常工作自动化”的需求时发现,selenium包里面的元素定位(selenium原装的元素定位方法,参照博文《史上最全!Selenium元素定位的30种方式》),偶尔会出现卡在那里不动的情况,而且如果页面不存在需要定位的元素时,卡顿往往会超过1分钟,这就很难熬了。结合康神上课时给出的代码,稍加改良,就得出来下面这两个safe_get元素的自定义函数了。原创 2020-08-27 11:51:20 · 3007 阅读 · 0 评论 -
以给定的起止字符,分割字符串
def split_with_start_end(strings,start_with,end_with): ''' 建议使用关键词参数的方式输入参数 strings参数为字符串 start_with参数必须为单个字符 end_with参数必须为单个字符,且不同于start_with参数 输出结果为列表 ''' strings_dict={}; start_index=[]; end_index=[]; strings_index=0; target_str_list=[] fo.原创 2020-08-11 18:25:38 · 338 阅读 · 0 评论 -
对《python读写excel(附上将一个文件夹下所有excel文件合并成一个文件的代码)》的实测记录,以及一点点心得
先po一下原文网址,毕竟这里仅记录一下具体的代码:https://blog.csdn.net/Imagine_Dragon/article/details/78025144以下为原文的完整代码段:# coding:utf-8import xlrdimport osimport xlwtfrom xlutils.copy import copy"""将文件夹下所有excel...转载 2019-12-09 18:55:28 · 369 阅读 · 0 评论 -
小白之Python读取csv文件,转换成excel,使用openpyxl编辑的纠结之路。
这里写自定义目录标题前言大体思路接下来进入代码环节后记前言作为一个零基础,对爬虫感兴趣,刚看了几节《疯狂Python讲义》(其实已经看了20+节了),并且觉得python的语法跟excel函数有很多相似之处的小白,在B站偶然间刷到了openpyxl操作excel表的视频后,我瞬间感觉到了python的便利之处。我非常喜欢那段B站视频中的一句话:我很讨厌机械重复工作,但又不得不做。恰好机械重复...原创 2019-05-23 15:53:15 · 6677 阅读 · 5 评论