数据处理
文章平均质量分 99
小基基o_O
GitHub:https://github.com/AryeYellow
码云:https://gitee.com/arye
展开
-
Python 当前时间(复制用)
当前时间ymd = time.strftime('%Y%m%d', time.localtime())ymd = time.strftime('%Y%m%d', time.localtime())ymd = time.strftime('%Y%m%d', time.localtime())ymd = time.strftime('%Y%m%d', time.localtim...原创 2018-06-26 20:04:18 · 776 阅读 · 0 评论 -
图解Python时间和日期time和datetime数据类型转换
4大数据类型time.struct_time ⇌ floattime.struct_time ⇌ strdatetime.datetime ⇌ strPython主要内容:时间相关的数据类型转换floattime.struct_timestrdatetime.datetime4大数据类型import time, datetime时间运算日期转换原创 2020-02-27 08:47:34 · 3194 阅读 · 4 评论 -
Python读取PDF、WORD、EXCEL、PPT里文本
文章目录场景PDFWORDEXCELPPT场景获取文件中的文本内容PDFWORDEXCELPPT原创 2020-06-12 14:33:23 · 2212 阅读 · 3 评论 -
正则表达式\d和[0-9]的区别
正则表达式中,\d和[0-9]都用于匹配数字区别在于:\d的匹配范围比[0-9]更广泛例如:中文输入法输入全角数字,\d能匹配而[0-9]不能Python代码示例import rea = '1234567890'print(re.findall('[0-9]', a))print(re.findall('[0-9]', a))print(re.findall('\d', a))...原创 2020-03-20 20:05:25 · 11582 阅读 · 0 评论 -
re函数split各种情况
文章目录前言一般情况限制切割次数结果出现''pattern使用括号patter同时用 () 和 | 会出现None排除空值的写法前言Python版本:3.7.4split(pattern, string, maxsplit=0, flags=0)原文Split the source string by the occurrences of the pattern,returning...原创 2020-03-03 20:58:30 · 1500 阅读 · 0 评论 -
文本清洗正则表达式(持续更新)
文章目录替换标点:中->英转小写查找时间数量词文本切分替换标点:中->英def replace_punctuation(text): """替换标点(英→中)""" text = text.replace(',', ',') # 逗号 text = text.replace(';', ';') # 分号 text = text.replace(...原创 2019-09-16 15:57:03 · 5287 阅读 · 7 评论 -
Python3时间加减运算及其场景
场景昨天上个月上一年数据采集时,页面显示:昨天、1小时前、2天前、5秒前…时间加减datetime.timedelta原创 2018-08-24 19:22:59 · 891 阅读 · 0 评论 -
Python3-正则表达式-部分替换
文章目录re.sub+lambda菊部替换示例Pycharm正则替换re.sub+lambda菊部替换注意:不能用$import reaa = '【菊部】替换,【a】和【1】不替换'a = re.sub('【([\u4e00-\u9fa5]+)】', lambda x: x.group(1), aa)替换前:【菊部】替换,【a】和【1】不替换替换后:菊部替换,【a】和【1】不替换...原创 2018-11-30 14:56:00 · 14262 阅读 · 1 评论 -
Python3解析【\u】和【\\u】字符
a = '\u5317\u4eac\u5e02'print(a)北京市import jsona = '\\u5317\\u4eac\\u5e02'b = '"%s"' % ac = json.loads(b)print(a, b, c, sep='\n')\u5317\u4eac\u5e02“\u5317\u4eac\u5e02”北京市读取文件中\u字符...原创 2018-11-29 18:12:46 · 8621 阅读 · 0 评论 -
pandas【常用】读写增删查改
文章目录读、写、对象类型转换读文件读csv读txt读excel读数据库写文件写csv写excel对象类型转换dict→DataFramendarray→DataFrameDataFrame→dictDataFrame→ndarrayDataFrame→Series增删查改查列筛选行筛选定位增列新增删普通删除去重丢弃缺失值改附录import pandas as pddf = pd.DataFra...原创 2018-11-22 09:00:53 · 897 阅读 · 1 评论 -
Python 正则表达式 flags 参数
re.I IGNORECASE 忽略字母大小写re.L LOCALE 影响 “w, “W, “b, 和 “B,这取决于当前的本地化设置。re.M MULTILINE 使用本标志后,‘^’和‘$’匹配行首和行尾时,会增加换行符之前和之后的位置。re.S DOTALL 使 “.” 特殊字符完全匹配任何字符,包括换行;没有这个标志, “.” 匹配除了换行符外的任何字符。re.X VERBOSE原创 2018-06-01 23:15:21 · 8569 阅读 · 0 评论 -
自定义快捷键【个人常用】VBA代码
环境:office2013蓝色填充合并居中换行保存当前sheet全域字体格式色阶(绿)热力图(红-蓝)原创 2018-09-13 22:02:04 · 4339 阅读 · 1 评论 -
Python合并和拆分excel
Catalog完整代码基础补充:合并DataFrame合并相同列合并相同行完整代码import pandas as pd, oscwd = os.getcwd() # 当前目录og_dir = cwd + '/origin' # 存放待合并的excelog_ls = os.listdir(og_dir) # 所有excel名称cb_name...原创 2018-07-14 20:07:05 · 2266 阅读 · 0 评论