自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 hive SQL 新人笔记

【代码】hive SQL 新人笔记。

2023-11-10 16:52:08 50

原创 SQL学习笔记

1 基本语法1.1 SELECTSELECT column_name,column_name FROM table_name;1.2 INSERT INTO不指定列名INSERT INTO table_nameVALUES (value1,value2,value3,...);指定列名INSERT INTO table_name (column1,column2,column3,...)VALUES (value1,value2,value3,...);1.3 UPDATE注意要

2021-05-23 19:29:34 155

原创 openpyxl学习笔记

注意事项openpyxl索引是由1开始的!(自己写循环的话是range(1,ws.max_row+1)哈一些常用的代码ws.cell(i,j).value #单元格的值ws.max_row #最大行号ws.max_column #最大列号一些简单的循环的写法有空写一些常规的要复制的东东~import osimport xlrdimport openpyxldef combine_excel(p_excel_path): p_excel_name = os.path.

2021-04-11 18:20:02 324

原创 excel数据清洗-pandas python

这里是针对广东统计年鉴excel数据清洗的一个小总结反正要复制的代码循环读取文件夹,用pandas读取excelfor root, dirs, files in os.walk(path): for f in files: df = pd.read_excel(os.path.join(root, f),header=None) #########神仙操作######### df.to_excel(f.lower()+"_output", s

2021-04-02 17:38:29 479

原创 批量删除文件-python文件清洗

1、删除某种文件后缀的写法:path=r""for foldName, subfolders, filenames in os.walk(path): for filename in filenames: # 遍历列表下的所有文件名 if filename.endswith('.htm'): # 当文件名以.htm后缀结尾时 os.remove(os.path.join(foldName, filename)) print("{

2021-04-02 15:39:24 149 2

转载 数据清洗-正则表达式

python3 正则表达式摘录自 https://www.runoob.com/python3/python3-reg-expressions.html#flagsre.match函数re.match 尝试从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功的话,match()就返回none;若匹配成功返回匹配到的位置序列,如(0,3)表示该字符串在0 1 2 位找到。函数语法:re.match(pattern, string, flags=0)import reprint(re.matc

2021-03-05 09:36:39 992 2

原创 nltk LookupError 配置问题2

再次遇到了lookupError的问题,这次是缺了这个averaged_perceptron_tagger ?的东东然后用nltk.download()同样连不上,奇怪的是今天挂了梯也不行。。。。然后用了https://blog.csdn.net/u010099177/article/details/102900515的方法在github下载414...

2021-01-22 21:57:07 243

原创 配置punkt

用到了这篇的方法~https://mp.csdn.net/console/home?spm=1011.2124.3001.4503然后会提示failed,挂上 VPN 之后可以双击下载(注意左下角可能需要改安装地址)下载得非常慢而且out of date超时了,所以继续用原文方法~为了方便大家解决问题,我把下载下来的文件放在网盘,有需要的小伙伴可以自取(永久有效)网盘链接:https://pan.baidu.com/s/1A2KNaz-F7u8wCcKSJvndyw 提取码:8888

2021-01-19 18:16:11 285

原创 Python学习笔记

编码默认情况下,Python 3 源码文件以 UTF-8 编码,所有字符串都是 unicode 字符串。缩进没有大括号哦数字类型intbool:True/False 不是0/1floatcomples 复数字符串索引方式:从左往右以 0 开始,从右往左以 -1 开始。Python中的字符串不能改变。字符串的截取的语法格式:变量[头下标:尾下标:步长]print(str[0:-1]) # 输出第一个到倒数第二个的所有字符print(s..

2020-07-16 17:15:42 71

原创 百度AI笔记

百度AI笔记观点抽取情感倾向分析多实体情感倾向分析文章标签文章分类消费者评论分析业务接口2 评论挖掘接口3查询评论挖掘接口4 评论分析训练接口5 查询评论分析训练接口6 模型服务部署接口7 模型服务状态接口案例观点抽取输入:text(句子/段落)调用语句:options = {}options["type"] = 4 #4为餐饮美食client.commentTag(text, op...

2020-04-23 17:08:13 210

原创 generator笔记

列表是[]generator是()显示的是一串地址(不要害怕!正常的!读取的方式是for i in generator: print(i)需要注意的是这样他就到末尾去了,再for一次是没有用的...

2020-04-12 18:31:02 97

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除