Python
Python 基础语法/第三方库使用等
小田_
这个作者很懒,什么都没留下…
展开
-
Python - 一行代码for 循环处理数据
我处理的小需求是,将文件中每一行取出来,同时去掉换行符。参考:16个非常有用的Python单行代码!原创 2024-01-17 17:17:19 · 431 阅读 · 0 评论 -
Python - requests 上传文件及报错
cannot import name 'appengine' from 'urllib3.contrib'原创 2024-01-12 11:05:40 · 1358 阅读 · 0 评论 -
wiki 爬虫记录
根据关键字,拼接详情页面 url,有些关键字没有对应页面就作罢。发现,是可以根据 当前网页的链接跳转,来获取有效的内容页面。一般倾向于 自顶向下的方式去 分析网站结构。打开wiki,不知道从哪儿爬起。关键字,可以将文本分词 来获取。原创 2024-01-08 17:52:24 · 1175 阅读 · 1 评论 -
Python - url 中中文编解码
【代码】Python - url 中中文编解码。原创 2024-01-08 17:46:08 · 483 阅读 · 0 评论 -
Python - 全局变量小记
数组可以 append,不能。原创 2023-11-16 10:12:08 · 81 阅读 · 0 评论 -
Python - __all__
文章目录https://www.cnblogs.com/wxlog/p/10566628.htmlpython模块中的 __all__,用于模块导入时限制比如,如果模块A定义了 __all__ 属性,使用 from moduleA import * ,则只有 __all__ 内指定的属性、方法、类可被导入;若没定义,则导入模块内的所有公有属性,方法和类。...原创 2021-10-18 14:54:57 · 126 阅读 · 0 评论 -
Python - 操作 doc / docx
文章目录读取 docx注意:doc/docx 文件名中如果包含空格,可能导致读取失败,可以提前替换为 _读取 docxtextract 和 docx2txt 两个库都支持读取 docximport textractimport docx2txtfile_path = '.../docx/a.docx'print('file_path : ', file_path)bs = textract.process(file_path) # 得到的是 bytestext1 = bs.deco原创 2021-11-11 19:25:49 · 1280 阅读 · 0 评论 -
Python - wsgi
文章目录wsgirefhttps://www.jmjc.tech/tutorial/python/55web 编程就是对HTTP协议的应用。我们能使用 socket 自制 web 服务器,但每次都需要自己处理协议的内容很烦琐,所以可以把 HTTP协议的东西外包给专门的HTTP服务器软件。Apache、Nginx 等 HTTP服务器软件都是只负责处理 HTTP 的请求和响应。python 就只是单纯的负责处理业务,在通过 wsgi 把 Python 和 HTTP 关联起来。类似的这种 “转载 2021-09-27 11:07:39 · 127 阅读 · 0 评论 -
数据清洗 - 特殊符号
文章目录QQ起昵称专用特效字符箭头符号贴图字符大全图形符号本着洗文本的目的,去搜了几个想到的符号,搜到了所有的特殊符号,不得不说,这个家族很大。这里我选择了写我认为常见的,使用 re 将特殊符号替换为空,代码:def clear_special_char(sent): pat = '[★☆◆◇▲△▼▽▶●○〇□■☉⊙◎︻︼︽︾〒↑↓¤▓◣◥◢◤↑↓→←↘↙⌒∮※ㄨ╬▂▃▄▅▆▇█]+' return re.sub(pat, '', sent)QQ起昵称专用特效字符︻︼︽︾〒原创 2021-09-22 17:07:07 · 804 阅读 · 0 评论 -
逐行读取/保存数据到 csv
import csvdef read_file(): file_path = 'abc.txt' save_path = '001.csv' out = open(save_path, 'a', newline='') csv_write = csv.writer(out, dialect='excel') i = 0 for line in open(file_path): print('i : ', i) arr .原创 2021-08-03 10:02:14 · 269 阅读 · 0 评论 -
Python - 接收命令行参数
文章目录方式一:通过sys.argv方式二:getopt()方式一:通过sys.argvimport sysif __name__ == '__main__': print(sys.argv) print(len(sys.argv))使用 python main.py 或用 pycharm 运行时,得到的结果为:['.../xxx/main.py'] # 本文件地址1如果在终端执行:(base) $ python main.py a b['main.py'原创 2021-07-16 12:11:24 · 7074 阅读 · 0 评论 -
PY - pymysql
PyMySQL文章目录PyMySQLPyMySQL 是什么数据库操作1、连接2、创建数据库表3、插入操作4、查询操作5、更新操作6、删除7、执行事务8、错误处理PyMySQL 是什么PyMySQL 是一个纯 Python 实现的 MySQL 客户端库,支持兼容 Python 3,用于代替 MySQLdb。注意:PyMySQL 不支持 _mysql 提供的低级AP I,如data_seek、store_result和use_result。用户应该使用PEP 249中定义的高级 API。但是一些API原创 2021-04-23 10:59:49 · 392 阅读 · 0 评论 -
Python 工具小结
文章目录anacondajupyterPycharmanaconda主页https://www.anaconda.comjupyter主页:https://jupyter.orgjupyter 不仅可以在线编译,还可以:灵活的在代码中插入md笔记创建、加载本地的 py 文件Pycharm...原创 2019-10-13 10:38:32 · 94 阅读 · 0 评论 -
Python - 编解码
文章目录关于编解码编码的种类关于编解码编码/解码本质上是一种映射a 用ascii编码则是65,计算机中存储的就是 00110101但是显示的时候不能显示 00110101,还是要显示’a’,计算机就需要解码编码:真实字符与二进制串的对应关系,真实字符 → 二进制串解码:二进制串与真实字符的对应关系,二进制串 → 真实字符编码的种类ASCII 占1个字节,只支持英文GB2312 占2个字节,支持6700+汉字GBK GB2312的升级版,支持21000+汉字,中文2个字节。Uni原创 2021-10-18 19:08:25 · 146 阅读 · 0 评论 -
Python 中的下划线
文章目录https://www.cnblogs.com/yunwangjun-python-520/p/10692851.htmlPEP-8Style Guide for Python Codehttps://www.python.org/dev/peps/pep-0008/中文说明:https://www.jianshu.com/p/ffcc66bab3cehttps://blog.csdn.net/ratsniper/article/details/78954852...原创 2021-09-27 10:32:33 · 280 阅读 · 0 评论 -
Python - 字符处理
文章目录提取不同类型字符提取不同类型字符转载自:https://www.cnblogs.com/zihe/p/8323508.htmlimport stringfrom collections import namedtupledef str_count(s): '''找出字符串中的中英文、空格、数字、标点符号个数''' count_en = count_dg = count_sp = count_zh = count_pu = 0 s_len = len(s)原创 2021-08-19 14:00:50 · 163 阅读 · 0 评论