python
文章平均质量分 66
若如初见kk
人生苦短,我用python!
展开
-
python常用模块
【代码】python常用模块。原创 2024-04-05 11:52:52 · 143 阅读 · 0 评论 -
Python职员信息管理系统-简易版(Python基础)
1.添加职工数据2.显示职工数据3.查询职工数据4.修改职工数据5.删除职工数据6.保存职工数据7.排序职工数据8.统计职工工资数据9.退出。原创 2023-02-25 11:08:00 · 2130 阅读 · 1 评论 -
【Python-延迟/阻塞ERROR】运行Python脚本时,print函数输出延迟问题
最近写了几个python脚本,在用print输出的时候,都有一个很讨厌的问题,就是print的输出被延迟了,什么情况呢,类似这样1 import os2 print ‘first print3 os.system(’./second-print.sh’)在second-print.sh中,也会有一些打印信息输出到控制台正常情况下,first print要先于second print出现再控制台,但实际的情况却是相反的。用命令行参数-u启动python,禁用stdout缓冲,解决此问题原创 2021-11-23 21:41:36 · 1636 阅读 · 0 评论 -
【Python-ERROR】Win10系统Python安装jieba分词失败及解决方法
Win10&Linux系统Python安装jieba分词失败及解决方法;原因:**OpenSSL版本过低或者不存在** 到 [https://slproweb.com/products/Win32OpenSSL.html](https://slproweb.com/products/Win32OpenSSL.html) 上下载Windows上的OpenSSL,根据自己的系统选择是32位还是64位,下载EXE版就行,然后安装。原创 2020-09-03 20:06:40 · 1184 阅读 · 0 评论 -
【Python-ERROR】‘gbk‘ codec can‘t encode character ‘\xa0‘ or ‘\u2003‘ in position XXX
在通过Python爬取网页时,通过print函数输出内容进行调试,但是总会遇到解码不了的字符,试过各种方法都不行,错误代码如下:> 'gbk' codec can't encode character '\xa0' in position 8186: illegal multibyte sequence可以利用translate方法、split()解决,并且还可以替换\t \n字符原创 2021-11-23 00:08:08 · 3343 阅读 · 0 评论 -
Python采集全国各地百度地图上店铺POI数据(母婴、美食等)
1.先注册百度地图开发平台账号,创建应用,获得AK;2.注册好账号后登录,进入到百度地图开放平台控制台,如下图所示,创建应用,获取API接口连接权限AK,然后就可以开始写代码了。代码思路:1. 设置好URL格式,按照行政区进行检索,通过requests模块访问URL获取数据;2. 对检索到JSON数据进行解析,提取需要的字段数据;3. 保存数据为CSV格式;4. 准备好全国行政区清单,设置好循环检索程序,批量检索所有城市数据;5. 运行程序获取数据,并对数据进行去重等操作。原创 2021-11-18 23:05:32 · 3717 阅读 · 2 评论 -
Python常用标准库之正则表达式
Python常用标准库之正则表达式1.概念2.re模块常用函数2.1 match()2.2 search()2.3 findall()2.4 split()2.5 sub()3.特殊符号和字符3.1 管道符号4.在线测试工具5.常用正则表达式案例1.概念正则表达式,又称规则表达式。(英语:Regular Expression,在代码中常简写为regex、regexp或RE),计算机科学的一个概念。正则表达式通常被用来检索、替换那些符合某个模式(规则)的文本。许多程序设计语言都支持利用正则表达式进行字符原创 2021-01-03 19:24:26 · 1002 阅读 · 0 评论 -
Python实现多任务(协程、线程、进程)
Python实现多任务1.多任务-协程2.多任务-线程3.多任务-进程1.多任务-协程from gevent import monkeyimport geventimport urllib.requestmonkey.patch_all()def my_download(url): print('GET:%s' % url) resp = urllib.request.urlopen(url) data = resp.read() print('%d byte原创 2020-12-27 22:30:30 · 399 阅读 · 0 评论 -
Python实现简易版web服务器
1.Python实现简易版web服务器# coding = utf-8import socketimport reimport threadingimport multiprocessingimport geventimport sysfrom gevent import monkey# monkey.patch_all()# 采用多进程时,如果开启monkey.patch_all()会报错,报错信息如下:# TypeError: Cannot serialize socket obj原创 2020-12-27 22:22:15 · 801 阅读 · 0 评论 -
Python计算商品复购率
1. Python计算产品复购率需求:给出数据商品购买数据,数据格式.csv,包含:购买月份、手机号,根据该数据计算产品的复购率。复购率算法:算法一:单位时间内(按每月):R = 复购人数/总购买人数算法二:单位时间内(按每月):R = 复购交易次数/总交易次数部分数据样式如下:2.参考代码# coding = utf-8import pandas as pdimport timeclass RepurchaseRate(object): """1.普通配置电脑百万条原创 2020-12-27 18:49:56 · 2407 阅读 · 4 评论 -
Python知识点总结
Python知识点总结1.Python基础知识1.1 变量及类型1.2 标识符与关键字1.3 常用格式化输出符号1.4 运算符1.4.1 算数运算符1.4.2 赋值运算符1.4.3 比较(即关系)运算符1.4.4 逻辑运算符1.5 数据类型转换1.6 判断与循环语句1.7 字符串、列表、元祖、字典1.7.1 公共方法1.7.2 字符串常见操作1.7.3 列表基本操作1.7.4 元组1.7.5 字典常见操作1.8 函数1.9 文件操作1.10 面向对象1.10.1 概念1.10.2 命名、分类、属性与方法1.原创 2020-12-27 18:26:36 · 21206 阅读 · 13 评论 -
Python批量修改文件名(Python基础)
Python批量给文件夹中文件加上或删除前缀1.需要使用os模块中的两个函数:修改文件名:os.rename(旧文件名,新文件名)列出本文件夹中所有文件名:os.listdir()2. 参考代码:import osflag = False # 如果flag是True的话,要 增加前缀,否则要 删除前缀if flag: for i in os.listdir(): if "-" in i: # 有“-”说明是我们要重命名的文件 os.ren原创 2020-12-27 14:29:37 · 1122 阅读 · 0 评论 -
Python员工信息管理系统-简易版(Python基础)
Python员工信息管理系统-简易版1.职员信息管理系统2.参考代码1.职员信息管理系统要求:1、依次从键盘录入每位员工的信息,包括姓名、员工id、身份证号;2、身份证号十八位,要求除了第18位可以为x,其余都只能为数字;3、id须由5位数字组成;4、否则提示用户重新输入不符合规则的那几项;5、能随时查看已录入的员工及其信息;提示:1、字符串.isdigit()可以判断字符串是否是全是数字;2、if 字符串[-1] in “xX” 判断最后一个是不是x或X;3、每位职员的信息可以用字典原创 2020-12-27 13:53:54 · 5892 阅读 · 6 评论 -
Python学生信息管理系统-简易版(Python基础)
Python学生信息管理系统-简易版1.需要完成的基本功能:2.参考代码1.需要完成的基本功能:1、添加名片2、删除名片3、修改名片4、查询名片5、退出系统6、要求:程序运行后,除非选择退出系统,否则重复执行功能7、运行界面2.参考代码default = ['张三', '男', '18']card_all = [default]while True: print("************************** 名片管理器 **********************原创 2020-12-27 13:47:22 · 13158 阅读 · 3 评论 -
Python打印星号图形系列(Python基础)
Python打印星号图形系列1.使用while循环输出如下图形2.使用while循环输出如下图形3.使用while,完成以下图形的输出4.使用循环嵌套打印九九乘法表5.使用while,完成以下图形的输出1.使用while循环输出如下图形** ** * ** * * ** * * * *参考答案:i = 1while i <= 5: j = 1 while j <= i: print("* ", end = '') j += 1原创 2020-12-27 13:40:00 · 32789 阅读 · 1 评论 -
Windows上安装Python(win10/win7)
Windows上安装Python(win10/win7)1.Windows上安装Python1.1 安装来源1.2 选择版本1.3 安装选项1.4 查看安装是否成功2.可能遇到的问题2.1 报错一:未指定错误(0x80072efd)3.参考地址:1.Windows上安装Python1.1 安装来源通过官网安装:点击进入官网下载:https://www.python.org/downloads/windows/此方式比较简单,进入后如下图:1.2 选择版本前面进入Python下载官网后,我们可原创 2020-12-26 14:42:52 · 1173 阅读 · 0 评论 -
【Python-延迟/阻塞】解决 tkinter 与 sleep 同时使用延迟问题
1.问题描述当Python程序中同时存在tkinter和time.sleep()时,启动程序进入到listbox.insert时,窗口就一直无响应,所有listbox.insert的内容都会阻塞,要等整个for循环完(也就是所有time.sleep(3)都要执行完)了才会在窗口显示。2.问题分析多线程(threading——join)join ()方法:主线程A中,创建了子线程B,并且在主线程A中调用了B.join(),那么,主线程A会在调用的地方等待,直到子线程B完成操作后,才可以接着往下执行,原创 2020-12-23 23:03:11 · 4358 阅读 · 0 评论 -
Python文件编译或打包成exe文件,直接在其它Windows电脑上运行
Python文件编译成exe文件1.安装编译工具2.编译命令3.编译后exe文件太大问题可能遇到的问题解决办法将Python文件编译成exe文件后,可以直接在Windows上运行,不需要再依赖Python环境,可以复制到其他电脑中直接使用,特别方便。1.安装编译工具pyinstaller是Python中将py文件编译成为exe文件的免费工具,特别好用,在Windows中,pyinstaller依赖pywin32,所在如果打包有问题请先安装pywin32模块,安装命令如下:pip install py原创 2020-11-08 00:49:13 · 26505 阅读 · 8 评论 -
Python读取PDF文件中的文本
1.安装pdfminer3kpip install pdfminer3k2.测试脚本from io import StringIOfrom io import openfrom pdfminer.converter import TextConverterfrom pdfminer.layout import LAParamsfrom pdfminer.pdfinterp import PDFResourceManager, process_pdfdef read_pdf():原创 2020-09-22 21:45:07 · 1755 阅读 · 2 评论 -
Python保存数据到Excel文件
目录1.xlwt安装2.使用方法1.xlwt安装pip install xlwt2.使用方法import xlwt# 创建一个Excel文件file = xlwt.Workbook()# 创建sheet工作表sheet1 = file.add_sheet(u'表1', cell_overwrite_ok=True)# 写入数据从 0 开始计数sheet1.write(0, 0, "信息来源") # 第1行,第1列sheet1.write(0, 1, "公告日期") # 第1原创 2020-09-21 23:43:21 · 6877 阅读 · 2 评论 -
Python批量翻译单词
目录1.pyquery简介1.1 安装1.2 使用方法2.通过有道翻译单词1.pyquery简介1.1 安装安装命令:pip install pyquery有兴趣可以看看:pyquery官方文档1.2 使用方法>>> from pyquery import PyQuery as pq>>> d("#hello")[<p#hello.hello>]>>> p = d("#hello")>>> prin原创 2020-09-21 23:24:30 · 1139 阅读 · 0 评论 -
Python使用collections模块统计单词频率(出现次数)
collections模块简介1.collections模块1.1 Counter计数器,主要用来记录每一个元素出现的次数1.2 namedtuple生成可以使用名字来访问元素内容的tuple1.3 deque双端队列,可以快速的在两端追加和推出对象1.4 defalutdict带有默认值的字典1.collections模块在内置数据类型(dict、list、set、tuple)的基础上,collections模块还提供了几个额外的数据类型:Counter、deque、defaultdict、named原创 2020-09-21 22:52:49 · 1418 阅读 · 0 评论 -
Python中利用正则表达式做数据清洗(re)
目录1.常用正则表达式Python中常用正则表达式2.正则表达式做数据清洗2.1 从网页HTML标签中提取文本2.2 去掉英文文章中标点符号,提取词汇2.3 提取以.com结尾的邮箱1.常用正则表达式Python中常用正则表达式2.正则表达式做数据清洗2.1 从网页HTML标签中提取文本import retext = "<div><p>\n你好\nPython:</p><p>Python是一种跨平台的计算机程序设计语言。 </p><原创 2020-09-21 22:13:14 · 5184 阅读 · 0 评论 -
Python将Word文本转化为字符串(str)
# 1.docx模块的安装### [Python中安装docx模块及报错解决方法](https://blog.csdn.net/Artificial_idiots/article/details/108396112)# 2.Word文本转化为字符串原创 2020-09-21 21:35:49 · 4078 阅读 · 10 评论 -
使用Windows任务计划自动运行Python程序
目录1.编写Python程序2.编写Windows批处理命令3.创建Windows任务计划1.编写Python程序测试代码如下,程序名称为 test01.py:# coding = utf-8print("这是一个测试Windows任务计划自动运行的Python程序")input("程序运行结束!") # 保证程序运行完成后窗口不会立即关闭2.编写Windows批处理命令因为Windows不能直接运行Python程序,所以需要通过Windows批处理命令来运行Python程序,在与要运原创 2020-09-14 00:16:05 · 8070 阅读 · 13 评论 -
Python使用selenium设置无浏览器(界面)运行
设置无界面(浏览器)运行代码# 设置options参数,以开发者模式运行option = ChromeOptions()option.add_experimental_option("excludeSwitches", ["enable-automation"])# 加上下面两行,解决报错,设置无界面运行option.add_argument('--no-sandbox')option.add_argument('--disable-dev-shm-usage')option.add_arg原创 2020-12-27 13:08:47 · 3428 阅读 · 0 评论 -
Requests 库的中文文档
1.requests库简介requests库相当于Python中的“浏览器”,可以通过它进行网络请求、获取网页数据,功能强大而且特别好用。Requests 的中文文档 很有趣,我们一起来看看。你没看错,这就是它官方文档的风格,似乎有点鬼畜。2.requests用法如下:导入re模块:import requests获取响应数据与解码:a. 获取响应数据代码:response = requests.get(url)b. 解码代码:html = response.content.decode(原创 2020-12-27 13:07:52 · 4953 阅读 · 3 评论 -
Python将word转化为txt文本
测试环境,Windows10,Python3.6.3一、安装 docxpip install docx完了之后,导入:import docx发现报错:ModuleNotFoundError: No module named ‘exceptions’说没有 exceptions 这个模块原创 2020-12-27 13:05:51 · 8922 阅读 · 2 评论 -
Python使用selenium爬取淘宝商品信息
使用 selenium 模拟浏览器抓取淘宝商品信息1.创建driver对象2.请求淘宝商品信息3.实现翻页4.通过driver对象,解析商品页面内容,获取需要的数据5.保存数据到MongoDB数据库原创 2020-08-26 22:36:37 · 730 阅读 · 1 评论 -
Python实现停车场管理系统
1. 为一个车位数量固定的停车场,设计一个管理系统;2. 停车信息包括:编号、车牌号(若存在)、类型、车位编号、使用日期、入场时间、单价、费用、经手人3. 停车信息存储在数据文件中,程序至少实现功能:浏览、查询、入场、出场、导出、计费、系统菜单4. 按面向对象程序设计方法进行类的定义:选择合适的数据存储结构,并定义相应的数据元素类,选择合理的操作方法定义相应的算法实现类原创 2020-08-26 22:03:14 · 18698 阅读 · 37 评论 -
常用正则表达式
常用正则表达式1. 校验数字的表达式数字:^[0-9]*$n位的数字:^\d{n}$至少n位的数字:^\d{n,}$m-n位的数字:^\d{m,n}$零和非零开头的数字:^(0|[1-9][0-9]*)$非零开头的最多带两位小数的数字:^([1-9][0-9]*)+(\.[0-9]{1,2})?$带1-2位小数的正数或负数:^(\-)?\d+(\.\d{1,2})$正数、负数、和小数:^(\-|\+)?\d+(\.\d+)?$有两位小数的正实数:^[0-9]+(\.[0-转载 2020-07-11 12:04:45 · 542 阅读 · 0 评论