Python
文章平均质量分 57
记录Python学习笔记和心得
死磕的斯坦张
Coding everyday。
展开
-
基于Pygame框架的交通导流可视化模拟
本项目根据以下项目要求完成的一个python课程的期末大作业,本项目主要就是采用pygame框架进行的一个交通导流的可视化模拟。自主确定相应的假设或前提,如通过合流处的车辆数量(这个是随机的,你要考虑如何随机地产生车辆),车辆的速度等;你要模拟的合流处,主车道有n个车道(n>=3),匝道是1个车道,合流后,主车道还是至少n个车道;你模拟的道路长度必须满足一定的条件,从而有可能让一些在最右侧车道上的车,在你程序的引导下,变道(不在最右侧车道)通过合流处,从而不需要交替通行,降低合流处的压力;每一辆车,在你的可原创 2022-06-13 12:05:24 · 2255 阅读 · 2 评论 -
使用Python进行文件快速搜索(建立文件搜索索引)
基础搜索方法:用 pathlib 库搜索文件用 Python 搜索文件时需要使用 pathlib 库的 glob() 函数和 rglob() 函数,glob() 函数可以实现基于文件名的搜索方法,rglob 函数可以实现基于扩展名的搜索方法。from pathlib import Pathbase_dir = '/Users/edz/Desktop/'keywords = '**/*BBC*'# 遍历base_dir指向的目录下所有的文件p = Path(base_dir)# 当前目录原创 2021-11-26 11:04:24 · 11975 阅读 · 0 评论 -
python基于词语情感色彩进行数据分析(jieba库)
关键词提取移除标点符号一般有两种方法:删除停止词(Stop Words);根据词性提取关键词。words2 = jieba.cut(words1)words3 = list(words2)print("/".join(words3))# 速度/快/,/包装/好/,/看着/特别/好/,/喝/着/肯定/不错/!/价廉物美stop_words = [",", "!"]words4 =[x for x in words3 if x not in stop_words]print(words4)原创 2021-11-24 15:33:36 · 4085 阅读 · 2 评论 -
Python 实现“替换”功能
用 Python 实现“替换”功能string1="aaa新年快乐bbb"string2=string1.replace("新年快乐", "恭喜发财")print(string2)# aaa恭喜发财bbbstring3="aaa新年快乐bbb新年快乐ccc"string4=string3.replace("新年快乐", "恭喜发财", 2)print(string4)# aaa恭喜发财bbb恭喜发财ccc实现批量替换用字典 + 自定义函数替代 replace 函数实现批量“一对一”原创 2021-11-23 21:47:21 · 6503 阅读 · 0 评论 -
Python合并不同类型的文件内容(word,excel,txt)
提取文件内容import docxdef merge_without_format(docx_files: list): ''' 只获取内容进行合并 ''' # 遍历每个文件 for docx_file in sorted(docx_files): another_doc = Document(docx_file) # 获取每个文件的所有“段落” paras = another_doc.paragraphs原创 2021-11-23 21:31:44 · 744 阅读 · 0 评论 -
OCR图片转文字两种python方法实现
图片转文字的两种处理方法:一种是文字识别工作都需要在网络侧完成的方式,我们称为在线识别;另一种是不需要互联网功能的,我们称作离线识别。在线识别方式先看第一种,在线识别的方式。在线识别方式最大的优点就是,它在初次进行文字识别的时候,准确率非常高。比如对聊天截图中的识别准确率就高达 99%。因为在线识别使用了人工智能领域的深度学习算法和文字识别相结合的技术,能够把图片转换成文字后,还能在语义上把相近的字进行二次纠正。比如说,被识别的内容包含英文单词“Hello”,一旦它的字母“o”被识别成数字“0”,原创 2021-11-18 11:58:05 · 5428 阅读 · 0 评论 -
关于python操作excel文件相关操作(拆分,汇总excel文件)
实现文件中供应商按照供货类型的总额进行统计排序分别输出import xlrd data = xlrd.open_workbook(r'C:\Users\zh128\Desktop\data2.xlsx')table = data.sheets()[0]a = []b = []c = []for i in range(1,table.ncols+1): s=[] temp = table.row_values(i) s.append(temp[0])原创 2021-11-17 16:45:16 · 470 阅读 · 0 评论 -
Jupyter Notebook中安装第三方库
pip 可以在所有环境下安装python包。conda 可以在conda环境下安装所有包。通用安装方式:# Install a conda package in the current Jupyter kernelimport sys!conda install --yes --prefix {sys.prefix} numpy这些增加的内容确保了conda能在当前运行的Jupyter核内安装这个包。# Install a pip package in the current Jupyter原创 2021-11-17 16:42:38 · 3214 阅读 · 0 评论 -
python判定三国演义和水浒传风格相似性(三种算法展示)
1. jaccard算法求文本的相似度# -*- coding: utf-8 -*-# 正则包import re# 自然语言处理包import jiebaimport jieba.analyse# html 包import htmlfrom numpy import *from zhon import *class JaccardSimilarity(object): """ jaccard相似度 """ def __init__(self, c原创 2021-09-29 17:41:03 · 435 阅读 · 0 评论 -
python统计英文文本词频和提取文本关键词
统计一段英文的词频,以下代码只将标点符号省去,没有去除英文中介词,数词,人称代词等,如需要改进在统计时候直接去除相应词汇即可。#读取文本txt = open("english.txt","r",errors='ignore').read()#字母变小写txt = txt.lower()for ch in '!"#$&()*+,-./:;<=>?@[\\]^_{|}·~‘’':#替换标点 txt = txt.replace(ch,"")#根据空格,空字符,换行符,制表原创 2021-09-29 17:21:26 · 2816 阅读 · 0 评论 -
‘gbk‘ codec can‘t decode byte 0xa6 in position 4: illegal multibyte sequence 问题解决
在打开文件时出现“‘gbk’ codec can’t decode byte 0xa6 in position 4: illegal multibyte sequence”报错,解决如下:open(path,‘rb’),即在读取文本的时候加入参数‘b’。如果要读取二进制文件,比如图片、视频等等,用’rb’模式打开文件即可...原创 2021-09-28 21:15:47 · 3261 阅读 · 1 评论 -
python实现文本相似度算法的对比及
文本相似度算法的对比及python实现前言通常我们有这样的需求:对两篇文章或者产品内容进行重复率查询。为了解决类似的问题,罗列了一些常见的相似度算法,用python代码实现。五种常见的相似度算法:余弦相似度(cosine_similarity)、jaccard相似度、编辑距离(Levenshtein)、MinHash、SimHash + 海明距离。代码是一位前辈留下的,做一下整理分享出来。算法的具体理论这里就不硬搬生套了,大家可以自行搜索。有任何问题欢迎留言,谢谢!余弦相似度cosine_sim转载 2021-09-28 11:43:17 · 2415 阅读 · 0 评论 -
python对三国演义,水浒传,红楼梦人物关系与出场频率进行文本分析,数据可视化,词云分析
python对文本进行分析和数据可视化,主要运用到了jieba,worldcloudmatplotlib,nxwworkx,pandas库,其他库在代码中给出。 1.首先准备好这三本名著 2.准备好停词词库 代码如下: import matplotlib.pyp...转载 2021-09-28 11:27:39 · 5255 阅读 · 0 评论 -
关于企业贷款违约情况的数据分析研究的Python数据分析案例
关于企业贷款违约情况的数据分析研究import pandas as pd import numpy as np import matplotlib.pyplot as mp data = pd.read_csv('data.csv',encoding='gbk') # 加载数据data # 显示全部数据查看字段data.columnsIndex(['Unnamed: 0', '进项总额', '销项总额', '盈亏额', '进项退款率', '销项退款率', '平均退款率', '进货单量',原创 2021-09-10 12:49:53 · 2304 阅读 · 5 评论 -
Python操作Excel操作
目录标题用xlrd和xlwt读写excelxlrd操作Excel表对excel的操作'''写入excel文件'''参考资料用xlrd和xlwt读写excel首先下载安装xlrd和xlwt这两个库。1、打开excelreadbook = xlrd.open_workbook(r'\test\canying.xlsx')2、获取读入的文件的sheet sheet = readbook.sheet_by_index(1)#索引的方式,从0开始 sheet = readbook.s原创 2021-09-10 12:41:10 · 252 阅读 · 0 评论 -
面向对象:Python私有属性和私有方法
私有属性和私有方法1. 应用场景及定义方式应用场景在实际开发中,对象 的 某些属性或方法 可能只希望 在对象的内部被使用,而 不希望在外部被访问到私有属性 就是 对象 不希望公开的 属性私有方法 就是 对象 不希望公开的 方法定义方式在 定义属性或方法时,在 属性名或者方法名前 增加 两个下划线,定义的就是 私有 属性或方法class Women: def __init__(self, name): self.name = name # 不原创 2021-01-21 10:55:07 · 119 阅读 · 1 评论 -
面向对象:Python简单类封装性案例练习
目录01. 封装02. 案例1_小明爱跑步03. 案例2_摆放家具3.1 创建家具3.2 创建房间3.3 添加家具3.4 小结04. 案例3_士兵突击4.1 开发枪类4.2 开发士兵类05. 身份运算符is 与 == 区别:01. 封装封装 是面向对象编程的一大特点面向对象编程的 第一步 —— 将 属性 和 方法 封装 到一个抽象的 类 中外界 使用 类 创建 对象,然后 让对象调用方法对象方法的细节 都被 封装 在 类的内部02. 案例1_小明爱跑步需求小明 体重 75.0 公斤小原创 2021-01-21 10:50:48 · 465 阅读 · 0 评论 -
面向对象:Python类的简单使用
目录01. `dir` 内置函数02. 定义简单的类2.1 定义只包含方法的类2.2 创建对象2.3 案例引用概念的强调03. 方法中的 `self` 参数3.1 给对象增加属性3.2 使用 `self` 在方法内部输出每一只猫的名字04. 初始化方法4.1 在类的外部给对象增加属性4.2 初始化方法4.3 在初始化方法内部定义属性4.4 初始化的同时设置初始值05. 内置方法和属性5.1 `__del__` 方法5.2 `__str__` 方法01. dir 内置函数在 Python 中 对象几乎是原创 2021-01-21 10:44:12 · 101 阅读 · 0 评论 -
Python基础_字典和字符串使用
目录01. 字典1.1 字典的定义1.2 字典常用操作1.3 循环遍历1.4 应用场景02. 字符串2.1 字符串的定义2.2 字符串的常用操作2.3 字符串的切片03. 公共方法3.1 Python 内置函数3.2 切片3.3 运算符3.4 完整的 for 循环语法01. 字典1.1 字典的定义dictionary(字典) 是 除列表以外 Python 之中 最灵活 的数据类型字典同样可以用来 存储多个数据通常用于存储 描述一个 物体 的相关信息和列表的区别列表 是 有序 的对象集原创 2020-11-16 11:30:53 · 652 阅读 · 0 评论 -
Python基础_列表和元组使用
目录非数字型变量01. 列表1.1 列表的定义1.2 列表常用操作1.3 循环遍历1.4 应用场景02. 元组2.1 元组的定义2.2 元组常用操作2.3 循环遍历2.4 应用场景03.元组和列表之间的转换非数字型变量Python 中数据类型可以分为 数字型 和 非数字型数字型整型 (int)浮点型(float)布尔型(bool)真 True 非 0 数 —— 非零即真假 False 0复数型 (complex)主要用于科学计算,例如:平面场问题、波动问题、电感电容等问原创 2020-11-16 11:21:01 · 305 阅读 · 0 评论 -
Python基础_函数的基本使用
目录01. 函数概述02. 函数基本使用2.1 函数的定义2.2 函数调用2.3 案例03. 函数的参数3.1 函数参数的使用3.2 参数的作用3.3 形参和实参04. 函数的返回值05. 函数的嵌套调用06. 使用模块中的函数6.1 案例6.2 模块名也是一个标识符6.3 Pyc 文件(了解)01. 函数概述所谓函数,就是把 具有独立功能的代码块 组织为一个小模块,在需要的时候 调用函数的使用包含两个步骤:定义函数 —— 封装 独立的功能调用函数 —— 享受 封装 的成果函数的作用,在原创 2020-11-16 11:13:54 · 142 阅读 · 0 评论 -
Python基础_运算符
目录01. 算数运算符02. 比较(关系)运算符03. 逻辑运算符04. 赋值运算符05. 运算符的优先级01. 算数运算符是完成基本的算术运算使用的符号,用来处理四则运算运算符描述实例+加10 + 20 = 30-减10 - 20 = -10*乘10 * 20 = 200/除10 / 20 = 0.5//取整除返回除法的整数部分(商) 9 // 2 输出结果 4%取余数返回除法的余数 9 % 2 = 1**幂又原创 2020-11-12 14:02:01 · 78 阅读 · 0 评论 -
Python基础_基本控制语句if和while
目录01. 三大基本控制语句02. if 语句体验2.1 if 判断语句基本语法2.2 判断语句演练 —— 判断年龄2.3 else 处理条件不满足的情况03. 逻辑运算3.1 `and`3.2 `or`3.3 `not`04. if 语句进阶4.1 `elif`elif 演练 —— 女友的节日4.2 if 的嵌套if 的嵌套 演练 —— 火车站安检05. while 循环基本使用2.1 `while` 语句基本语法第一个 while 循环死循环2.2 赋值运算符06. break 和 continue6.原创 2020-11-12 14:00:30 · 389 阅读 · 0 评论 -
Python基础_变量和输入输出
目录0.1 标识符和关键字1.1 标识符1.2 关键字02. 变量的命名规则03. 变量的类型3.1 变量的类型3.2 不同类型变量之间的计算3.3 变量的输入输出3.4.4 变量的格式化输出0.1 标识符和关键字1.1 标识符标示符就是程序员定义的 变量名、函数名名字 需要有 见名知义 的效果,见下图:标示符可以由 字母、下划线 和 数字 组成不能以数字开头不能与关键字重名1.2 关键字关键字 就是在 Python 内部已经使用的标识符关键字 具有特殊的功能和含义开发者 不原创 2020-11-12 13:44:13 · 321 阅读 · 1 评论 -
PyCharm安装使用全教程——小白教学
目录01. 恢复 PyCharm 的初始设置02. 第一次启动 PyCharm2.1 导入配置信息2.2 选择许可协议2.3 PyCharm 的配置初始界面2.4 欢迎界面03. 新建/打开一个 Python 项目3.1 项目简介3.2 打开 Python 项目设置项目使用的解释器版本3.3 新建项目1) 命名规则2) 演练步骤04. 设置 PyCharm 的字体显示05. PyCharm 的升级以及其他5.1 安装和启动步骤5.2 设置专业版启动图标5.3 卸载之前版本的 PyCharm1) 程序安装2)原创 2020-11-10 20:51:37 · 2522 阅读 · 1 评论