自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 资源 (9)
  • 收藏
  • 关注

原创 pandas处理重复值

示例数据:import pandas as pddf = pd.DataFrame({'a':['Python', 'Python', 'Java', 'Java', 'C'], 'b': [2, 2, 6, 8, 10]})df仅判断单列是否有重复值使用values_counts()对列中值出现次数进行统计。结果默认按照降序进行排列,只需要判断第一行值的出现次数是否为1即可判断是否存在重复值。df['a'].value_counts()使用drop_duplicates()对

2021-03-27 12:23:44 1405

原创 Python opencv图像投影

题目描述利用opencv或其他工具编写程序实现图像的水平投影、垂直投影。实现过程import cv2 from pathlib import Pathgray_img = cv2.imread(str(Path(Path.cwd().parent, 'test.png')), 0)cv2.imshow('img1', gray_img)# 水平投影_, thresh1 = cv2.threshold(gray_img, 130, 255, cv2.THRESH_BINARY)

2021-03-25 13:27:23 1398

原创 xlrd.biffh.XLRDError: Excel xlsx file; not supported

安装了xlrd库之后,使用pandas读取.xlsx文件报错如下:经查询发现时新版本的xlrd只支持.xls文件,只需要将其退回指定旧版本即可。# 先卸载当前版本的xlrdpip uninstall xlrd# 安装旧版本pip install -i https://pypi.douban.com/simple xlrd==1.2.0之后运行就无错误。...

2021-03-19 17:51:02 228

原创 Python opencv算子边缘检测

题目描述利用opencv或其他工具编写程序实现算子边缘检测。实现过程import cv2import numpy as npfrom pathlib import Pathfrom PIL import Image, ImageDraw, ImageFontdef cv2ImgAddText(img, text, left, top, textColor=(0, 255, 0), textSize=20): # 判断是否OpenCV图片类型if (isinstance(img,

2021-03-18 19:54:43 617 2

原创 Python元组的相对不可变性

元组与多数Python集合(列表、字典、集)一样,保存的是对象的引用。如果引用的元素是可变的,即便元组本身不可变,元素依然可变。也就是说,元组的不可变性其实是指tuple数据结构的物理内容(即保存的引用)不可变,与引用的对象无关。虽然t1和t2是不同的对象,但是二者相等。查看t1[-1]列表的标识。就地修改t1[-1]列表。t1[-1]的标识没变,只是值变了。现在t1和t2不相等了。...

2021-03-16 19:27:10 354

原创 Python opencv图像滤波

题目描述利用opencv或其他工具编写程序实现图像滤波。实现过程import cv2import numpy as npfrom copy import copyimg = cv2.imread(r"C:\Users\pc\Desktop\test14-1.bmp")new_img = copy(img)#(20,20)表示左上角开始的坐标,0.5表示字母的大小,(0, 0, 255)表示颜色,1表示粗细cv2.putText(img, 'Original image', (20,

2021-03-11 14:13:16 683

原创 Python opencv边缘提取

题目描述利用opencv或其他工具编写程序实现图像的边缘提取。实现过程import cv2import numpy as np# imread()两个参数:# 1、图片路径。# 2、读取图片的形式(1:默认值,加载彩色图片。 0:加载灰度图片。 -1:加载原图片)img = cv2.imread(r"C:\Users\pc\Desktop\test1.bmp")cv2.imshow('img', img)ret, thresh1 = cv2.threshold(img, 80, 2

2021-03-11 14:09:54 2727 3

原创 依存句法树可视化(nltk、spacy)

本文介绍两种英文句法树可视化的方法。其中用到的spacy、nltk库等需要提前安装。如果安装有问题或需要一些包的话,可以在文章下留言,看到了就会回复的。1.nltk + stanfordcorenlp对句法树进行可视化from nltk.tree import Treefrom stanfordcorenlp import StanfordCoreNLPsentence = 'it is fast booting up , shutting down, and connection with

2021-03-07 12:02:22 16040 9

原创 使用Pandas进行数据清洗

数据清洗的目的是修正异常值,以更好地进行运算和观察结果。通过Pandas对序列或数据帧的清洗分为两个步骤:异常检测和数据修正。1.异常检测Pandas中的空值用‘NaN’表示,可以通过调用isnull和notnull来检测序列对象和数据帧对象是否为异常值。import pandas as pddic = {'name': ['Tom', 'Tony', 'Jack'], 'age': [16, 17, 18], 'class': [1, None, None]}df = pd.DataFrame

2021-03-06 20:04:15 3454 2

原创 基于NLTK搭建stanford parser环境

首先需要下载:stanford-parser网盘链接:网盘链接提取码:x9wz如果需要最新版可以去官网下载:https://nlp.stanford.edu/software/lex-parser.shtml解压之后会发现并没有englishPCFG.ser.gz这个文件。不要着急,englishPCFG.ser.gz这个文件其实就在stanford-parser-3.6.0-models.jar文件中,可以将其解压出来。使用方法:from nltk.parse.stanford impor

2021-03-06 12:42:07 1747

原创 Numpy中创建数组的n种方式,你都了解吗?

1、使用empty方法创建数组该方式可以创建一个空数组,dtype可以指定随机数的类型,否则随机采用一种类型生成随机数。import numpy as npdt = np.numpy([2, 2], dtype=int)2、使用array创建数组使用array方法可以基于Python列表创建数组,在不设置dtype的情况下,从列表中自动推断数据类型。import numpy as npdt = np.array([1, 2, 3, 4, 5])print('数组:', dt)pr

2021-03-02 17:01:53 11481

Python制作酷炫二维码(有界面,exe打包)

该压缩包是由Pyinstaller打包而成,下载之前先阅读博主文章,里面有详细介绍哦~

2021-09-14

文件一键整理(带撤销按钮).zip

文件一键整理exe文件,有界面,包含源码,该压缩包是由Pyinstaller 打包生成,能够直接将exe文件发送给他人使用。下载前请先阅读博主文章,有详细介绍哦!

2021-08-26

最新全国大学基本信息.csv

该数据集数据来自“中国教育在线”,2021-6-15 爬取,数据集中包含 2858 个高校的信息,包括学校id(网站中id:31)、学校名称(北京大学)、学校层次(985 211)、学校类型(综合类)、所处地区(北京海淀区)、招生办电话、招生办官网。部分高校招生办信息有所缺失。

2021-08-24

图片批量添加水印.zip

图片批量自动添加水印exe文件,有界面,包含源码,该压缩包是由Pyinstaller 打包生成,能够直接将exe文件发送给他人使用。下载前请先阅读博主文章,有详细介绍哦!

2021-08-20

Mysql知识点总结.pdf

参考《SQL必知必会》《Mysql必知必会》中的部分内容,总结Mysql基础知识,可供复习使用。

2021-08-05

Python面试精选45题.pdf

精心整理的Python面试题

2021-08-05

途牛旅游网游记.csv

详细资源介绍,可以看https://blog.csdn.net/qq_43965708/article/details/113661897。游记数据共10000行(已去重)

2021-08-05

英文姓名性别预测.csv

文件包含两列,name,sex。数据量95000,name列数据唯一且只包含英文

2021-04-10

中文姓名性别预测.csv

文件包含两列,name,sex。数据量45000,name列数据唯一且只包含中文

2021-04-10

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除