![](https://img-blog.csdnimg.cn/5f08f3e7dc734cc385cdeeb3009f05c6.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
python
文章平均质量分 66
python学习
可乐大牛
上海某高校在读cs研究生,希望早点发出论文,考公考编 哈哈哈哈
展开
-
【爬虫】scrapy爬取招生院校专业信息
爬取链接中的大学以及对应的专业,存储为excel表格这是我第二次做爬虫,之前做过一次爬取豆瓣top250电影的爬虫,感兴趣的可以看链接和链接,前者是使用scrapy框架的,后者是使用request包实现的。起初我以为这个需求和之前的差不多,毕竟看着页面很简单,但是做起来发现并不是这样。,我最开始的想法是爬取这个页面,然后根据里面的这个a标签的跳转地址爬取我们真正想要爬取的信息。,遗憾的是,这是一个动态的html,相关信息是js控制的,所以上面的思路解决不了了。,观察到,其实这个请求还是有点规律的也就原创 2022-06-18 21:09:46 · 1263 阅读 · 1 评论 -
【python】求(不规则)多边形的面积 通用办法(已知多边形顶点的坐标)
import cv2import numpy as np image = cv2.imread('img.jpg') # 读入多边形图片polygon = np.array([[[2, 2], [6, 2], [6, 6], [2, 6]]], dtype=np.int32) # 多边形的顶点坐标im = np.zeros(image.shape[:2], dtype="uint8") # 获取图像的维度: (h,w)=iamge.shape[:2]polygon_mask = cv2.f转载 2022-05-29 21:30:11 · 1897 阅读 · 0 评论 -
【python】excel文件(.xls文件)处理
目录概述xlrdxlwt概述xlrd 用于读取文件,xlwt 用于写入文件,xlutils 是两个工具包的桥梁,也就是通过xlrd 读取.xls文件,然后通过xlutils 将文件内容交给xlwt处理并且保存。xlrd常用API:#导入import xlrd# 打开文件 必须是存在的文件路径wb = xlrd.open_workbook('路径')# 获取文件中所有的sheet对象objects = wb.sheets()#获取文件中所有的sheet名称names = wb.原创 2022-05-27 20:34:46 · 3416 阅读 · 0 评论 -
【python脚本】按照清晰度对图片进行分类
目录原理使用原理在《Analysis of focus measure operators for shape-from-focus》[2013 Pertuz et al.]。在这篇文献中,Pertuz 等人论述了近 36 种不同的图片清晰度评价(focus measure)方法。其中一种方式比较简单,就是使用拉普拉斯方差算法,直接得到一个浮点数方差表征清晰度。事先设定一个阈值,如果某图片的清晰度低于预先定义的阈值,那么该图片就可以被认为是模糊的。高于阈值,就不是模糊的,或者说是清晰的。此算法基于以下原创 2022-05-10 16:36:37 · 1313 阅读 · 0 评论 -
【python】数字图像处理
目录基本概念图像增强线性变换分段线性变换对数变换基本概念数字图像定义:对于一幅图像,我们可以将其放入坐标系中,这里取图像左上定点为坐标原点,x 轴向右,和笛卡尔坐标系x轴相同;y 轴向下,和笛卡尔坐标系y轴相反。这样我们可将一幅图像定义为一个二维函数 f(x,y),图像中的每个像素就可以用 (x,y) 坐标表示,而在任何一对空间坐标 (x,y) 处的幅值 f 称为图像在该点的强度或灰度,当 x,y 和灰度值 f 是有限离散数值时,便称该图像为 数字图像注:f的取值为区间[Lmin,Lmax],也将其称原创 2022-05-09 22:23:44 · 6222 阅读 · 1 评论 -
【python】提高图像质量
目录概述PIL实现概述调研了一些图像增强的方式基于python自带的PIL 实现图片亮度增强、饱和度增强、对比度增强以及锐度增强PIL实现from PIL import Imagefrom PIL import ImageEnhance# 原图image = Image.open('img/timg.jpg')image.show()# 亮度增强enh_bri = ImageEnhance.Brightness(image)brightness = 2image_brighte原创 2022-05-09 19:15:53 · 5660 阅读 · 0 评论 -
【python】opencv总结
目录简介基本操作简介安装:pip install opencv-python==3.4.2.17测试:import cv2# 读一个图片并进行显示(图片路径需自己指定)lena=cv2.imread("1.jpg")cv2.imshow("image",lena)cv2.waitKey(0)利用SIFT和SURF进行特征提取的话,还需要pip install opencv-contrib-python==3.4.2.17 基础模块:core、highgui、imgproccore模原创 2022-05-07 22:27:55 · 2684 阅读 · 0 评论 -
【python脚本】根据部分图片筛选原始数据
目录背景需求实现结果展示背景原始内容:若干图片数据、两个对应的txt文件(rec_gt.txt和Label.txt)详细内容如下:图片数据:rec_gt.tx:Label.txt:需求任务:从图片文件夹内挑选一部分图片,形成一个新的文件夹根据挑选的文件名在对应的两个txt文件内找到对应的行保留下来将保留下来的内容形成新的txt文件和处理日志可以根据挑选的图片,反向将剩余的图片挑出形成文件夹并生成对应的txt文件和处理日志要求输出:包含对应图片名的Label_res.t原创 2022-04-25 12:02:04 · 1329 阅读 · 0 评论 -
【python】matplotlib总结
目录快速入门快速入门概述:画图首先要创建画布,然后在上面画一幅或者多幅图,每一幅图称为子图。原创 2022-04-19 21:27:27 · 1221 阅读 · 0 评论 -
【python】numpy常用函数总结
文章目录概述创建数组操作数组概述常见属性:dtype查看数组元素类型和shape查看数组尺寸常见方法:astype用于转换数组元素的类型和reshape用于转换数组尺寸核心概念:轴。一维就只有0轴;二维行的增长方向是0轴,列的增长方向是1轴;三维,层的增长方向是0轴,行的增长方向是1轴,列的增长方向是2轴。理解:这个三维矩阵打印出来,两个空格隔开了三层。每一层相当于一个二维数组,自上而下是行增长的方向,自左而右是列增长的方向。例子:各种求和广播和矢量化:numpy数组想要给数组全部元素+原创 2022-04-17 22:15:51 · 2578 阅读 · 0 评论 -
【pandas】testdata数据集分析
文章目录一、数据集二、实现导包和准备工作1、查看数据类型、表结构、统计各字段缺失值个数2、删除所有全为空的列及身份证号为空的数据3、将“开始从事某工作年份”规范为4位数字年份,如’2008‘,并将列名修改为’参加工作时间‘4、添加列’工龄‘(体检年份-参加工作时间)和’年龄‘(体检时间-出生年份)两列。5、统计不同性别的白细胞计数均值,画出柱状图6、统计不同年龄段的白细胞计数,画出柱状图一、数据集数据集:资料,提取码:zmlc二、实现导包和准备工作# -*- coding: utf-8 -*im原创 2021-06-16 15:40:18 · 4191 阅读 · 3 评论 -
【可视化】小费(tips)数据集分析
小费原创 2021-05-08 16:18:16 · 10904 阅读 · 2 评论 -
【pandas】小费(tips)数据集缺失值处理
文章目录一、数据集二、实现导包查看数据的描述信息与缺失值可视化显示用餐时间time的不重复值修改拼写错误的字段值,以星期为例检测数据中的缺失值删除一行有两个缺失值的数据删除sex或者time为空的数据剩余空值用平均值填充一、数据集数据集:资料,提取码:zmlc二、实现导包# -*- coding: utf-8 -*import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport matplotlib#原创 2021-05-19 09:08:20 · 10057 阅读 · 4 评论 -
【pandas】星巴克门店数据集分析
文章目录一、数据集二、实现导包1.查看星巴克旗下有多少品牌2.查看全世界一共有多少个国家和地区开设了星巴克门店,显示门店数量排名前10和后10的国家和地区。# 3.用柱状图绘制排名前10的分布情况4.显示拥有星巴克门店数量前10的城市5.按照星巴克门店在中国的分布,统计排名前10的城市绘制柱状图导包一、数据集数据集:资料,提取码:zmlc二、实现导包# -*- coding: utf-8 -*import pandas as pdimport numpy as npimport matplo原创 2021-06-05 09:04:30 · 10358 阅读 · 13 评论 -
【可视化】鸢尾花(iris)数据集可视化
文章目录预备工作数据集导包数据集导入、划分折线图柱状图散点图预备工作数据集数据集:资料,提取码:zmlc导包import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport matplotlib数据集导入、划分# 导入鸢尾花数据集df = pd.read_csv('iris.csv', index_col=0,header=0,names=[0,1,2,3,'Species'])# 划分数据集原创 2021-05-01 12:09:38 · 9628 阅读 · 2 评论 -
python如何安装Dlib库
使用python安装Dlib库(简单有效)寒假这段时间在忙着做学校的创新项目,是和人脸识别相关的,看了很多网上的代码和教程,...原创 2020-07-19 21:54:26 · 15648 阅读 · 5 评论 -
【人工智能导论】Project 1: Search
我的想法都放在注释了search.py# -- coding: utf-8 --# ---------# Licensing Information: You are free to use or extend these projects for# educational purposes provided that (1) you do not distribute or publish# solutions, (2) you retain this notice, and (3) you原创 2020-12-25 15:13:09 · 5034 阅读 · 1 评论 -
记录一次人脸识别的学习(笔记)
涉及的功能模块摄像头的调用脸部图像识别和处理活体检测多线程的应用定时器的调用邮件发送知识点大纲人脸识别基本原理人脸识别库的安装和应用多线程方法的调用第三方邮件发送组件yagmail的基本使用活体检验算法的应用以及代码实现人脸识别的基本原理所谓机器学习:按照一堆已知的数据,利用计算机去进行演算,最终得到一个合适的计算公式(机器学习模型)来拟合这些数据的过程,就是机器学习x=1 2 6y=3 5 13得到y=2x+1再往下就是根据公式去预测新的值 如x=3 得到y=原创 2020-07-26 20:48:35 · 322 阅读 · 0 评论 -
【爬虫】案例(爬取豆瓣top250)[完整+详细]
流程** 使用requests库获取网页数据,使用bs4和re对网页进行解析和文字匹配最后使用xlwt和pymysql将数据存入excel和数据库**主函数from bs4 import BeautifulSoup # 网页解析,获取数据import re # 正则,文字匹配import requests # 获取网页数据import xlwt # excel操作import pymysql.cursors # 数据库操作def main():原创 2020-07-15 11:14:54 · 6692 阅读 · 6 评论 -
爬虫案例(爬取豆瓣top250)(Scrapy版)
之前先写过一篇Python爬虫案例(爬取豆瓣top250)[完整+详细]这篇是基于Scrapy框架的 更加便利 因为了解了爬虫的原理之后 没有必要再去重复写轮子 直接快速开发 专注于业务逻辑即可安装准备安装Scrapy:直接pip install Scrapy就行如果出现问题 就是一些基础模块没有导致安装失败我之前安装Dlib库出现问题 网上各种神仙操作都不行 最后还是下载了vs然后在里面安装了python之后无论安装什么都没出现过问题了 参考这里环境准备创建爬虫项目新建个文件夹或者找个自己原创 2020-07-28 21:44:31 · 3743 阅读 · 2 评论 -
记录一次人脸识别的学习(代码)
读取摄像头信息并且带上文字#!/usr/bin/env python# -*- coding: utf-8 -*-# @Time : 2020/7/23 20:11# @Author : Yuxinxin# @Site : # @File : cv2读取摄像头图像信息.py# @Software: PyCharmimport cv2from PIL import Image, ImageDrawimport numpy as np# 1、调用摄像头# 2、读原创 2020-07-26 20:58:34 · 223 阅读 · 0 评论 -
【Django】Django起步
文章目录1、准备工作2、HelloWorld2.1 目录分析:2.2 视图和 URL 配置:1、准备工作安装Django:pip install Django创建项目:django-admin.py startproject douban启动项目:python manage.py runserver2、HelloWorld2.1 目录分析:douban: 项目的容器。 manage.py: 一个实用的命令行工具,可让你以各种方式与该 Django 项目进行交互。douban/__原创 2021-06-29 12:21:15 · 137 阅读 · 0 评论 -
vscode配置Anaconda报错CommandNotFoundError: Your shell has not been properly configured to use ‘conda a
问题描述CommandNotFoundError: Your shell has not been properly configured to use ‘conda activate’.问题解决原来是我的终端被我设置成了utf-8的编码格式需要在开始之前输入chcp 936很难受原创 2021-03-09 22:35:41 · 431 阅读 · 0 评论 -
python连接MySql数据库
来源:https://www.cnblogs.com/woider/p/5926744.html==================pymysql===================由于 MySQLdb 模块还不支持 Python3.x,所以 Python3.x 如果想连接MySQL需要安装 pymysql 模块。 pymysql 模块可以通过 pip 安装。但如果你使用的是 pycharm IDE,则可以使用 project python 安装第三方模块。 [F...转载 2020-07-14 15:16:08 · 331 阅读 · 0 评论 -
【Anaconda】载包速度很慢
问题描述conda install速度很慢问题解决修改conda镜像路径执行如下命令,更换仓库径路为清华镜像路径conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/在自己用户目录C:\Users<你的用户名>下生成一个文件,名字为:.condarcconda config --set show_channel_urls yes...原创 2021-03-09 21:39:00 · 243 阅读 · 0 评论