Python
文章平均质量分 57
拼命_小李
始终坚信知识源于分享,努力大于幸运!
亚太地区数学建模大赛优胜奖
美国大学生数学建模大赛优胜奖
中国大学生数学建模大赛省级三等奖
全国大学生计算机设计大赛国家级三等奖
大学生创新创业大赛省级三等奖
工商杯创新创业竞赛市级三等奖
展开
-
python基于用户画像和协同过滤实现电影推荐系统
1、概要 传统电影推荐系统大多使用协同过滤算法实现电影推荐,主要实现机理是通过用户评分及用户观影历史数据抽象为多维向量利用欧式距离或其他向量计算公式实现推荐,本文中将采用常用的机器学习算法Kmeans聚类算法+协同过滤算法+word2vec搜索推荐模型多模型多维度实现电影推荐系统,系统主要使用python语言进行开发,使用django网站web开发框架实现,数据库使用mysql 2、算法介绍 Kmeans聚类模型通过用户多维度多特征的信息:用户性别,年龄,地域,角色(学生、上班族原创 2022-12-10 14:47:41 · 3630 阅读 · 19 评论 -
python基于OCR深度学习实现商品配料表识别
我就当前热点话题,对食品配料识别进行了研究和实现,目前调研常用的几个开源的OCR识别模型主要有几个如下表所示,简单说一下各个模型的优缺点,paddleocr用起来很方便是国产识别模型(baidu搞得),只需要用python安装对应模块即可,而且识别速度和效果是这几个中最好的(个人感觉),而且可以更换不同级别的模型,例如服务器级别的chinese_ocr_db_crnn_server、和手机端级别的chinese_ocr_db_crnn_mobile等。# 安装paddleOCR。# 安装后创建服务环境。原创 2022-11-22 18:40:42 · 2007 阅读 · 1 评论 -
python 使用pyqt5实现了一个汽车配件记录系统
老姐要求做个记录销售汽车配件得的excel,我觉得太麻烦了,身为程序员的我 必须安排一个方便快捷的系统,安排上!环境要求:python3,pyqt5,pandas。原创 2022-09-21 11:36:42 · 556 阅读 · 0 评论 -
这就是为什么选择C语言不用python的原因
c是编译型语言,编译器直接将c的源码编译成机器语言运行,和像python、java这种解释型语言比减少了运行时解释翻译的时间,提高运行效率,其次c语言是没有像java语言的垃圾回收机制的,需要自行释放,降低本身内耗,也会提高其的执行效率。测试结果如下单位是秒,其实结果还是很惊人的,大家可能都知道c语言的执行速度远高于python,但是没想到会快这么多,差不多25倍的差距!编译成功后会在本文件夹下生成.dll动态库文件,我们需要使用python调用动态库文件并使用add求和函数。......原创 2022-07-28 11:27:00 · 2896 阅读 · 15 评论 -
Python如何获取网页指定数据信息
网络爬虫案例原创 2022-06-07 11:00:23 · 4631 阅读 · 1 评论 -
python使用mediapiple+opencv识别视频人脸
1、安装pip install mediapipe2、代码实现# -*- coding: utf-8 -*-""" @Time : 2022/3/18 14:43@Author : liwei@Description: """import cv2import mediapipe as mpmp_drawing = mp.solutions.drawing_utilsmp_face_mesh = mp.solutions.face_meshmp_face_dete原创 2022-03-23 13:53:08 · 4134 阅读 · 0 评论 -
docker部署Flask项目
1、部署案例这两个博主讲解的部署Flask的项目很详细可以参考搭建自己的项目Flask + Docker 无脑部署新手教程 - 知乎用Docker部署Flask应用_猪逻辑公园-CSDN博客_docker部署flask2、docker部署执行总结# 测试启动flaskgunicorn app:app -c gunicorn.conf.py# docker编译项目docker build -t faceflask:0.1 -f ./Dockerfile .# 测试环境..原创 2022-03-10 10:29:29 · 3767 阅读 · 0 评论 -
python mutiprocessing threading ThreadPoolExector
1、threading其实并不能做到实际多线程并发,某一刻ta只能有一个线程在执行,但是由于线程之间切换很快,会以为多个线程同时执行。2、mutiprocessing是多进程,ta可以做到并发操作。3、ThreadPoolExector线程池,ta的特别之处就是可以创建指定数量线程池,最大化合理利用资源,而且和threading相比的防御性更好 不容易造成程序崩溃。大家都知道使用线程和进程能够提高程序的执行效率,但是需要注意的是不是所有的程序在使用多线程和多进程都能够有所提高,下面通过数据实验,原创 2022-02-24 21:00:35 · 618 阅读 · 0 评论 -
python生成用户信息
1、使用python的faker模块实现用户信息模拟from faker import Fakerimport pandas as pdimport numpy as npfrom collections import OrderedDictfake = Faker(locale='zh_CN')sex_dict = OrderedDict([('男', 0.52), ('女', 0.48)])married_dict = OrderedDict([('未婚', 0.4), ('已婚',.原创 2022-02-17 14:45:50 · 1344 阅读 · 0 评论 -
python通过手机拍摄的视频图片进行人脸头像采集
python处理旋转的手机拍摄视频,并对视频使用dlib进行人脸采集原创 2022-01-13 14:42:07 · 2936 阅读 · 4 评论 -
python使用post发送表单formdata数据
import requestsimport jsonif __name__ == '__main__': url = 'http://127.0.0.1:5000/predict' data = {'name':'tets','age':13} r = requests.post(url, data=data) # 打印响应时间单位s # print(r.elapsed.microseconds/1000000) # 打印响应结果 # prin.原创 2022-01-12 12:37:37 · 3292 阅读 · 0 评论 -
python 随机复制文件夹内图片到指定路径,可设置数量
# -*- coding: utf-8 -*-""" @Time : 2021/11/30 9:21@Author : liwei@Description: """import osfrom shutil import copyimport randomif __name__ == '__main__': VAL_EXTRACT_NUM = 5 TRA_EXTRACT_NUM = 11 BASE_PATH = "./data/fake" VAL_T.原创 2021-11-30 14:27:24 · 338 阅读 · 0 评论 -
pyspark入门案例❤️pyspark处理log日志并实现简单热门推荐❤️(建议收藏)
❤️❤️❤️❤️❤️❤️❤️❤️❤️❤️写作不易请多多点赞评论支持博主❤️❤️❤️❤️❤️❤️❤️❤️❤️❤️1、目的"定时处理用户搜索日志,统计用户搜索词"2、期望结果"当鼠标下拉点入搜索栏后显示搜索热词统计结果"使用spring+springmvc+mysql+bootstarp实现的学生就业案例~(教学需要大佬勿喷)3、环境要求anaconda python3.6 jdk1.8 spark-2.4.7-bin-hadoop2.7 scala-2.13....原创 2021-09-06 22:27:31 · 1818 阅读 · 5 评论 -
pywifi连接中文wifi名称(乱码)连接不上问题解决方案
1、问题叙述小编自己开了一个使用pywifi实现wifi自动连接功能工具,在开发过程中但是明明列表中存在名称为华为的wifi,但是为什么就是连不上!经过小编在这里疯狂coding+研究,终于不是很完美的解决了这个问题~解决思路:小编认为之所连接不上并非硬件和代码的问题,而是电脑编码问题,小编觉得是不是电脑本身的wifi的ssid也就是wifi名称根本就不是正常的中文而是存储的另一种编码格式,只不过显示在列表的时候他是正常的,,,,很无语!然后我继续疯狂研究,,,,,cmd..原创 2021-05-27 14:29:35 · 3578 阅读 · 4 评论 -
Python 连接wifi小工具
1、代码# -*- coding:utf-8 -*- # 尝试并连接wifiimport pywifiimport timeimport configparserif __name__ == "__main__": # read conf cf = configparser.ConfigParser() cf.read("WiFiConfig.ini") name = cf.get('WiFi','name') isOpen = int(cf.ge.原创 2021-05-26 20:39:47 · 612 阅读 · 1 评论 -
pandas 修改 Excel 样式
1、简介使用pandas修改excel的样式,本质上整合了XlsxWriter模块,实现的excel样式修改,下面是XlsxWriter模块功能100%兼容Excel的xlsx文件; 完整的格式; 合并单元格; 定义名称; 图表; 自动过滤器; 数据验证和下拉列表; 条件格式; 工作簿的PNG、JPEG、BMP、WMF、EMF等图像; 丰富的多格式字符串; 单元格注释; 文本框; 与Pandas模块整合; 用于写入大文件的内存优化模式;详情:XlsxWriter2、使原创 2021-04-02 10:15:00 · 12587 阅读 · 7 评论 -
Python引用、浅拷贝、深拷贝
1、概念引用:将值和地址都进行传递 浅拷贝:只是将顶级(父类)的值进行传递,但子级(子类)将会进行值和地址传递 深拷贝:将父和子的值都进行传递,无论怎么去修改源变量,深拷贝的变量都和源变量无关2、引用我们创建一个变量a,通过引用将a赋值给变量b,使用id()查看变量地址,a与b得地址一致,可见两者此时指向同意内存地址,当我们改变a得值时,b得值也会变化。# 引用示例a = [1]b = aprint(id(a))print(id(b))# 打印地址22737089327原创 2021-02-19 11:24:41 · 141 阅读 · 0 评论 -
PyInstaller does not include a pre-compiled bootloader...,Checking for ‘msvc‘ C compiler
1.错误代码Fatal error: PyInstaller does not include a pre-compiled bootloader for yourplatform. For more details and instructions how to build the bootloader see<https://pyinstaller.readthedocs.io/en/stable/bootloader-building.html>2.错误原因具体得错误原创 2020-09-14 16:18:54 · 6073 阅读 · 4 评论 -
python解压zip/gz压缩文件到当前目录
1.解压zipimport zipfileimport osdef un_zip(csv_path): for f in os.listdir(csv_path): if ".zip" in f: zip_file = zipfile.ZipFile(csv_path + "\\" + f) zip_file.extract(zip_file.namelist()[0],csv_path)2.解压gzdef un_gzfile(gz_path): # 异常处理 t原创 2020-08-29 10:55:17 · 3171 阅读 · 0 评论 -
django rest framework+vue出现from origin ‘null‘ has been blocked by CORS policy: No ‘Access-Control-Al
1.问题描述在使用vue和django的做前后端分离项目时候,axios能够成功将请求发送给后端的django但是,前段vue不能成功接收到后端的response,错误代码如下from origin 'null' has been blocked by CORS policy: No 'Access-Control-Allow-Origin' header is present on the requested resource.2.解决办法原因就是跨域问题,我们需要修改django的set原创 2020-08-25 15:58:41 · 4184 阅读 · 2 评论 -
django如何设置公共方法在所有界面都可以取到值
1.需求说明在django项目中我们可能需要对用户功能和权限进行显示,不同界面为了操作安全性我们每次都对用户权限和功能进行验证,但是我们不可能每次跳转界面都会查询一次用户功能和权限,所以django帮我们解决了这个问题。2.代码实现在setting.py中找到下面的TEMPLATES 在里面进行如下配置:TEMPLATES = [ { 'BACKEND': 'django.template.backends.django.DjangoTemplates',原创 2020-08-22 11:02:26 · 785 阅读 · 0 评论 -
Python Pandas连接数据库 对dataframe进行正则模糊查询
1.需求介绍有些时候我们经常需要对数据库进行多次反复的数据查询,但是这样的会对我们程序效率大打折扣,我们完全可以先将数据库数据全部保存到pandas的dataframe中,然后在dataframe中进行数据的对比和查找。2.代码案例我们对查询语法分开讲解df.loc[df['serialNumber']=='56190705D7B1D6',:]该代码是获取列serialNumber等于56190705D7B1D6的所有行 .query("parampath.str.contains('正则原创 2020-08-20 10:49:47 · 2240 阅读 · 0 评论 -
python使用threading多线程连接数据库出现的问题和应对办法
1.实际需求说明我需要使用threading去实现并行查询数据库的数据信息,从而提高查询效率节省时间2.使用threading实现案例下面的案例就是使用线程同时查询出con列表中两个sql的数据并append到全局变量data中import threadingimport timeimport pymysqldata= []def conect(sql): global data # 打开数据库连接 db = pymysql.connect(原创 2020-08-19 15:53:16 · 2208 阅读 · 0 评论 -
python中pickle的使用(结合实际项目讨论)
需求介绍最近在进行一个序列到序列的智能机器人问答模型,属于NPL领域,大家都知道NPL重要的就是文本向量化,我在此次搭建模型过程中需要对文本进行构建字典,意思就是将文本的词和词汇包括数字、英文内容,将其进行编号,但是如果每次训练模型都需要重新构建这个词汇字典,那岂不是又浪费资源又浪费时间吗?那么pickle就可以帮助我们这个问题,我们可以将这个字典存储到一个文件中持久化存储进去,当用的时候我们...原创 2020-03-19 18:31:51 · 323 阅读 · 0 评论 -
mongoengine简单使用
https://www.cnblogs.com/clbao/p/11640658.html原创 2020-03-07 17:16:52 · 195 阅读 · 0 评论 -
如何使用ORM代替mongo对嵌套集合进行插入和删除数据(MongoEngine语法)
需求阐述:下面是一张我们存储到mongodb数据库中的数据格式,我们的需求是使用orm的方式将新的评论数据插入的某条文章的review子集合中去。解决方法:两个model对应的是上面json,Review是Article的嵌套子集合,我们需要把新的评论数据插入到子集中去class Review(EmbeddedDocument): name = StringField(...原创 2020-03-07 17:13:46 · 1053 阅读 · 0 评论 -
No module named 'keras.engine.base_layer'
错误截图:最近在使用kears的时候出现No module named 'keras.engine.base_layer'错误原因:在网上搜索一下,大概就是由于版本的问题我此时的keras的版本是2.1.x但是由于我们安装了有关使用keras的模块是2.2.x以后的所以就出现了如上问题。解决办法:我们直接进行pip install --upgrade keras(wind...原创 2020-01-18 10:47:47 · 8316 阅读 · 0 评论 -
如何通过python下载视频文件
需求由来:当你在网络上看到了一个视频,但是你想去下载下来,但却没有下载的按钮或者权限,那么怎样下载这个视频呢?问题解决:使用python立刻帮你搞定这个问题,我们废话少说直接上代码import requests hd = { 'Connection':'keep-alive', 'User-Agent': 'Mozilla/5.0 (Windows NT 6....原创 2020-01-17 15:35:13 · 5960 阅读 · 3 评论 -
jieba-fast安装过程和问题解决(unable to find vcvarsall.bat)
问题来源:在使用jieba分词的时候发现一个问题就是从开始到分词有一个慢的过程,下图所示:对策思路:其实有一个拿Cython重写了jieba这个包就是jieba-fast下载地址如下https://pypi.org/project/jieba-fast/#files出现问题1:安装jieba_fast他是使用c重新写了一遍jieba分词,所以速度上更快一些,但是...原创 2020-01-08 19:07:02 · 6033 阅读 · 0 评论 -
如何让jieba分词不分开某些词(suggest_freq方法的使用)
问题来源:本人在进行jpython的jieba分词时,发现在对不高兴,不开心等词汇进行分词时,将其分开下图Prefix dict has been built succesfully.[精确模式]: 我 不 喜欢 也 不 高兴[Finished in 1.7s]期望形式:但是我们希望jieba应该分成这种形式,不和高兴是连在一起的来表示消极的程度副词Pref...原创 2019-12-30 20:41:42 · 15047 阅读 · 2 评论 -
Xpath高级使用方法(全网最全)
摘要:xpath速度比较快,是爬虫在网页定位中的较优选择,但是很多网页前端代码混乱难以定位,而学习定位也较为不易(主要是全面的教程较少),这里列出一点编程过程中可能有用的东西,欢迎共同学习批评指正。试验环境:Python环境,lxml.etree。代码:<!DOCTYPE html><html><head> <title>...原创 2019-05-18 19:23:18 · 5723 阅读 · 2 评论 -
opencv的detectMultiScale函数详解
1.简介:opencv2中人脸检测使用的是 detectMultiScale函数。它可以检测出图片中所有的人脸,并将人脸用vector保存各个人脸的坐标、大小(用矩形表示)。2.detectMultiScale函数参数:void detectMultiScale(const Mat&amp;amp; image,CV_OUT vector&amp;amp; objects,double scaleFa...原创 2019-02-16 11:13:17 · 12633 阅读 · 7 评论 -
分词jieba库+wordcloud词云库可视化展示txt文本内容
1.首先确保我们的电脑已经安装好了jieba分词和wordcloud词云库的安装pip install wordcloudpip install jieba2.安装完毕之后我们直接上代码,代码有注释# encoding=utf-8from wordcloud import WordCloudimport matplotlib.pyplot as pltimport jiebafi...原创 2019-02-15 16:03:40 · 1943 阅读 · 0 评论 -
Django框架开发中如何避免表单重复
Form表单做为web2.0时代的重要角色,也是我们与web网站进行数据交互的重要渠道,但是大家在web网站开发过程中,都会遇到一个问题,那就是如何避免表单重复提交,我们可不确定用户可在提交了一个表单后,是否有足够的耐心等待我们的程序加载完成,如果此时用户不耐烦的在前台重复刷新页面,那么就会造成数据重复提交、信息不准确,因此我们在程序设计时一定要规避这样的问题,接下来介绍一下在Django框架开发...原创 2019-01-23 09:54:59 · 908 阅读 · 0 评论 -
机器学习过程
机器学习过程1.加载数据集from sklearn import databases#加载sklearn的数据集databases.load_boston()#加载波士顿房价的数据集databases.load_iris()#加载鸢尾花数据集databases.load_digits()#加载手写识别数字的数据集data.data为样本数据,data.target类别数据2.数据分割...原创 2018-12-12 20:59:47 · 194 阅读 · 0 评论 -
[i for i in range(0,5) if i>2] - Python的for循环的另一种方式
废话少说直接上代码:a = [i for i in range(0,5) if i&gt;2]b = []for i in range(0,5): if i&gt;2: b.append(i) print('大佬循环',a)print('普通for循环',b)结果截图:大家可以看到运用这两种for循环其实是一种效果,前者减少了很多代码量,而且在数据量打的时候速度也会非常...原创 2018-12-05 10:55:15 · 11605 阅读 · 0 评论 -
python发送消息给微信好友
咱们就直接上代码啦!import itchatimport requestsimport redef login_sendmsg(text): itchat.login() # 只是普通的登陆,并不具有缓存的功能 itchat.auto_login(hotReload=True) # 可以暂存登陆状态 friend = itchat.search_friends(u'XX')[...原创 2018-12-01 22:19:21 · 4267 阅读 · 0 评论 -
Python利用xpath和正则re爬取新浪新闻
今天我们来进行简单的网络爬虫讲解:利用用from lxml import html库+Xpath以及requests库进行爬虫1.我们将爬取新浪微博首页要闻我们摁F12查看网页源代码查找要闻内容所对应的HTML的代码通过观察我们可以发现每个标题都在****下的 a标签中,其实这个就是我们标题2.再利用requests的库先打印出我们的网页源代码from lxml import html...原创 2018-12-01 20:28:01 · 1616 阅读 · 0 评论 -
机器学习-线性回归
1.一元线性代数回归线性回归就是需要寻找一条直线最佳的去拟合这些点,那么我们如何去找?假设我们找到了这条直线y = ax + b这条直线 ,其实求这个条最佳拟合的直线就是在求a,b两个未知数我们将上图的每一个点带入这条直线的方程会有对应的y ̂i,除此之外我们还会有这个点的真实值yi,那么接下在就是通过最小二乘法首先先不着急去直接去说这个最小二乘法!我们思考要想得到最佳的这个y = ax...原创 2018-11-27 21:50:51 · 325 阅读 · 0 评论 -
机器学习之决策树(ID3)
决策树我们直观的通关这个树状图去了解一下决策树的概念,下面这个例子是姑娘相亲见不见的问题通过上面的图我们可以看到首先这个姑娘是看相亲对象的年龄问题,当年龄大于30岁就不见,小于三十岁就见以此类推形成这个深度为5的树接下来让我们一起复习一下我们以前学过的数据结构关于树的基础知识:结点:指树中的一个元素;结点的度:指结点拥有的子树的个数,二叉树的度不大于2;数的度:指树中的最大结点度数;叶...原创 2018-12-02 14:53:49 · 318 阅读 · 0 评论