python
文章平均质量分 56
浩瀚云海
初出茅庐,请多指教
展开
-
python实现人脸识别之一实现图像梯度图
python实现人脸识别1.工具和以来模块我的python版本是3.7,IDE是PyCharm所以来模块是skimage,matplotlib引入skimage模块有问题的话参考:https://blog.csdn.net/ycc297876771/article/details/802714032.导入所需要的模块3.引入图片引入图片,将图片转化为灰度图像...原创 2018-10-11 18:37:28 · 708 阅读 · 2 评论 -
python+selenium+unittest爬取斗鱼网
首先引入搜需要的模块建立测试类继承unittest.TestCase,setUp为初始化方法,tearDown方法是测试方法执行完成之后才执行。建立测试函数想要被测试执行必须在想要测试函数有test开头,启动调用函数:测试结果:...原创 2018-10-27 12:32:30 · 167 阅读 · 0 评论 -
python+selenium小练习
刚刚学习爬虫,一个模拟登录的小例子:# 导入webdriver API对象,可以调用浏览器和操作页面from selenium import webdriver# 导入Key,可以使用操作键盘,标签,鼠标等from selenium.webdriver.common.keys import Keysdriver = webdriver.PhantomJS()driver.get(...原创 2018-10-27 12:37:03 · 380 阅读 · 0 评论 -
python中下载安装使用tesseract智能识别demo
tesseract的下载与安装教程参考:https://jingyan.baidu.com/article/219f4bf788addfde442d38fe.html安装完成之后我们想要用python使用tesseract需要安装pytesseract模块在pycharm里面安装如下:安装好模块之后做一个小例子:我们先导入模块,选择先要识别的图片:from pyt...原创 2018-10-27 15:17:02 · 869 阅读 · 0 评论 -
python+scrapy入门教程之爬取腾讯招聘职位信息
我是用的IDE是pycharm,要想使用scrapy我们先安装模块file-settings-project Interpreter安装完成之后我们打开Terminal在终端输入:scrapy startproject tencent创建spiders我们需要进入spiders中,输入scrapy genscrapy tencentPosition 'tencent.com'...原创 2018-11-01 09:03:52 · 481 阅读 · 0 评论 -
缺失pillow图片保存库
利用scrapy抓取网页信息,保存文章图片时,报错ImportError:No module named 'PIL'非常简单,保存图片就需要一个图片保存的库,即缺失一个pillow的数据包,在黑窗口下pip install -i https://pypi.douban.com/simple pillow ...转载 2018-11-28 08:51:05 · 232 阅读 · 1 评论 -
python+scrapy爬取斗鱼图片
创建scrapy的项目请参考:https://blog.csdn.net/qq_35723619/article/details/83614670items的实现:DouyumeinvSpider创建:这次我们爬去的是json数据包:我们可以通过network监控: # -*- coding: utf-8 -*-import scrapyimport json...原创 2018-11-01 10:42:27 · 499 阅读 · 0 评论 -
python+scrapy+mongoDB爬取豆瓣top250
1.爬取网址:https://movie.douban.com/top250?start=0通过scrapy startproject douban创建项目通过scrapy genspider doubanmovie "douban"创建spider在settings.py文件中设置管道文件和mongodb的基本信息: 打开延迟items.pydouba...原创 2018-11-02 14:57:09 · 307 阅读 · 0 评论 -
爬取新浪新闻
通过scrapy startproject xinlang爬虫项目:通过scrapy genspider sina "sina.com.cn" 创建spider创建Itemsspider: pipelines:setting文件设置: 运行结果:文件源码:https://download.csdn.net/downlo...原创 2018-11-05 10:44:26 · 282 阅读 · 0 评论 -
python格式化format
format()方法接受位置参数和关键字参数:字符串中的{0},{1}应该跟位置有关,依次被format()的三个参数替换位置参数和关键参数一起用,位置参数必须在关键字参数之前,否则就会出错。如果我们想要打印大括号,我们可以采用在位置参数{1}跟平常有些不同,后边多了个冒号,在替换域中,冒号表示格式化符号的开始,“.2f”的意思是四舍五入保留两位小数点,而f的意...原创 2018-11-19 22:31:44 · 250 阅读 · 0 评论 -
python之Numpy
数组对象与创建函数import numpy as npIn [8]: np.zeros((3, 6))Out[8]: array([[0., 0., 0., 0., 0., 0.], [0., 0., 0., 0., 0., 0.], [0., 0., 0., 0., 0., 0.]])In [9]: 数据类型:dtype:给...原创 2018-11-17 22:52:38 · 149 阅读 · 0 评论 -
python3使用Django框架+mysql数据库
首先安装虚拟环境,命令如下:sudo pip3 install virtualenv #安装虚拟环境接下来还要安装虚拟环境扩展包,命令如下:sudo pip3 install virtualenvwrapper安装虚拟环境包装器的目的是使用更加简单的命令来管理虚拟环境。修改用户家目录下的配置文件.bashrc,添加如下内容:export WORKON_HOM...原创 2018-12-09 20:43:58 · 3970 阅读 · 2 评论 -
python3+Django做的小实例
我们创建项目test1和一个应用booktest使用pycharm打开:注册应用:Setting.py中汉化:# LANGUAGE_CODE = 'en-us'LANGUAGE_CODE = 'zh-hans' # 使用中文# TIME_ZONE = 'UTC'TIME_ZONE = 'Asia/Shanghai' #中国时间创建Model对象:...原创 2018-12-09 21:25:17 · 1395 阅读 · 1 评论 -
多线程爬取糗事网python3
1.导入模块:使用到了多线程这里使用queue进行数据交互2.创建爬取页面的类3.创建处理数据的类4.创建调用函数 CRAM_EXIT = FalsePARSE_EXIT = Falsedef main(): pageQueue = Queue(20) for i in range(1, 21): pageQue...原创 2018-10-24 18:11:06 · 330 阅读 · 0 评论 -
python利用正则爬取内涵段子内容
首页导入模块:创建一个Spider类:初始化方法:爬取页面的函数:处理页面的函数:写入文件的函数:测试和调度器:结果:参考:https://blog.csdn.net/qq_35723619/article/details/83275683...原创 2018-10-23 18:08:44 · 251 阅读 · 0 评论 -
python3.7添加dlib模块
1.下载dlib安装包安装dlib真是费劲,dlib下载地址:http://dlib.net/files/我下载的是dlib-19.14.zip,然后解压安装dlib在安装dlib前需要安装Boost和Cmake,dlib19之后你需要安装vs2015以上的IDE,本人是安装的vs2017,(建议先安装好VS之后再安装Cmake和 boost)2.安装Cmake官网下载...原创 2018-10-13 21:59:55 · 35488 阅读 · 25 评论 -
python生产者消费者实例
实现生产者和消费者模式就需要引入相关的模块:引入多线程,建立过线程锁机制,全局变量glock创建生产者,需要改变量MONEY的值必须加上global,glock.acquire加上锁,glock.release()释放锁创建消费者,创建测试函数为开启多线程:th = threading.Thread(target=Procuder)th.start()开...原创 2018-10-18 08:58:11 · 516 阅读 · 0 评论 -
python3网页爬虫
使用多线程生产者与消费者模式实现网页爬虫,本次实例是爬虫oppo官网首页,下载首页的全部图片1.准备工作导入相应的模块:oppo官网网址:https://www.opposhop.cn/2.创建生产者生产者主要是爬虫oppo官网的find所有的img标签获取img的下载地址,将搜索的地址保存到全局变量IMAGE_URL_LIST列表中3.创建消费者创建消费...原创 2018-10-18 09:18:10 · 336 阅读 · 0 评论 -
python爬虫之拉勾网
拉钩网有很强的防爬虫机制我们需要做些处理https://www.lagou.com我选择怕取得是:https://www.lagou.com/jobs/list_python结果出错不是我想要的结果:网页结构爬虫结果:不是想要的这说明有反爬虫机制需要把请求头加上,模拟浏览器访问:我们将hears加入请求运行结果:我想要爬取职位列表,这时发现职...原创 2018-10-18 16:15:09 · 277 阅读 · 0 评论 -
python3+sklearn实现人脸识别
刚刚学习人脸识别,写了个小demo1.导入所需要的模块python中有优秀的机器学习模块库和人脸识别算法,本次使用的机器学习的监督学习中的分类算法2.训练实现算法使用KNN分类识别算法,训练的结果保存到model_save_path文件中3.进行预测加载测试文件中的图片与训练好的KNN model进行比对预测,预测的精确度通过distance_threshold...原创 2018-10-16 11:27:27 · 5255 阅读 · 2 评论 -
python3爬取之二
爬取拉钩网的职位列表请参考:https://blog.csdn.net/qq_35723619/article/details/83147695看这篇博客前参考上一个博客在上篇已经拿到具体的职位列表的信息,这时我们将爬取每个职位的详情先做翻页爬虫:需要该造原有的代码,将form_data的变为pn可变我们将使用for循环来做,将结果写入文件中:line = jso...原创 2018-10-19 10:05:27 · 231 阅读 · 0 评论 -
python+pyechars爬虫中国天气网
1.准备开发工作天气网网址:http://www.weather.com.cn/textFC/hb.shtml2.爬取页面信息建立全局变量ALL_DATE = [] # 爬取页面3.分析数据与可视化显示pyechars参考网址:http://pyecharts.herokuapp.com/运行结果:感谢阅读!...原创 2018-10-19 10:16:23 · 537 阅读 · 0 评论 -
python实现多线程
1.引入模块我们首先要引入import threading模块,后面用到time这里也导入2.创建一个测试函数3.创建一个线性执行函数4.创建多线程执行函数创建多线程通过threading.Thread类创建,target=great,great是执行的目标函数,args=[x]x是为目标函数传的参数th.start()开启线程5.测试多线程6....原创 2018-10-17 17:47:45 · 326 阅读 · 0 评论 -
python爬虫爬取百度贴吧
python版本2.7由于python3和python2中的urllib的变化较大选择了使用较多的python2先引入模块2.创建爬取页面的函数headers:是为了模仿浏览器的访问3.保存爬取内容4.创建贴吧启动函数5.创建调用函数6.运行结果了解可视化显示数据请参考:https://blog.csdn.net/qq_35723619/...原创 2018-10-22 17:17:40 · 443 阅读 · 0 评论 -
python+urllib+爬虫的有道翻译
简单的post请求爬虫我们需要模拟好请求头:做好post请求的form数据:输入关键字:最后测试:代码:# coding=utf-8import urllibimport urllib2## http://fanyi.youdao.com/url = 'http://fanyi.youdao.com/translate?smartresu...原创 2018-10-22 17:27:58 · 234 阅读 · 0 评论 -
python+selenium简单介绍
我们使用selenium和PhantomJS需要安装模块:在pycharm里面file-》setting里面可以直接安装selenium模块PhantomJS模块需要下载安装配置环境变量:下载地址:http://phantomjs.org/download.html小例子:from selenium import webdriverfrom selenium.web...原创 2018-10-25 18:39:35 · 291 阅读 · 0 评论 -
python爬取百度贴吧图片
这次爬虫使用python3爬取我没需要引入lxml库:创建爬取页面的函数爬取贴吧列表,通过lxml获取到每个帖子的链接地址fulllink通过上面函数获取的帖子详细地址,访问每个帖子的详情页面,获取img的src拿到img的下载地址进行下载:创建测试调度器:测试结果:下完成!刚刚学习请多指教:上一篇介绍的是从百度贴吧读取信息:https:...原创 2018-10-23 17:55:10 · 337 阅读 · 0 评论 -
Django+mySql的条件查询
实现sql中where的功能,调用过滤器filter()、exclude()、get(),打开booktest/views.py文件,在index视图中编写如下查询代码:条件运算符1) 查询等exact:表示判等。例:查询编号为1的图书。list=BookInfo.objects.filter(id__exact=1)可简写为:list=BookInfo.object...原创 2018-12-30 09:00:10 · 1108 阅读 · 2 评论