python
文章平均质量分 67
showhilllee
本是后山人,偶做前堂客,醉舞经阁半卷书,坐井说天阔。 大志戏功名,海斗量福祸,论到囊中羞涩时,怒指乾坤错
展开
-
Python之正则表达式
re模块包含对 正则表达式。本章会对re模块主要特征和正则表达式进行介绍。 什么是正则表达式正则表达式是可以匹配文本片段的模式。最简单的正则表达式就是普通字符串,可以匹配其自身。换包话说,正则表达式’python’ 可以匹配字符串’python’ 。你可以用这种匹配行为搜索文本中的模式,并且用计算后有值并发特定模式,或都将文本进行分段。 ** 通配符转载 2015-08-05 21:27:44 · 655 阅读 · 0 评论 -
Django链接远程数据库并创建model
前言基础知识网上有很多,不再赘述。这里默认你已经对Django有了一定的的了解。 看本文的前提:已经对Django有了基础的认识已经有了远程数据库拥有该数据库的相关权限远程数据库配置修改settings.py中数据库相关代码:DATABASES = {'default': { 'ENGINE': 'django.db.backends.sqlite3', 'NAME':原创 2016-07-21 10:12:17 · 3279 阅读 · 0 评论 -
Mac 10.11安装MySQLdb-python时报错总结
前言===其实以前遇到过这些坑,费了n久解决了以后,实在是心累,不想总结。当时心想,现在配好这个环境,以后再也不弄这个了!!然鹅,是我图样图森破了,这美好的乌托邦环境在一次电脑抽风,只能重装以后就木有了!心好累~错误===下面开始我们的错误之旅~1、mysql_config not found===按照套路步骤,首先在这https://sourceforge.net/projects/mysql-p原创 2016-11-01 19:44:53 · 2246 阅读 · 0 评论 -
如何让你的scrapy爬虫不再被ban
原文地址:前面用scrapy编写爬虫抓取了自己博客的内容并保存成json格式的数据scrapy爬虫成长日记之创建工程-抽取数据-保存为json格式的数据和写入数据库scrapy爬虫成长日记之将抓取内容写入mysql数据库。然而,这个爬虫的功能还是过于弱小,一旦目标网站设置了爬虫的限制,我们的爬虫也就失效了。因此这里重点讲述一下如何避免scrapy爬虫被ban。本门的所有内容都是基于前面两篇文章的基础转载 2016-11-21 17:29:03 · 4082 阅读 · 0 评论 -
Python图片处理模块Pillow
原文来自Pillow安装警告* Pillow 不能和PIL 同时存在于一个环境中,在安装Pillow之前需要先卸载PIL* Pillow 1.0 版本后已经不支持import Image,请使用from PIL import Image来代替* Pillow 2.1.0版本以后已经不支持import _imaging,请使用from PIL.Image import core as _imagi原创 2016-12-26 09:23:17 · 10231 阅读 · 0 评论 -
python读取xml文件
关于python读取xml文章很多,但大多文章都是贴一个xml文件,然后再贴个处理文件的代码。这样并不利于初学者的学习,希望这篇文章可以更通俗易懂的教如何使用python 来读取xml 文件。什么是xml?xml即可扩展标记语言,它可以用来标记数据、定义数据类型,是一种允许用户对自己的标记语言进行定义的源语言。abc.xml<?xml version="1.0" encoding="utf-8"?>转载 2017-01-10 22:31:01 · 1134 阅读 · 0 评论 -
scrapy在Request之间传递参数
我们在写爬虫的时候,经常会遇到这种情况,这里举例说明一下,比如爬一个新闻页面,首先爬的是新闻列表页pageA,从pageA里获取新闻详细页连接,然后爬新闻详情页pageB,新闻详情页pageB里有一个关于这个新闻的解说,在另一个页面pageC。这时候如果用传参的方法可以直接在爬取完成一条新闻的整个信息以后再把信息yield出去。 说明: 1、爬取列表信息的方法funcA 2、爬取新闻详情信息的原创 2017-06-05 20:45:38 · 12981 阅读 · 1 评论