Python3
文章平均质量分 68
AoboSir
这个作者很懒,什么都没留下…
展开
-
Learning Python 008 正则表达式-007 匹配的字符串模板中如果只有前面有字符串,而后面没有字符串时,这个匹配模板要怎 么写
原博文链接在我的官方网站,网址是:http://www.aobosir.com/blog/2017/02/21/python-regular-expression-match-string-no-string-in-behind/开发环境Python第三方库:lxml、Twisted、pywin32、scrapyPython 版本:python-3.5.0-amd64PyCharm软件版本:p原创 2017-03-12 16:22:42 · 1674 阅读 · 0 评论 -
Learning Python 026 字符串连接
使用的电脑系统:Windows 10 64位使用的开发集成环境:PyCharm 2016.1.4使用的Python的版本:python2.7.10 或者 python 3.5.0 本博文对Python2和Python3都适用。参考网站:Python 字符串操作(string替换、删除、截取、复制、连接、比较、查找、包含、大小写转换、分割等)# -!- coding: utf-8 -!-pat原创 2016-12-01 19:12:01 · 9367 阅读 · 0 评论 -
Learning Python 027 解决错误:SyntaxError: Non-UTF-8 Code Starting With '\xc8' in File xxxx.py
使用的电脑系统:Windows 10 64位使用的开发集成环境:PyCharm 2016.1.4使用的Python的版本:python2.7.10 或者 python 3.5.0 本博文对Python2和Python3都适用。出现这个错误,是因为xxxx.py 文件里面有中文字符。解决办法:在文件第一行,加上下面的代码:# -!- coding: utf-8 -!-原创 2016-12-01 19:09:30 · 17670 阅读 · 4 评论 -
Learning Python 025 字符串分割
原博客地址:http://www.aobosir.com/blog/2016/12/01/python-string-split/使用的电脑系统:Windows 10 64位使用的开发集成环境:PyCharm 2016.1.4使用的Python的版本:python2.7.10 或者 python 3.5.0 本博文对Python2和Python3都适用。参考网站:Python split(原创 2016-12-01 17:14:53 · 9535 阅读 · 0 评论 -
Learning Python 024 判断文件和文件夹是否存在
原博文链接:http://www.aobosir.com/blog/2016/12/01/determine-whether-files-and-folders-exist/使用的电脑系统:Windows 10 64位使用的开发集成环境:PyCharm 2016.1.4使用的Python的版本:python2.7.10 或者 python 3.5.0判断文件import osa = os.原创 2016-12-01 08:50:35 · 9382 阅读 · 0 评论 -
Learning Python 023 类编程
原博文链接:http://www.aobosir.com/blog/2016/12/01/class-programming-object/使用的电脑系统:Windows 10 64位使用的开发集成环境:PyCharm 2016.1.4使用的Python的版本:python 3.5.0怎么使用python编写一个 类参考网站:Python3-cookbook 类与对象随便编写一个Python原创 2016-12-01 08:08:18 · 9476 阅读 · 0 评论 -
Learning Python 022 调用DOS命令 --- 实例:调用Windows里面的copy命令
使用的电脑系统:Windows 10 64位使用的开发集成环境:PyCharm 2016.1.4使用的Python的版本:python 2.7.10 和 python 3.5.0 本篇博客对 Python2 和 Python3 都适用。实例:调用Windows里面的copy命令比如现在,我想把这个路径F:\原文件夹里面的所有文件复制到这个路径F:\目标文件夹里面。可以在DOS命令行窗口里面执原创 2016-12-01 06:04:52 · 11851 阅读 · 0 评论 -
Learning Python 021 创建文件夹、创建文件
使用的电脑系统:Windows 10 64位使用的开发集成环境:PyCharm 2016.1.4使用的Python的版本:python 2.7.10 和 python 3.5.0 本篇博客对 Python2 和 Python3 都适用。Python 创建文件夹参考网站:Python创建目录文件夹python学习笔记(七)——文件和目录操作# -*- coding: utf-8 -*-i原创 2016-12-01 05:59:49 · 14936 阅读 · 0 评论 -
Learning Python 008 正则表达式-004 sub()方法
Python 正则表达式 — sub()方法sub()方法sub()方法:替换符合规律的内容,返回替换的值# -?- coding: utf-8 -?-import resecret_code = 'wwwfhskdjwww'secret_code_new = re.sub('www(.*?)www', 'www.aobosir.www', secret_code )print(secret_c原创 2016-07-17 00:00:42 · 17488 阅读 · 0 评论 -
Learning Python 019 生成器(Generators)和 yield
使用的电脑系统:Windows 10 64位使用的开发集成环境:PyCharm 2016.1.4使用的Python的版本:python 2.7.10 和 python 3.5.0知识点:生成器生成器只能用于迭代操作。 一个函数,其中带 yield 关键字的代码,它不会执行,只是记下有这个操作;其他代码正常的执行。而被记下的这些操作会像队列一样存起来,这个“队列”就是 生成器,并且会类似于原创 2016-11-30 23:19:58 · 9533 阅读 · 0 评论 -
Learning Python 028 获取命令行参数
原博文链接:http://www.aobosir.com/blog/2016/12/02/python-get-command-line-arguments/使用的电脑系统:Windows 10 64位使用的开发集成环境:PyCharm 2016.1.4使用的Python的版本:python2.7.10 或者 python 3.5.0 本博文对Python2和Python3都适用。impo原创 2016-12-02 02:12:03 · 9560 阅读 · 0 评论 -
Learning Python 014 使用 pip 工具的注意事项 --- 混淆的python2 和 python3
Q : 如果你的电脑之前安装了Python2,那么Python2 有自己的pip工具,Python3 也是有自己的pip工具,所以,如果你在DOS命令行上执行pip install some-package-name命令的时候,系统会使用哪个pip工具呢?是python2的pip,还是python3的pip?A : 如果你先安装的是python2,后安装的python3,那么系统默认使用pyth原创 2016-11-23 00:22:14 · 9754 阅读 · 0 评论 -
Python3 大型网络爬虫实战 004 — scrapy 大型静态商城网站爬虫项目编写及数据写入数据库实战 — 实战:爬取淘宝
原博文链接:http://www.aobosir.com/blog/2016/12/26/python3-large-web-crawler-taobao-com-import-to-MySQL-database/开发环境开始实战设置防反爬机制settingspy 文件分析网站开始写爬虫程序taobaopy 文件创建一个爬虫文件taobaopy 文件添加需要使用的存储容器对象items原创 2016-12-26 01:27:36 · 19073 阅读 · 2 评论 -
Python3 大型网络爬虫实战 003 — scrapy 大型静态图片网站爬虫项目实战 — 实战:爬取 169美女图片网 高清图片
开发环境观察网页 和 网页源代码写程序下载高清图片下载 169美女图片网 的所有西洋美女的图片防反爬技术搞定开发环境Python第三方库:lxml、Twisted、pywin32、scrapyPython 版本:python-3.5.0-amd64PyCharm软件版本:pycharm-professional-2016.1.4电脑系统:Windows 10 64位如果你还没有原创 2016-12-26 00:37:33 · 49215 阅读 · 0 评论 -
Python3 大型网络爬虫实战 002 --- scrapy 爬虫项目的创建及爬虫的创建 --- 实例:爬取百度标题和CSDN博客
开发环境Python第三方库:lxml、Twisted、pywin32、scrapyPython 版本:python-3.5.0-amd64PyCharm软件版本:pycharm-professional-2016.1.4电脑系统:Windows 10 64位如果你还没有搭建好开发环境,请到这篇博客:。1 知识点:scrapy 爬虫项目的创建及爬虫的创建1.1 scrapy 爬虫项目的创建原创 2016-11-26 18:35:29 · 17630 阅读 · 0 评论 -
Python3 大型网络爬虫实战 001 --- 搭建开发环境
我使用的电脑: Windows 10 64位前言开发Python爬虫有很多种方式,从程序的复杂程度的角度来说,可以分为:爬虫项目和爬虫文件。 相信有些朋友玩过Python的urllib模块,一般我们可以用该模块写一些爬虫文件,实现起来非常方便,但做大型项目的时候,会发现效率不是太好、并且程序的稳定性也不是太好。 Scrapy是一个Python的爬虫框架,使用Scrapy可以提高开发效率,并且非常原创 2016-11-26 06:46:47 · 49888 阅读 · 0 评论 -
Python3 解决编码问题: `UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position 10: ille
Python3 解决编码问题: UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position 10: illegal multibyte sequence — 当执行爬虫将爬取信息打印到终端时出现的编码错误Python 版本:python-3.5.0-amd64目标网站:http://blog.csdn.ne原创 2016-11-26 18:12:24 · 34315 阅读 · 4 评论 -
Python3 pip 解决问题: error: Unable to find vcvarsall.bat
当我给 python3.5 安装 第三方库 charset 时:pip install charset,出现了错误:D:\WorkSpace\python_ws\python-large-web-crawler\firstdemo>pip install charsetCollecting charset Downloading charset-1.0.1.tar.gz (189kB)原创 2016-11-26 06:10:39 · 14569 阅读 · 9 评论 -
Python3 解决编码问题: UnicodeEncodeError: 'gbk' codec can't encode character '\xa9' in position
原博文链接:http://www.aobosir.com/blog/2016/12/08/python3-UnicodeEncodeError-gbk-codec-can’t-encode-character-xa9/开发环境Python第三方库:lxml、Twisted、pywin32、scrapyPython 版本:python-3.5.0-amd64PyCharm软件版本:pycharm原创 2016-12-08 06:50:49 · 29789 阅读 · 2 评论 -
Learning Python 008 正则表达式-005 compile模板的使用
使用的电脑系统:Windows 10 64位使用的开发集成环境:PyCharm 2016.1.4使用的Python的版本:python 2.7.10 和 python 3.5.0compile()函数的用法import restr = 'fdfgdrthxxi--gdfgexxlove--dsdfwesdxxyou--dfgdf'pattam_str = 'xx(.*?)--'resul原创 2016-12-08 07:06:59 · 9596 阅读 · 0 评论 -
Python3 大型网络爬虫实战 — 给 scrapy 爬虫项目设置为防反爬
原博文链接:http://www.aobosir.com/blog/2016/12/06/python3-large-web-crawler-scrapy-project-Anti-reptile-settings/开发环境Python第三方库:lxml、Twisted、pywin32、scrapyPython 版本:python-3.5.0-amd64PyCharm软件版本:pycharm-原创 2016-12-06 00:09:38 · 18052 阅读 · 0 评论 -
Learning Python 018 Python2 和 Python3 中 range()函数的使用
使用的电脑系统:Windows 10 64位使用的开发集成环境:PyCharm 2016.1.4使用的Python的版本:python 2.7.10 和 python 3.5.0range() 函数Python2中:用来创建一个列表(list)。Python3中:用来创建一个可以生成list或者tuple的生成器。Python2 range()函数 知识点Python2 中的range(原创 2016-11-30 13:53:48 · 10265 阅读 · 0 评论 -
Learning Python 017 — Python2 和 Python3 的内存释放
使用的电脑系统:Windows 10 64位使用的开发集成环境:PyCharm 2016.1.4使用的Python的版本:python 2.7.10 和 python 3.5.0学习Python的内存释放知识点的动机之前我学过很多Python的程序,偶然的一次,我打开任务管理器,看到我写的程序,运行时占用了大量的内存,所以,我希望学会如何释放内存,来优化我的程序,也不给电脑照成太大的负担,所以原创 2016-11-30 13:51:46 · 14185 阅读 · 0 评论 -
Learning Python 016 写文件时,将其用指定的编码方式保存(比如:UTF-8无BOM编码方式)
使用的电脑系统:Windows 10 64位使用的开发集成环境:PyCharm 2016.1.4使用的Python的版本:python 3.5.0学习这个知识点的原因举一个实例:Octopress站点路径里面博文文件(.markdown后缀文件)必须要是以UTF-8无BOM编码方式编码的文件,否则执行rake generate命令会出现下面这个错误:Error reading file F:/原创 2016-11-29 20:19:53 · 11778 阅读 · 0 评论 -
Learning Python 008 正则表达式-003 search()方法
Python 正则表达式 — search()方法search()函数的使用# -?- coding: utf-8 -?-import resecret_code = 'dsdxx1xxdsdfxx2xxdfsdxx3xxdlrelxx4xxeuwuxx5xxnjkjh'b = re.search('xx(.*?)xxdsdfxx(.*?)xx', secret_code )print(b)运原创 2016-07-16 23:46:05 · 15610 阅读 · 0 评论 -
Learning Python 008 正则表达式-002 findall()方法
Python 正则表达式 findall()方法重点 findall()方法的使用 — 程序讲解简单的符号的使用正则表达式的库文件是re,先导入库文件:import re.的使用举例# -?- coding: utf-8 -?-import rea = 'abca123'b = re.findall('a.', a)print(b)输出['ab', 'a1'].是一个占位符,我们将程序改成原创 2016-07-16 22:52:29 · 16321 阅读 · 0 评论 -
Learning Python 008 正则表达式-001
Python 正则表达式这节课讲讲正真使用的技术 — 正真表达式。文本爬虫什么是正则表达式正则表达式这个名词听起来就有一种很官方的感觉,但是它是一个很很很有用的技术。我用语言是不能形容它的。那举个例子好了。下面是一段加密的文本:sdajksdhfakjldooxxIxxoosdsdsdmknmdsdooxxamxxoodsddjksdjooxxAoboxxoodsddsddkjlooxxSirxxo原创 2016-07-16 20:50:09 · 15470 阅读 · 0 评论 -
Learning Python 007 基本语句
Python 基本语句if — 条件判断没有什么好说的,直接上代码:age = 3if age >= 18: print('adult')elif age >= 6: print('teenager')else: print('kid')elif是else if的缩写。格式:if <条件判断1>: <执行1>elif <条件判断2>: <执行2>el原创 2016-07-16 18:34:18 · 14414 阅读 · 0 评论 -
Learning Python 006 list(列表) 和 tuple(元组)
Python list(列表) 和 tuple(元组)list 列表Python内置的一种数据结构。list:一种有序的集合,可以随时添加和删除其中的元素。list的用法定义list>>> people = ['Aobo Jaing', 'Yunjie Wu', 'Shutong Liu']>>> people['Aobo Jaing', 'Yunjie Wu', 'Shutong Liu']原创 2016-07-16 18:04:29 · 14425 阅读 · 0 评论 -
Learning Python 005 字符串和编码
Python 字符串和编码介绍计算机是美国人发明的,最早只有127个字母被编码到计算机,这个编码表被称为ASCII编码,比如大写字母A的编码是65,小写字母z的编码是122。处理中文一个字节显然是不够的,只是需要两个字节,而且还不能喝ASCII编码冲突,所以,中国制定了GB2312编码,用来把中文编进去。世界上有上百中语言,日本把日文编到Shift_JIS里,韩国把韩文编到Euc-kr里,各国有各国原创 2016-07-16 15:31:12 · 14478 阅读 · 0 评论 -
Learning Python 004 基础的数据类型和变量
Python 基础的数据类型和变量数据类型整数Python可以处理任意大小的整数,当然包括负整数。 Python表示十六进制也用0x前缀。浮点数1.23x10^9和12.3x10^8是完全相等的。1.23x10^9就是1.23e9,或者12.3e8。0.000012可以写成1.2e-5。 整数和浮点数在计算机内部存储的方式不同,整数运算永远是精确的,而浮点数运算则可能会有四舍五入的误差。字符原创 2016-07-14 21:48:21 · 17519 阅读 · 0 评论 -
Learning Python 003 缩进
Python 缩进Python的代码中不使用{}大括号来来表示一个代码块,而是使用缩进方式。像下面这段代码:# print absolute value of an integer:a = 100if a >= 0: print(a)else: print(-a)#号开头的语句是注释。冒号“:”结尾时,后面缩进的语句视为代码块。缩进使用Tab键。Python对大小写敏感原创 2016-07-14 20:41:53 · 17679 阅读 · 0 评论 -
Learning Python 002 print() 和 input()
Python print() 和 input()print()函数 print()函数可以向终端中输入指定的内容。输出当个字符串.py文件中,输入下面的代码,并保存:print('hello world')> demo.pyhello world终端中执行:>>> print('hello world')hello world输出多个字符串.py文件中,输入下面的代码:print('Aob原创 2016-07-14 17:43:03 · 17037 阅读 · 0 评论 -
Learning Python 009 dict(字典)和 set
Python dict(字典)和 setdict (字典)是什么东西dict全称dictionary。为什么这个数据结构取名叫dict。因为dict的实现原理和查字典是一样的。dict使用了键-值(key-value)存储的方式。就好比在字典里查某个字一样。dict数据结构中的键(key)就好比字典中的索引表里这个字对应的页码。值(value)就好比字典中这个字的内容。这样的特点,效果就是查找速度极原创 2016-07-20 02:28:20 · 16211 阅读 · 0 评论 -
Learning Python 010 函数 1
Python 函数 1调用函数举个例子多于Python内部的函数,你可以在Python的交互式终端中使用help()函数来查看函数的使用方法。比如:abs()函数,如果你不知道如何使用它,你可以在Python的交互式终端中输入:>>> help(abs)你会看到下面的输出信息:Help on built-in function abs in module builtins:abs(x, /)原创 2016-07-20 05:09:32 · 16402 阅读 · 0 评论 -
Learning Python 015 Python3解决问题:读取文件时,出现乱码或者“UnicodeDecodeError 'gbk' codec can't decode” 错误
使用的电脑系统:Windows 10 64位使用的开发集成环境:PyCharm 2016.1.4使用的Python的版本:python 3.5.0出现的错误读取文件时,出现乱码或者UnicodeDecodeError: 'gbk' codec can't decode byte 0xXX in position XX: incomplete multibyte sequence 错误出现错误的原创 2016-11-29 19:31:08 · 15016 阅读 · 0 评论 -
Python 解决 :NameError: name 'reload' is not defined 问题
Python 解决 :NameError: name 'reload' is not defined 问题解决:NameError: name 'reload' is not defined 问题对于 Python 2.X:import sysreload(sys)sys.setdefaultencoding("utf-8")对于 <= Python 3.3:import impimp.rel原创 2016-08-14 22:20:28 · 149955 阅读 · 10 评论 -
Python 安装 第三方库的安装技巧
Python 安装 第三方库的安装技巧Windows 10 64位。 Python 3.5.0:1. 使用 pip 命令行工具在线下载你需要的第三方库2. 手动下载 第三方库,再使用 `pip` 命令安装 Could not find a version that satisfies the requirement opencv (from versions: )No matching distr原创 2016-08-14 11:31:55 · 126326 阅读 · 13 评论 -
设置 PyCharm 软件中 Terminal 窗口 中启动的 python 交互命令的版本
设置 PyCharm 软件中 Terminal 窗口 中启动的 python 交互命令的版本python2 和 python3 有很大的不同,使用python2 编写的程序,如果使用python3 就运行不了;使用python3编写的程序,如果使用python2一样也是不用运行。我的电脑中, python2 和 python3 这两个版本都有。并且 python3 添加到了环境变量里面,而 pyt原创 2016-09-09 15:26:14 · 65785 阅读 · 0 评论 -
在PyCharm 软件中设置你的项目 使用的Python版本
在PyCharm 软件中设置你的项目 使用的Python版本python2 和 python3 有很大的不同,使用python2 编写的程序,如果使用python3 就运行不了;使用python3编写的程序,如果使用python2一样也是不用运行。Q: 所以,如何在pyCharm 软件中,为你的项目设置 python 的版本?A: 当前项目使用的是 python2 :我希望将其设置为 python原创 2016-09-09 14:50:22 · 79145 阅读 · 0 评论