Python
文章平均质量分 64
小大小丑
小丑
展开
-
用C++扩展Python的功能(一)
一. 说明1. 例如我们可以用Python写一个功能包(包里就只有一个py文件, py文件就只有一个函数, 例如HYAdd(a, b)), 因为是同一种语言, 所以很简单.2. 现在相当于使用C++实现一遍, 但是C++和Python是异构语言, 所以C++需要按照Python的扩展框架, 实现其规定的接口从而扩展Python的功能.3. 在Windows下, 载体肯定原创 2014-12-27 09:49:13 · 2629 阅读 · 0 评论 -
mechanize是非常合适的模拟浏览器的模块
mechanize是非常合适的模拟浏览器的模块原创 2013-11-13 11:43:21 · 1174 阅读 · 0 评论 -
[Python下载CSDN博客]1. 简单实现(一)
一. 目标 使用Python提取某CSDN博客的全部文章, 并转换为本地网页(例如一些连接, 是http网页的, 要转成本地的.). (成功提取后可以使用CHM工具把整个博客压成chm文件). 这里以我自己的博客http://blog.csdn.net/bagboy_taobao_com 为目标.1.1 我这里只按照博客中两种方式提取文章: 文章分类和文章原创 2013-11-11 17:31:48 · 1579 阅读 · 0 评论 -
使用Python的HTMLParser解析HTML文本
使用Python的HTMLParser解析HTML文本一. HTMLParser HTMLParser是python用来解析html的模块。它可以分析出html里面的标签、数据等等,是一种处理html的简便途径。 HTMLParser采用的是一种事件驱动的模式, 当HTMLParser找到一个特定的标记时, 它会去调用一个用户定义的函数(就是回调函数).转载 2013-11-11 17:11:49 · 8407 阅读 · 0 评论 -
Python抓取HTML
一. 抓取网页的三个步骤(个人表面的理解)1. 抓取HTML字符串.2. 分析HTML字符串.3. 对分析结果做自己想做的处理.4. 你也可以做一些其他事情, 例如定时请求(POST, GET等)二. 抓取HTML字符串1. 方法1#!/usr/bin/env python# Python 2.7.3# A001_Get_HTML.p原创 2013-11-11 17:07:25 · 2294 阅读 · 0 评论 -
[Python下载CSDN博客]1. 简单实现(三)
3.4 主程序提取分类列表, 提取某分类列表和提取文章内容都实现, 现在把它们整合即可.3.4.1 提取策略1. 提取分类列表(或者存档列表), 每一类创建一个目录(目录名是分类名或者存档日期).2. 提取每一类的文章.3. 每一篇文章一个目录, 文章内容在该目录的article.txt文件中.3.4.2 主程序代码#!/us原创 2013-11-11 17:46:21 · 1329 阅读 · 0 评论 -
[Python下载CSDN博客]1. 简单实现(二)
3.2 根据"文章分类列表和文章存档列表"获取文章的URL3.2.1 分析其中一个分类或者存档的HTML 使用浏览器查看http://blog.csdn.net/bagboy_taobao_com/article/month/2013/10 的HTML并保存为list.html(保存的格式必须为UTF8, 否则会乱码). 双击打开Index.html, 可以原创 2013-11-11 17:43:53 · 975 阅读 · 0 评论 -
Python的print函数
1. 打印不换行print函数默认是输出换行的, 如果想不换行可以这样#!/usr/bin/env python# coding=utf-8# Python 2.7.3str1 = u"输出换行"# Unicode编码str2 = u"输出不换行"print(str2),# 在后面增加一个逗号就不换行print(str1)2. 使用print输出到文原创 2013-11-08 11:50:29 · 1461 阅读 · 0 评论 -
Python正则表达式入门
转自: http://www.cnblogs.com/huxi/archive/2010/07/04/1771073.htmlPython正则表达式入门一. 正则表达式基础1.1. 简单介绍正则表达式并不是Python的一部分. 正则表达式是用于处理字符串的强大工具, 拥有自己独特的语法以及一个独立的处理引擎, 效率上可能不如str自带的方法, 但功能十分强大.转载 2013-11-21 11:41:26 · 1665 阅读 · 0 评论 -
[Python下载CSDN博客]4. V3版本_使用正则表达式分析HTML(一)
一. 目标在V2的基础上, 使用正则表达式来分析下载下来的html并提取内容.二. 需要的技术1. 从网站抓取博客得到HTML字符串.2. 正则表达式分析HTML字符串, 提取需要的数据.3. 提取得到后的数据再转换为本地的数据.4. 难点: 使用正则表达式分析HTML(因为对HTM和正则表达式都不太熟悉).三. 步骤3.原创 2013-11-21 11:22:53 · 1643 阅读 · 0 评论 -
[Python下载CSDN博客]4. V3版本_使用正则表达式分析HTML(二)
3.3 分析其中一篇文章的HTML使用浏览器查看http://blog.csdn.net/bagboy_taobao_com/article/details/5582868 的HTML并保存为article.html (保存的格式必须为UTF8, 否则会乱码). 双击打开article.html, 可以正确显示. OK, 可以用文本打开分析3.3.1 文章标题和内容的HTML原创 2013-11-21 11:28:21 · 2016 阅读 · 0 评论 -
Python的编码与解码
转自: http://www.cnblogs.com/huxi/archive/2010/12/05/1897271.html一. 字符编码简介1.1. ASCIIASCII(American Standard Code for Information Interchange),是一种单字节的编码。计算机世界里一开始只有英文,而单字节可以表示256个不同的字符,转载 2013-11-21 11:48:54 · 2190 阅读 · 2 评论 -
使用BeautifulSoup解析HTML和XML
使用BeautifulSoup解析HTML文本一. 下载安装下载地址: http://www.crummy.com/software/BeautifulSoup/ .下载完后解压, cd到该目录, 输入命令: python setup.py install 测试:#!/usr/bin/env python# coding=utf-8# Python 2.7.转载 2013-11-12 16:55:42 · 7935 阅读 · 0 评论 -
[Python下载CSDN博客]2. 使用BeautifulSoup分析HTML(一)
BeautifulSoup比起HTMLParser操作起来会简单一点(HTMLParser是边解析边回调使用, BeautifulSoup是全部解析完后再使用)#!/usr/bin/env python# coding=utf-8# Python 2.7.3# 获取博客文章分类列表和文章存档列表# File: GetCategoryAndMonth.pyimport ur原创 2013-11-13 10:55:07 · 1983 阅读 · 0 评论 -
Python调用DLL
环境: VS2010 + Python27一. 创建一个dllDLL的创建过程参考: http://blog.csdn.net/cay22/article/details/53913191. 这里dll中导出函数是使用__stdcall声明的.2. TestDll.dll中的两个导出函数// TestDll.h#pragma once#ifd原创 2014-12-22 15:33:02 · 2927 阅读 · 0 评论 -
C++调用Python(不安装Python)
一. 你的Python代码创建文件Test001.py代码如下:#-*- coding:utf-8 -*-def HelloWorld(): print "Hello World"def Add(a, b): return a + bdef TestDictionary(dict): print dict dict["Size原创 2014-12-22 09:32:36 · 2911 阅读 · 0 评论 -
py2exe打包的简单使用
一. 安装py2exe1. 安装Python2.7.9, 配置好环境变量2. 安装py2exe(可以自动检测到Python的安装路径)下载地址http://sourceforge.net/projects/py2exe/files/py2exe/二. 打包步骤2.1 建一个目录, 例如 py2exeTest2.2 新建如下两个文件#-*- c原创 2014-12-20 17:23:17 · 2970 阅读 · 1 评论 -
C++调用Python(需要安装Python)
一. 安装Python2.7.91. next, next, ... 配置好环境变量2. 安装后, xxxx\Python27下有include和libs目录, C++需要包含这些东西, 按自己喜欢的方式添加到C++工程即可.二. 你的Python代码创建文件Test001.py代码如下:#-*- coding:utf-8 -*-def He原创 2014-12-20 09:48:10 · 2299 阅读 · 0 评论 -
JSon介绍
转自 http://www.json.org/json-zh.htmlJSon介绍JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式。 易于人阅读和编写。同时也易于机器解析和生成。 它基于JavaScript Programming Language, Standard ECMA-262 3rd Edition - December 1转载 2013-12-02 09:06:14 · 1071 阅读 · 0 评论 -
我的JSON解析库
/*{ "name": "json″, "array": [ { "cpp": "jsoncpp" }, { "java": "jsoninjava" }, { "php": "support" } ]}原创 2015-01-06 16:54:25 · 805 阅读 · 0 评论 -
Python 接收邮件(有附件)
#!/usr/bin/env python# coding=utf-8# Python 2.7.3# 获取邮件内容import poplibfrom email import parserhost = 'pop.163.com'username = 'MyTest22@163.com'password = 'xxxxxxxxx'pop_conn = poplib.POP3_S转载 2013-12-10 19:00:48 · 7077 阅读 · 0 评论 -
使用Python发送邮件
一. 邮件的发送这里使用邮箱MyTest22@163.com发送数据到cay22@163.com和cay33@163.com发送邮件主要用到了smtplib和email两个模块1. 简单文本的发送普通文本邮件发送的实现, 关键是要将MIMEText中_subtype设置为plain#!/usr/bin/env python# coding=utf-8转载 2013-12-09 15:04:34 · 1966 阅读 · 0 评论 -
Python查询天气预报
一. 实现过程1.1 查询外网IP通过这个网址查询到外网IP http://ip.dnsexit.com/index.php1.2 查询IP所在省份和城市通过这个地址查询到IP所在省份和城市 http://int.dpool.sina.com.cn/iplookup/iplookup.php?format=json&ip=54.54.194.134原创 2013-12-02 08:59:37 · 3686 阅读 · 1 评论 -
[Python下载CSDN博客]3. V2版本_完善内容显示格式和图片的下载
一. 目标在V1的基础上, 把提取到的文章保存为html格式, 并且文章内容的格式保留(例如字体, 颜色等) , 有标题等二. 提取文章内容2.1 分析其中一篇文章的HTML使用浏览器查看http://blog.csdn.net/bagboy_taobao_com/article/details/5582868 的HTML并保存为articl原创 2013-11-13 15:54:58 · 1637 阅读 · 0 评论 -
[Python下载CSDN博客]2. 使用BeautifulSoup分析HTML(二)
#!/usr/bin/env python# coding=utf-8# Python 2.7.3import osimport GetCategoryAndMonthimport GetArticleListimport GetArticleimport urllib2import httplibdef GetTypeList(host, blogName, list, t原创 2013-11-13 10:56:34 · 1456 阅读 · 0 评论 -
Python解析PE文件
一. 下载安装pefile库https://code.google.com/p/pefile/downloads/list解压后, 把pefile.py和peutils.py拷贝到你的工程中即可.(你也可以安装到Python中, 就是双击Setup.py后把pefile.pyc拷贝到X:\PythonXX\Lib\site-packages)https://code.googl原创 2013-11-05 16:40:40 · 5513 阅读 · 0 评论 -
Python学习网站资源
http://woodpecker.org.cn/DDDDDDDDDDDDDDDDDDDDDDDIDEL配色http://www.linuxidc.com/Linux/2012-07/66129.htmIDEL自动保全http://redswallow.is-programmer.com/posts/18338.htmlhttp://www.douban.com原创 2013-02-05 16:54:19 · 927 阅读 · 0 评论 -
Python string的一些用法
Python string的一些用法在线文档: http://docs.python.org/3.3/library/stdtypes.html#str1. str.split(sep=None, maxsplit=-1)http://docs.python.org/3.3/library/stdtypes.html#str.splitsep:分割符;maxsp转载 2013-03-05 09:35:57 · 2802 阅读 · 0 评论 -
Python抓取网页
1. 抓取一段网页http://blog.csdn.net/zsuguangh/article/details/6226385-------------------------------------------------------------------------------------------------------------------------------------转载 2013-03-05 09:59:09 · 4728 阅读 · 0 评论 -
Python容易弄错的问题
Python容易弄错的问题1. 关于Python的索引(有正数, 也有负数)假设有这么数组a, b, c, d, e, f, g, h, i, j, k 那么正索引 : 0 1 2 3 4 5 6 7 8 9 10数组 : a, b, c, d, e原创 2013-03-05 09:47:26 · 1286 阅读 · 0 评论 -
Python多线程编程方式2 threading库的介绍
http://www.cnblogs.com/huxi/archive/2010/06/26/1765808.htmlPython多线程编程方式2 threading库的介绍1. threading# 返回当前的线程变量。threading.currentThread()# 返回一个包含正在运行的线程的list。# 正在运行指线程启动后、结束前,不包括启动前转载 2013-02-06 10:59:16 · 3406 阅读 · 0 评论 -
Python代码文件头
#!/usr/bin/env python#thread_example2.py#use UTF-8#Python 3.0.1 # 加就是了# 文件名 # 代码的编码类型(因为Python使用的是tab来分开代码段落的, 如果不同编码的tab就会引起编译错误, 注明编码方式有利于排错) # 解析器的版本(例如从2.xx到3.原创 2013-02-06 09:55:35 · 1725 阅读 · 0 评论 -
Python多线程基础
http://www.17jo.com/program/python/app/ThreadUse.html1. Python多线程基础 Python多线程编程,当程序需要同时并发处理多个任务时,就需要要使用多线程编程。继承线程类threading.thread,再重载成员函数run,程序处理的代码写在函数run中,最后再调用start()方法来运行线程,而joi转载 2013-02-06 10:45:43 · 1803 阅读 · 0 评论 -
Python解析XML简单介绍
Python解析XML简单介绍1. 自己保存为free.xml dive into mark currently between addictions tag:diveintomark.org,2001-07-29:/ 2009-03-27T21:56:07Z Mark http://diveintomar转载 2013-02-06 15:32:59 · 1401 阅读 · 0 评论 -
Python简明教程学习笔记[目录]
转自>该笔记是我入门Python的简单记录, 记录原则: 尽量记录其中的代码例子来说明Python的各种基础, 以方便以后快速查询使用. 一. Python的环境配置.二. Python语法 2.1 运算符 2.2 if语句格式 2.3 while语句 2.4 for循环 2.5转载 2013-02-02 17:17:44 · 1682 阅读 · 0 评论 -
Python简明教程学习笔记[三]
回目录三. Python的面向对象编程3.1 Python的类的基础3.1.1 创建一个类#!/usr/bin/python# Filename: simplestclass.pyclass Person: pass # An empty blockp = Person() # 创建类对象print(p)输出$ python simples转载 2013-02-05 08:06:09 · 3675 阅读 · 0 评论 -
Python简明教程学习笔记[一]
回目录一. Python的环境配置.1. 双击安装程序, next, next 就可以了. 安装完后, 打开Python在上面就可以输入命令了.2. 运行程序文件*.py: 在cmd下 输入python xxx.py 就可以运行了.Python代码文件: 就是这么简单.#!/usr/bin/python# Filename : helloworld.pyp转载 2013-02-04 21:10:41 · 1855 阅读 · 0 评论 -
Python简明教程学习笔记[二]
回目录2.7 Python的模块相当于C++中的类库, 例如你自己写的lib, STL等.2.7.1 使用#!/usr/bin/python# Filename: using_sys.pyimport sys # 导入库print('The command line arguments are:')for i in sys.argv: print(i)转载 2013-02-04 21:37:04 · 2327 阅读 · 0 评论 -
Python中包,模块导入的方法
Python中包,模块导入的方法http://www.cnblogs.com/allenblogs/archive/2011/05/24/2055149.html1. import modname这种方法使用时, 使用的时候要包含模块名. 类似C++的STL 要使用std::一样.例如:# MyModule1.pydef MyDoSomething(a) pri转载 2013-03-05 17:15:04 · 3402 阅读 · 0 评论 -
Python的类, 模块与包概念
Python的类, 模块与包概念http://www.cnblogs.com/allenblogs/archive/2011/05/24/2055149.html可以这么理解: 1. 类就是类了.2. 模块就是py文件, 模块名就是py文件名去掉后缀.py3. 包就是文件夹, 包名就是文件夹名.4. 类放在模块中(类在py文件中定义); 模块放在包中(py文件放在文件夹转载 2013-03-05 17:21:43 · 4171 阅读 · 0 评论