自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(24)
  • 资源 (1)
  • 收藏
  • 关注

转载 urllib2库 http://www.2cto.com/kf/201208/145070.html

python urllib2详解及实例 urllib2是Python的一个获取URLs(Uniform Resource Locators)的组件。他以urlopen函数的形式提供了一个非常简单的接口,这是具有利用不同协议获取URLs的能力,他同样提供了一个比较复杂的接口来处理一般情况,例如:基础验证,cookies,代理和其他。它们通过handlers和ope

2016-03-29 21:57:50 2045

转载 正则表达式

以下内容转自CNBLOG:http://www.cnblogs.com/huxi/archive/2010/07/04/1771073.html整理时没有注意,实在抱歉。一、 正则表达式基础1.1.概念介绍正则表达式是用于处理字符串的强大工具,它并不是Python的一部分。其他编程语言中也有正则表达式的概念,区别只在于不同的编程语言实现支持的语法数量不同。它

2016-03-29 20:49:13 1080

原创 string的模块

Help on module string:帮助模块的字符串:NAME的名字string - A collection of string operations (most are no longer used).字符串,字符串操作的集合(大多数是不再使用)。DESCRIPTION描

2016-03-20 20:44:03 563

原创 python中的string模块

FILE    c:\users\zzzry\anaconda\lib\string.pyDESCRIPTION    Warning: most of the code you see here isn't normally used nowadays.    Beginning with Python 1.6, many of these functions are i

2016-03-20 20:40:13 1081

原创 用python爬取图片之urlretrieve的用法

import urllibimport regethtml=urllib.urlopen('http://tieba.baidu.com/p/4404276051').read()  #爬取网址pp=r'src="(.+?\.jpg)" size'   #正则表达式的匹配ppp=re.compile(pp)img=re.findall(ppp,gethtml)x=0

2016-03-16 22:10:47 18562

原创 python之父之语 import this

优美胜于丑陋(python 以编写优美的代码为目标)明了胜于晦涩(优美的代码应该是明了的,命名规范,风格相似)简洁胜于复杂(优美的代码应当是简洁的,不要有复杂的内部实现)复杂胜于凌乱(如果复杂不可避免。那代码间也不能有难懂的关系,要保持接口简洁)扁平胜于嵌套(优美的代码应当是扁平的,不能有太多的嵌套)间隔胜于紧凑(优美的代码有适当的间隔,不要奢望一行代码解决问题)可读性很重

2016-03-14 21:27:29 4056 1

转载 正则表达式

re模块包含对 正则表达式。本章会对re模块主要特征和正则表达式进行介绍。 什么是正则表达式正则表达式是可以匹配文本片段的模式。最简单的正则表达式就是普通字符串,可以匹配其自身。换包话说,正则表达式’python’ 可以匹配字符串’python’ 。你可以用这种匹配行为搜索文本中的模式,并且用计算后有值并发特定模式,或都将文本进行分段。 ** 通配符正则表达式可以匹配多于一

2016-03-13 21:03:13 245

转载 urlretrieve() 函数http://www.nowamagic.net/academy/detail/1302861

下面我们再来看看 urllib 模块提供的 urlretrieve() 函数。urlretrieve() 方法直接将远程数据下载到本地。1>>> help(urllib.urlretrieve)2Help on function urlretrievein module urllib:

2016-03-12 22:05:17 513

转载 python中的open的使用

打开一个文件并向其写入内容Python的open方法用来打开一个文件。第一个参数是文件的位置和文件名,第二个参数是读写模式。这里我们采用w模式,也就是写模式。在这种模式下,文件原有的内容将会被删除。#to writetestFile = open('cainiao.txt','w')#error testFile.write(u'菜鸟写Python!')#写入一个字符串

2016-03-12 21:54:31 1078

原创 Python的urlopen的使用

urlopen是urlopen里的一个方法函数通过网址URL来获取数据关于Python的urlopen的使用:  创建一个表示远程url的类文件对象,然后像本地文件一样操作这个类文件对象来获取远程数据。  参数url表示远程数据的路径,一般是网址;参数data表示以post方式提交到url的数据(玩过web的人应该知道提交数据的两种方式:post与get。如果你不清楚,也不必太在意,一

2016-03-12 21:53:36 19521

转载 用python爬取游戏图片

最近老师让学习Python与维基百科相关的知识,无聊之中用Python简单做了个爬取“游讯网图库”中的图片,因为每次点击下一张感觉非常浪费时间又繁琐。主要分享的是如何爬取HTML的知识和Python如何下载图片;希望对大家有所帮助,同时发现该网站的图片都挺精美的,建议阅读原网下载图片,支持游讯网不要去破坏它。        通过浏览游讯网发现它的图库URL为,其中全部图片为0_0_1到0_0_

2016-03-12 19:54:35 1884

转载 爬取网页内容

编码问题因为涉及到中文,所以必然地涉及到了编码的问题,这一次借这个机会算是彻底搞清楚了。问题要从文字的编码讲起。原本的英文编码只有0~255,刚好是8位1个字节。为了表示各种不同的语言,自然要进行扩充。中文的话有GB系列。可能还听说过Unicode和UTF-8,那么,它们之间是什么关系呢?Unicode是一种编码方案,又称万国码,可见其包含之广。但是具体存储到计算机上,并不用这种编码,

2016-03-08 19:34:44 2077

转载 学习python前需要了解的东西——————-python学习流程和资源

前言:数据科学越来越火了,网页是数据很大的一个来源。最近很多人问怎么抓网页数据,据我所知,常见的编程语言(C++,java,python)都可以实现抓网页数据,甚至很多统计\计算的语言(R,Matlab)都有可以实现和网站交互的包。本人试过用java,python,R抓网页,感觉语法各有差异,逻辑上是一样的。我准备用python来大概讲讲抓网页是什么概念,具体的内容要自己看手册或者google

2016-03-08 19:24:41 3010

转载 urllib

urllib模块提供的上层接口,使我们可以像读取本地文件一样读取www和ftp上的数据。每当使用这个模块的时候,老是会想起公司产品的客户端,同事用C++下载Web上的图片,那种“痛苦”的表情。我以前翻译过libcurl教程,这是在C/C++环境下比较方便实用的网络操作库,相比起 libcurl,Python的urllib模块的使用门槛则低多了。可能有些人又会用效率来批评Python,其实在操作网络

2016-03-07 22:09:51 395

转载 机器学习

作者:寒小阳&&龙心尘时间:2016年2月。 出处:http://blog.csdn.net/han_xiaoyang/article/details/50759472http://blog.csdn.net/longxinchen_ml/article/details/50749614声明:版权所有,转载请联系作者并注明出处1. 引言也许你和这个叫『机器学习』

2016-03-07 20:26:13 1898 1

转载 正则表达式

re模块包含对 正则表达式。本章会对re模块主要特征和正则表达式进行介绍。 什么是正则表达式正则表达式是可以匹配文本片段的模式。最简单的正则表达式就是普通字符串,可以匹配其自身。换包话说,正则表达式’python’ 可以匹配字符串’python’ 。你可以用这种匹配行为搜索文本中的模式,并且用计算后有值并发特定模式,或都将文本进行分段。 ** 通配符正则表达式可以匹配多于一

2016-03-07 20:00:11 183

转载 稀疏自编码http://deeplearning.stanford.edu/wiki/index.php/Exercise:Sparse_Autoencoder#Results

在这个问题集,您将实现稀疏自编码算法,并展示它是如何发现的边​​缘是自然的图像很好的代表性。(由布鲁诺Olshausen提供的图像)稀疏自编码算法的课程网站上找到的讲义描述。在该文件sparseae_exercise.zip,我们提供了在Matlab一些起始代码。你应该写在文件所指处代码(“ 你的代码HERE ”)。你必须完成以下文件: sampleIMAGES.m,sparseAutoe

2016-03-03 20:55:52 1252

转载 matlab 中的load介绍

有些计算旷日废时,那麽我们通常希望能将计算所得的储存在档案中,以便将来可进行其他处理。MATLAB储存变数的基本命令是save,在不加任何选项(Options)时,save会将变数以二进制(Binary)的方式储存至副档名为mat的档案,如下述:   save:将工作空间的所有变数储存到名为matlab.mat的二进制档案。 save filename:将工作空间的所有变数储存

2016-03-03 20:50:12 2915

转载 matlab 中的load介绍

一:有些计算旷日废时,那麽我们通常希望能将计算所得的储存在档案中,以便将来可进行其他处理。MATLAB储存变数的基本命令是save,在不加任何选项(Options)时,save会将变数以二进制(Binary)的方式储存至副档名为mat的档案,如下述:   save:将工作空间的所有变数储存到名为matlab.mat的二进制档案。 save filename:将工作空间的所有变数储存到名为f

2016-03-03 20:47:03 9032

转载 自编码神经网络

主要参考资料是Stanford 教授 Andrew Ng 的 Deep Learning 教程讲义:http://deeplearning.stanford.edu/wiki/index.php/UFLDL_Tutorial。这个讲义已经有人翻译了(赞一个),可以参见邓侃的新浪博客http://blog.sina.com.cn/s/blog_46d0a3930101h6nf.html。另外,博客园

2016-03-03 19:33:12 8078

转载 机器学习——深度学习

Deep Learning是机器学习中一个非常接近AI的领域,其动机在于建立、模拟人脑进行分析学习的神经网络,最近研究了机器学习中一些深度学习的相关知识,本文给出一些很有用的资料和心得。Key Words:有监督学习与无监督学习,分类、回归,密度估计、聚类,深度学习,Sparse DBN,1. 有监督学习和无监督学习给定一组数据(inpu

2016-03-03 18:59:04 416 1

原创 python的命令模式和编辑模式

2016-03-02 19:28:19 3690

原创 和python库有关的网址

http://my.oschina.net/lionets/blog?catalog=518889

2016-03-02 19:20:30 270

转载 Ipython

ipython 是一个 python 的交互式 shell,比默认的python shell 好用得多,支持变量自动补全,自动缩进,支持 bash shell 命令,内置了许多很有用的功能和函数。在ubuntu 下只要 sudo apt-get install ipython 就装好了,通过 ipython 启动。下面是 ipython 中几个简单好用的 magic函数:%bg f

2016-03-02 18:28:48 457

MATLAB2012b的安装许可文件crack、

MATLAB2012b的安装许可文件crack;.dat文件

2016-01-15

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除