python
叶起夜落
不动不想为化石
展开
-
二进制与8,10,16转换
对于学习计算机的人来说,进制的转换是真的常用到,刚开始接触,觉得头皮发麻。用得多了,也就没那么难受了。总结起来,用的多就熟练。二进制数据是用0和1两个数码表示的数,逢二进一。1.先来看看 二进制与8进制的转换二进制转八进制的时候,二进制三位对应八进制一位,从小数点开始,从左或者往右开始取,取到最后不够三位,用0补位。这里以二进制 :01011.0110为例,对应八进制则为:13.3...转载 2020-02-06 10:36:16 · 2394 阅读 · 0 评论 -
python的编码问题2
编码问题因为涉及到中文,所以必然地涉及到了编码的问题,这一次借这个机会算是彻底搞清楚了。问题要从文字的编码讲起。原本的英文编码只有0~255,刚好是8位1个字节。为了表示各种不同的语言,自然要进行扩充。中文的话有GB系列。可能还听说过Unicode和UTF-8,那么,它们之间是什么关系呢?Unicode是一种编码方案,又称万国码,可见其包含之广。但是具体存储到计算机上,并不用这种编码,转载 2016-05-10 20:56:56 · 700 阅读 · 0 评论 -
欢迎使用CSDN-markdown编辑器
用Python写一个简单的微博爬虫 转载:http://www.jianshu.com/p/7c5a4d7545ca我是个微博重度用户,工作学习之余喜欢刷刷timeline看看有什么新鲜事发生,也因此认识了不少高质量的原创大V,有分享技术资料的,比如好东西传送门;有时不时给你一点人生经验的,比如石康;有高产的段子手,比如银教授;有黄图黄段子小能手,比如阿良哥哥 木木萝希木 初犬饼…好吧,我承认,爬转载 2016-05-10 21:42:42 · 349 阅读 · 0 评论 -
爬取新浪博客http://www.jianshu.com/p/7c5a4d7545ca
用Python写一个简单的微博爬虫字数1274阅读3169 评论24 喜欢45 我是个微博重度用户,工作学习之余喜欢刷刷timeline看看有什么新鲜事发生,也因此认识了不少高质量的原创大V,有分享技术资料的,比如好东西传送门;有时不时给你一点人生经验的,比如石康;有高产的段子手,比如银教授;有黄图黄段子小能手,比如阿良哥哥木木萝希木 初犬饼...好吧,转载 2016-05-10 21:43:46 · 1962 阅读 · 0 评论 -
BeautifulSoup高级应用 之 CSS selectors /CSS 选择器
BeautifulSoup高级应用 之 CSS selectors /CSS 选择器2015-08-23 09:17:20CSDNWinterto1990776人点击BeautifulSoup支持最常用的CSS selectors,这是将字符串转化为Tag对象或者BeautifulSoup自身的.select()方法。本篇所使用的html为:html_doc = """ht转载 2016-05-24 20:26:47 · 642 阅读 · 0 评论 -
python里的re模块
使用 Python 模块 re 实现解析小工具Python 模块 re(Regular Expression)是一个很有价值并且非常强大的文本解析工具,本文通过一个简单有趣的小实例来分享一下此模块的使用方法。首先讲述 Python re 的语法和功能,并通过实际代码片段分步描述实现文本解析小工具的过程,最后演示该小工具的效果,并且为读者提供运行在 Google App Engi转载 2016-05-01 21:30:48 · 774 阅读 · 0 评论 -
mongodb的安装
MongoDB 是目前在IT行业非常流行的一种非关系型数据库(NoSql),其灵活的数据存储方式备受当前IT从业人员的青睐。这里主要讲如何在windows平台下安装MongoDB。工具/原料mongodb-win32-x86_64-2008plus-2.6.7.zip方法/步骤登陆mongodb官网点击右侧的下载转载 2016-05-29 17:14:09 · 373 阅读 · 0 评论 -
python中的list http://www.jb51.net/article/47978.htm
列表是Python中最基本的数据结构,列表是最常用的Python数据类型,列表的数据项不需要具有相同的类型。列表中的每个元素都分配一个数字 - 它的位置,或索引,第一个索引是0,第二个索引是1,依此类推。Python有6个序列的内置类型,但最常见的是列表和元组。序列都可以进行的操作包括索引,切片,加,乘,检查成员。此外,Python已经内置确定序列的长度以及确定最大和最小的元素的方法。转载 2016-05-05 20:29:12 · 774 阅读 · 0 评论 -
Python 格式化字符串
Python 格式化字符串2015/09/28 · 基础知识 · 字符串 分享到:3原文出处: 田小计划 在编写程序的过程中,经常需要进行格式化输出,每次用每次查。干脆就在这里整理一下,以便索引。 格式化操作符(%)“%”是Python风格的字符串格式化操作符,非常类似C语言里的printf()函数的字符串格式化(C语言中也是使用%)。转载 2016-05-16 21:55:34 · 400 阅读 · 0 评论 -
python中的编码解码问题
在爬取网页内容时遇到问题:UnicodeEncodeError: 'ascii' codec can't encode characters in position 12-16: ordinal not in range(128)这是ascii和utf-8问题也就是python的编码解码问题在python中写程序是往往要加 #-*-coding:utf-8-*-看到 别人总结的挺好原创 2016-04-22 16:20:19 · 2169 阅读 · 0 评论 -
python中的setdefaultencoding函数使用
http://blog.csdn.net/magicharvey/article/details/20055949主题 Python #!/usr/bin/env python #encoding: utf-8 import sys #引用sys模块进来,并不是进行sys的第一次加载 reload(sys) #重新加载sys sys.setdefaul转载 2016-04-22 16:24:23 · 4045 阅读 · 0 评论 -
python #coding:utf-8和setdefaultencoding有什么区别?
# coding:utf-8import sysreload(sys)sys.setdefaultencoding('utf-8') 1.如果你在python中进行编码和解码的时候,不指定编码方式,那么python就会使用defaultencoding。而python2.x的的defau原创 2016-04-22 16:33:58 · 6197 阅读 · 1 评论 -
python re 模块 findall 函数用法简述
>>> import re>>> s = "adfad asdfasdf asdfas asdfawef asd adsfas ">>> reObj1 = re.compile('((\w+)\s+\w+)')>>> reObj1.findall(s)[('adfad asdfasdf', 'adfad'), ('asdfas asdfawef', 'asdfas'), (转载 2016-04-24 17:36:34 · 3262 阅读 · 1 评论 -
mongodb
【摘要】当今已进入大数据时代,特别是大规模互联网web2.0应用不断发展及云计算所需要的海量存储和海量计算发展,传统的关系型数据库已无法满足这方面的需求。随着NoSQL数据库的不断发展和成熟,可以较好地解决海量存储和海量计算方面的应用需求。本文重点描述作为NoSQL之一MongoDB数据库在海量数据存储方面的应用。1 引言NoSQL,全称是“Not Only Sql”,指的是非关系型的数转载 2016-05-20 19:15:00 · 2108 阅读 · 1 评论 -
适合mongodb的四个免费可视化管理工具
4个免费、开源的MongoDB图形化管理工具jopen 2013-06-13 09:24:42• 发布摘要:RockMongo 是一个PHP5写的MongoDB管理工具。phpMoAdmin 是一个用 PHP 开发的在线 MongoDB 管理工具,可用于创建、删除和修改数据库和索引,提供视图和数据搜索工具,提供数据库启动时间和内存的统计,支持 JSON 格式数据的导入导出。Rock转载 2016-05-20 21:08:30 · 128151 阅读 · 2 评论 -
python之父之语 import this
优美胜于丑陋(python 以编写优美的代码为目标)明了胜于晦涩(优美的代码应该是明了的,命名规范,风格相似)简洁胜于复杂(优美的代码应当是简洁的,不要有复杂的内部实现)复杂胜于凌乱(如果复杂不可避免。那代码间也不能有难懂的关系,要保持接口简洁)扁平胜于嵌套(优美的代码应当是扁平的,不能有太多的嵌套)间隔胜于紧凑(优美的代码有适当的间隔,不要奢望一行代码解决问题)可读性很重原创 2016-03-14 21:27:29 · 4057 阅读 · 1 评论 -
正则表达式
re模块包含对 正则表达式。本章会对re模块主要特征和正则表达式进行介绍。 什么是正则表达式正则表达式是可以匹配文本片段的模式。最简单的正则表达式就是普通字符串,可以匹配其自身。换包话说,正则表达式’python’ 可以匹配字符串’python’ 。你可以用这种匹配行为搜索文本中的模式,并且用计算后有值并发特定模式,或都将文本进行分段。 ** 通配符正则表达式可以匹配多于一转载 2016-03-13 21:03:13 · 245 阅读 · 0 评论 -
urlretrieve() 函数http://www.nowamagic.net/academy/detail/1302861
下面我们再来看看 urllib 模块提供的 urlretrieve() 函数。urlretrieve() 方法直接将远程数据下载到本地。1>>> help(urllib.urlretrieve)2Help on function urlretrievein module urllib:转载 2016-03-12 22:05:17 · 514 阅读 · 0 评论 -
python学习的链接
http://www.runoob.com/python/python-tutorial.htmlhttp://baike.baidu.com/link?url=fNN6l3_HtnPzUaVmDBNngY37sLXjLUfy_xX80AqQEIH6YQjXsep-zFm3Rdzpw2zxcaqru9L72ASIMjULt1MiyKhttp://www.jikexueyuan.com/pa原创 2015-11-29 21:03:29 · 605 阅读 · 0 评论 -
Ipython
ipython 是一个 python 的交互式 shell,比默认的python shell 好用得多,支持变量自动补全,自动缩进,支持 bash shell 命令,内置了许多很有用的功能和函数。在ubuntu 下只要 sudo apt-get install ipython 就装好了,通过 ipython 启动。下面是 ipython 中几个简单好用的 magic函数:%bg f转载 2016-03-02 18:28:48 · 457 阅读 · 0 评论 -
python的命令模式和编辑模式
原创 2016-03-02 19:28:19 · 3693 阅读 · 0 评论 -
用python爬取图片之urlretrieve的用法
import urllibimport regethtml=urllib.urlopen('http://tieba.baidu.com/p/4404276051').read() #爬取网址pp=r'src="(.+?\.jpg)" size' #正则表达式的匹配ppp=re.compile(pp)img=re.findall(ppp,gethtml)x=0原创 2016-03-16 22:10:47 · 18563 阅读 · 0 评论 -
urllib2库 http://www.2cto.com/kf/201208/145070.html
python urllib2详解及实例 urllib2是Python的一个获取URLs(Uniform Resource Locators)的组件。他以urlopen函数的形式提供了一个非常简单的接口,这是具有利用不同协议获取URLs的能力,他同样提供了一个比较复杂的接口来处理一般情况,例如:基础验证,cookies,代理和其他。它们通过handlers和ope转载 2016-03-29 21:57:50 · 2046 阅读 · 0 评论 -
正则表达式
re模块包含对 正则表达式。本章会对re模块主要特征和正则表达式进行介绍。 什么是正则表达式正则表达式是可以匹配文本片段的模式。最简单的正则表达式就是普通字符串,可以匹配其自身。换包话说,正则表达式’python’ 可以匹配字符串’python’ 。你可以用这种匹配行为搜索文本中的模式,并且用计算后有值并发特定模式,或都将文本进行分段。 ** 通配符正则表达式可以匹配多于一转载 2016-03-07 20:00:11 · 183 阅读 · 0 评论 -
urllib
urllib模块提供的上层接口,使我们可以像读取本地文件一样读取www和ftp上的数据。每当使用这个模块的时候,老是会想起公司产品的客户端,同事用C++下载Web上的图片,那种“痛苦”的表情。我以前翻译过libcurl教程,这是在C/C++环境下比较方便实用的网络操作库,相比起 libcurl,Python的urllib模块的使用门槛则低多了。可能有些人又会用效率来批评Python,其实在操作网络转载 2016-03-07 22:09:51 · 395 阅读 · 0 评论 -
学习python前需要了解的东西——————-python学习流程和资源
前言:数据科学越来越火了,网页是数据很大的一个来源。最近很多人问怎么抓网页数据,据我所知,常见的编程语言(C++,java,python)都可以实现抓网页数据,甚至很多统计\计算的语言(R,Matlab)都有可以实现和网站交互的包。本人试过用java,python,R抓网页,感觉语法各有差异,逻辑上是一样的。我准备用python来大概讲讲抓网页是什么概念,具体的内容要自己看手册或者google转载 2016-03-08 19:24:41 · 3011 阅读 · 0 评论 -
爬取网页内容
编码问题因为涉及到中文,所以必然地涉及到了编码的问题,这一次借这个机会算是彻底搞清楚了。问题要从文字的编码讲起。原本的英文编码只有0~255,刚好是8位1个字节。为了表示各种不同的语言,自然要进行扩充。中文的话有GB系列。可能还听说过Unicode和UTF-8,那么,它们之间是什么关系呢?Unicode是一种编码方案,又称万国码,可见其包含之广。但是具体存储到计算机上,并不用这种编码,转载 2016-03-08 19:34:44 · 2078 阅读 · 0 评论 -
python中的string模块
FILE c:\users\zzzry\anaconda\lib\string.pyDESCRIPTION Warning: most of the code you see here isn't normally used nowadays. Beginning with Python 1.6, many of these functions are i原创 2016-03-20 20:40:13 · 1082 阅读 · 0 评论 -
string的模块
Help on module string:帮助模块的字符串:NAME的名字string - A collection of string operations (most are no longer used).字符串,字符串操作的集合(大多数是不再使用)。DESCRIPTION描原创 2016-03-20 20:44:03 · 564 阅读 · 0 评论 -
用python爬取游戏图片
最近老师让学习Python与维基百科相关的知识,无聊之中用Python简单做了个爬取“游讯网图库”中的图片,因为每次点击下一张感觉非常浪费时间又繁琐。主要分享的是如何爬取HTML的知识和Python如何下载图片;希望对大家有所帮助,同时发现该网站的图片都挺精美的,建议阅读原网下载图片,支持游讯网不要去破坏它。 通过浏览游讯网发现它的图库URL为,其中全部图片为0_0_1到0_0_转载 2016-03-12 19:54:35 · 1885 阅读 · 0 评论 -
Python的urlopen的使用
urlopen是urlopen里的一个方法函数通过网址URL来获取数据关于Python的urlopen的使用: 创建一个表示远程url的类文件对象,然后像本地文件一样操作这个类文件对象来获取远程数据。 参数url表示远程数据的路径,一般是网址;参数data表示以post方式提交到url的数据(玩过web的人应该知道提交数据的两种方式:post与get。如果你不清楚,也不必太在意,一原创 2016-03-12 21:53:36 · 19528 阅读 · 0 评论 -
python中的open的使用
打开一个文件并向其写入内容Python的open方法用来打开一个文件。第一个参数是文件的位置和文件名,第二个参数是读写模式。这里我们采用w模式,也就是写模式。在这种模式下,文件原有的内容将会被删除。#to writetestFile = open('cainiao.txt','w')#error testFile.write(u'菜鸟写Python!')#写入一个字符串转载 2016-03-12 21:54:31 · 1079 阅读 · 0 评论 -
python初级了解
简单:Python是一种代表简单主义思想的语言。阅读一个良好的Python程序就感觉像是在读英语一样。它使你能够专注于解决问题而不是去搞明白语言本身。易学:Python极其容易上手,因为Python有极其简单的语法。免费、开源:Python是FLOSS(自由/开放源码软件)之一。使用者可以自由地发布这个软件的拷贝、阅读它的源代码、对它做改动、把它的一部分用于新的自由软件中。FLOS原创 2015-11-20 21:31:03 · 1431 阅读 · 0 评论