Python
文章平均质量分 54
tianbwin2995
这个作者很懒,什么都没留下…
展开
-
用Python如何处理excel里面的数据
Python如果想读excel,需要提前加载xlrd库加载xlrd库的方法:安装有几种不同的安装方法。下面是以xlrd为例的,其它二个库都是使用同样的步骤。 从源码安装Linux系统:Python代码 $ tar xzf xlrd.tgz $ cd xlrd-0.7.1 $ python setup.py原创 2016-01-29 20:29:49 · 3184 阅读 · 0 评论 -
python安装ez_install 和sklearn
正常情况下,我们要给Python安装第三方的扩展包,我们必须下载压缩包,解压缩到一个目录,然后命令行或者终端打开这个目录,然后执行python setup.py install来进行安装。这样是不是很繁琐呢?如果我们直接命令行执行easy_install Twisted就把最新版的Twisted包装上去了,是不是很爽呢?所以easy_install就是为了我们安装第三方扩展原创 2016-03-14 11:13:24 · 1553 阅读 · 0 评论 -
python文件读写操作
http://blog.csdn.net/xia7139/article/details/25544015python中,可以通过open()函数打开一个文件创建一个file类的对象来操作文件,也可以在打开文件创建file对象时指定文件打开的模式(如果没有指定打开模式,默认为r),来决定能对文件进行的操作。这里说的文件读写操作就是利用file类中提供的read、readline、rea转载 2016-03-14 18:09:44 · 414 阅读 · 0 评论 -
正则表达式30分钟教程
http://www.oschina.net/question/12_9507目录跳过目录本文目标如何使用本教程正则表达式到 底是什么东西?入门测试正则表达式元字符字符转义重复字符类分枝条件反义分组后向引用零宽断言负 向零宽断言注释贪婪与懒惰处理选项平衡组/递 归匹配还 有些什么东西没提到联系作者最 后,来点广告……网上的资源及本文参 考文献更新纪录本文目标转载 2016-03-14 18:32:08 · 406 阅读 · 0 评论 -
Python面向对象编程-封装
大家使用Python这门语言,大多是作为一门脚本语言来使用。这里熟悉下python的面向对象的特性。1、几个基本概念1.1 面向过程和面向对象根据操作数据的函数或语句块来设计程序的过程,叫做面向过程编程。与之相对应的,如果把数据和功能结合起来,用称为对象的东西包裹起来,这种组织程序的方法称为面向对象的编程。面向对象的编程一般用在稍微大型的项目或者是要求更加合理的解决方案的场转载 2016-03-14 18:08:07 · 447 阅读 · 0 评论 -
浅析python 中__name__ = '__main__' 的作用
http://www.jb51.net/article/51892.htm很多新手刚开始学习python的时候经常会看到python 中__name__ = \'__main__\' 这样的代码,可能很多新手一开始学习的时候都比较疑惑,python 中__name__ = '__main__' 的作用,到底干嘛的?有句话经典的概括了这段代码的意义:“Make a scrip转载 2016-04-12 11:34:44 · 247 阅读 · 0 评论 -
Python学习笔记——Unicode
普通字符串可以用多种方式编码成Unicode字符串,具体要看你究竟选择了哪种编码:unicodestring = u"Hello world" # 将Unicode转化为普通Python字符串:"encode" utf8string = unicodestring.encode("utf-8") asciistring = unicodestring.encode("ascii")转载 2016-04-13 13:56:12 · 306 阅读 · 0 评论 -
python函数可以操纵外面的元素和列表吗?
在Python里写了个函数,担心使用不了外部定义的列表和元素,特意写了个函数检验,检验结果说明,Python可以操纵这些元素和列表事实证明,Python可以调用那个lis列表许多时候,新建一个test文件,可以练许多不确定的东西。加油吧少年原创 2016-04-16 18:51:06 · 665 阅读 · 0 评论 -
正则表达式re包报错unbalanced parenthesis无法处理小括号的情形
我准备总结的时候,当一把雷锋,把可能报过的错都整理出来,在总结的时候说出来。放在ppt上【这样报错考验的的确是应用工程上的经验,不过貌似没有啥技术含量?debug的技术只有在工程应用上有说明今天发现的错误,是正则表达式无法处理小括号的情形。因为在re里,小括号的出现是需要转译的,没转译自然会报错。目前想的解决方法:1.抛异常抛出,不管他2.在查找之前,先把小原创 2016-04-16 19:58:31 · 32739 阅读 · 5 评论 -
local variable XXX referenced before assignment
在函数外定义了一个变量 totalCount ,然后在python的一个函数里面引用这个变量,并改变它的值,结果报错local variable 'totalCount' referenced before assignment,代码如下:def func(ip_start, ip_end): ... totalCount += 1正确如下:def func(i转载 2016-04-17 16:15:24 · 3577 阅读 · 0 评论 -
python代码片段【这些都是可以work的】
1.函数里是可以调用外部列表里的元素的。不过貌似有一点不行:调用外部变量的时候,如果想更改,得加一个global2.i和j是可以循环遍历的 不过这样的时间复杂度还是O(n2)原创 2016-04-18 08:32:57 · 356 阅读 · 0 评论 -
Python 解析配置模块之ConfigParser详解
1 基本的读取配置文件-read(filename) 直接读取ini文件内容-sections() 得到所有的section,并以列表的形式返回-options(section) 得到1.基本的读取配置文件-read(filename) 直接读取ini文件内容-sections() 得到所有的section,并以列表的形式返回-options(section) 得到该s转载 2016-06-12 13:32:21 · 1271 阅读 · 1 评论 -
sys.argv的使用方法
在Python中,sys.argv中包含了基本上所有的参数。其中,sys.argv[0]代表所有参数,sys.argv[1]代表第一个参数…以此类推。注意,当你运行该Python文件时,需要把参数加进去一起运行。但是显示总参数个数的时候,是你的参数数量加一。 不多说,看图: 【另外,在shell中写一个Python文件的方法很简单,就是vim test.py,之后会自动帮你配置好相应的变量。原创 2016-06-13 15:50:38 · 2485 阅读 · 0 评论 -
用Python写入一个文本文件
我想要的是这种类型的:前面ckcodeXX 其中XX是根据数字递增的方法:Python法:with open('d://shuju1.txt','w') as fo: for i in range(300): fo.write("ckcode" + str(i) + ",\n")这个比下一个方法简单,用 with as 省了一步 fo=open('d:/原创 2016-03-14 15:24:07 · 1878 阅读 · 0 评论 -
CH03
第一步,通过feedparser解析URL为rss,保存在d中,然后在d里的entry里的summary找到博客内容,然后通过自己写一个Wordcount,统计博客内容的各个单词出现的频率,保存在字典wc{}中#coding=utf-8import feedparserimport redef getwordcounts(url): d = feedparser.parse(ur原创 2016-02-29 15:05:26 · 326 阅读 · 0 评论 -
Python中用feedparser解析RSS
RSS 是用于分发 Web 站点上的内容的摘要的一种简单的 XML 格式。一、feedparser的安装 下载一个安装包,然后用Windows命令行cd到那个目录下面 输入 python setup.py install 如果不行,那么先双击一次setup.py 再输入feedparser解析RSS的函数:parse代码: d = feedparser.par原创 2016-02-29 11:25:13 · 1899 阅读 · 0 评论 -
自己写的第一段可运行多段数据的Python代码。。
千里之行,始于足下。这是第一段写的比较熟练的代码。刚开始学Python做数据分析,希望以后会慢慢懂的更多。def loadDataSet(filename): dataMat=[];labelMat=[] fr=open(filename) for line in fr.readlines(): lineArr=line.strip().split('\t') len1=len(原创 2015-12-18 11:57:31 · 649 阅读 · 0 评论 -
【小白自学笔记】【机器学习实战】【Python代码逐行理解】CH02
第一个给出的是一个非常简单的例子:给出四个训练集数据(0,0)(0,0.1)【A类】(1,1)(1,1.1)【B类】 然后让你输入一个数字判断从属于A类还是B类方法也很简单粗暴,离这个点的距离近的3个【k个】点,属于标签A的多,就判给A,B的多就判给B问题:距离怎么算?方法很简单:欧氏距离。好了。所以我们代码的核心就是写出这个欧氏距离,涉及到几点注意点:1.要根据训练集原创 2015-11-12 15:47:24 · 500 阅读 · 0 评论 -
python中文分词:结巴分词
http://www.cnblogs.com/kaituorensheng/p/3595879.html特点1,支持三种分词模式: a,精确模式,试图将句子最精确地切开,适合文本分析; b,全模式,把句子中所有的可以成词的词语都扫描出来, 速度非常快,但是不能解决歧义; c,搜索引擎模式,在精确模式的基础上,对长词再次切分,提高召回率,转载 2016-03-15 18:30:51 · 1934 阅读 · 0 评论 -
Python正则表达式,re模块
1.re.split 会根据模式的匹配项来分割字符串[, ]代表了逗号或空格,如果以这个作为分割的话,实验如下:import re我发现,当用了[, ]这个时,它的确可以根据空格【或】逗号来进行分割,但是,当遇到多个空格和逗号连续出现的时候,就不行了。因此,方法是在[, ]后面加一个+加号。代表重复1-无限次。这样,便成功了。2.re. findall以原创 2016-03-15 19:40:37 · 375 阅读 · 0 评论 -
python进阶学习笔记(一):打开文件
http://www.cnblogs.com/fnng/archive/2013/05/22/3091982.html同样是《python基础教程(第二版)》的内容,只是后面内容学起来,相比前面会比较有趣,也更加实用,所以,将“基础”改为“进阶”。python 电子书分享地址:http://yunpan.cn/Q2U87uGrNiTA3 本节讲文件的操作转载 2016-03-16 10:56:29 · 325 阅读 · 0 评论 -
对Python面向对象的理解
以前本科和研究生都是数学系,从来没接触过编程,更别提面向对象的编程了。以前看书,总是看不懂弄一个类要做什么,这次实习,有许许多多用这些的时候,才体会到面向对象的理论。写点东西,省得忘了。当然知识的更新是长久的,我也希望未来某一天我回看自己这个东西的时候,我会觉得自己的理解还很肤浅。呵呵当年的自己too simple。这代表我技术成长了面相对象的思想: 我定义一个类,这个类里面,有属性,原创 2016-03-17 16:06:54 · 1286 阅读 · 0 评论 -
UnicodeEncodeError: ‘ascii’ codec can’t encode characters in position xxx ordinal not in range(12
python在安装时,默认的编码是ascii,当程序中出现非ascii编码时,python的处理常常会报这样的错UnicodeDecodeError: 'ascii' codec can't decode byte 0x?? in position 1: ordinal not in range(128),python没办法处理非ascii编码的,此时需要自己设置将python的默认编码,一般设置转载 2016-03-18 15:43:37 · 649 阅读 · 0 评论 -
机器学习模型评价指标
分为三个大块:1 如何利用scikit-learn进行交叉验证 2 如何评价分类模型的指标 3 如何评价线性模型的指标 4如何评价聚类模型的指标交叉验证:1.holdout2.K-Fold3.留12.分类模型的评价指标最重要的:混淆矩阵confusion_matrix其余的一些指标:准确度accuracy 所有正确的精确率:预测1正确的在全部预测为正确1的里原创 2016-03-17 16:33:25 · 3148 阅读 · 0 评论 -
Python pandas insert list into a cell
http://stackoverflow.com/questions/26483254/python-pandas-insert-list-into-a-cellup vote2down votefavoriteI have a list 'abc' and a dataframe 'df':abc = ['foo', '转载 2016-04-01 13:41:24 · 5154 阅读 · 0 评论 -
python group()
python group()正则表达式中,group()用来提出分组截获的字符串,()用来分组import rea = "123abc456"print re.search("([0-9]*)([a-z]*)([0-9]*)",a).group(0) #123abc456,返回整体print re.search("([0-9]*)([a-z]*)([0-9转载 2016-04-01 14:01:46 · 836 阅读 · 0 评论 -
【Python】Python的数据分析(三)——数据文件及数据结构
http://blog.csdn.net/shandianke/article/details/41877457一. 数据文件 pd指pandas简称,df指DataFrame对象。1. csv读取 pd.read_csv('foo.csv')写入 df.to_csv('foo.csv')2. HDF5读取 pd.read_hdf('foo.h5',转载 2016-04-01 18:54:32 · 1737 阅读 · 0 评论 -
CH02:提供推荐
有关推荐问题:目标输出:我想得到一个长串,里面既有与这个人评分较高(即相似度较高)的人的名字,也有他的得分,应该用Python里的什么结构?Q:一个列表也好,一个字典也好,不定义可以直接用吗?A:不可以。一个字符在不定义的时候可以直接用(for item in ...)并没有定义item,直接拿来用就好 item可以是数字,可以是名称字符,方便直接但是,在用列表和字典的时候,一定要原创 2016-02-28 21:53:01 · 322 阅读 · 0 评论 -
centos将Python从2.6升级到2.7的方法
http://blog.csdn.net/jcjc918/article/details/11022345#comments转载 2016-08-17 17:43:04 · 357 阅读 · 0 评论