python
sina微博_SNS程飞
个人网站:www.ymshici.com
研究方向:机器学习数据挖掘社交网络推荐系统
展开
-
python os popen 获取system运行结果
content=os.popen('help').read()原创 2017-05-18 20:03:31 · 17894 阅读 · 1 评论 -
【python系列】python 获取当前位置所在的文件名、函数名和行号
python 获取当前位置所在的函数名和行号 在C/C++程序调试中经常用到的几个宏:__FILE__、__FUNCTION__、__LINE__,最近写python程序遇到问题调试时也想用下这种方式,找了下网上资料,发现这个问题还有不少人问,估计都是像我这种刚从C/C++转到python的吧。python中获取当前位置所在的函数名和行号都封装在sys中,获取方法如下:转载 2014-04-07 21:51:39 · 7449 阅读 · 0 评论 -
【python系列】TypeError: 'module' object is not callable 原因分析
程序代码 class Person: #constructor def __init__(self,name,sex): self.Name = name self.Sex = sex def ToString(self): return 'Name:'+self.Name+',Sex:'+s转载 2014-04-06 19:01:46 · 1873 阅读 · 0 评论 -
【机器学习系列】logistic回归python实现
说明这只是一个还未优化的logistic回归的python实现,如果数据量比较大的时候,速度会变慢。如果需要优化,请参考 @zouxy09 的文章 http://blog.csdn.net/zouxy09/article/details/20319673,不明白logistic回归原理的也可以参考这篇文章。logistic回归最终需要求解的参数是w,即回归系数。且回归问题最终转原创 2014-03-25 16:51:30 · 2943 阅读 · 0 评论 -
【机器学习系列】python版PCA(主成分分析)
简介 在用统计分析方法研究这个多变量的课题时,变量个数太多就会增加课题的复杂性。人们自然希望变量个数较少而得到的信息较多。在很多情形,变量之间是有一定的相关关系的,当两个变量之间有一定相关关系时,可以解释为这两个变量反映此课题的信息有一定的重叠。主成分分析是对于原先提出的所有变量,建立尽可能少的新变量,使得这些新变量是两两不相关的,而且这些新变量在反映课题的信息方面尽可能保持原有转载 2014-04-03 14:59:09 · 3760 阅读 · 0 评论 -
【python系列】使用mayavi画3d散点图
如何使用mayavi,请参见上一篇文章。1.使用mayavi代码import enthought.mayavi.mlab as mylabimport numpy as npx, y, z, value = np.random.random((4, 40))mylab.points3d(x, y, z, value)mylab.show()效果2原创 2014-03-21 21:59:47 · 8928 阅读 · 0 评论 -
【python系列】“Unable to find vcvarsall.bat”错误的解决
今天在安装deltaLda时出现Unable to find vcvarsall.bat的错误。上网找了一下,在eddsn找到了“Unable to find vcvarsall.bat” error when trying to install rdflib这么一篇文章,解决了问题。方法如下:首先安装MinGW,在MinGW的安装目录下找到bin的文件夹,找到ming转载 2014-03-20 15:50:45 · 983 阅读 · 0 评论 -
【python系列】画lda主题分布折线图
说明利用python画lda训练出来的doc的主题分布的折线图。主题分布文件为GibbsLDA++中casestudy中给出的。代码#coding:utf-8import matplotlib.pyplot as pltimport random# 读取文件内容lines=open(r"D:\gibbslda\GibbsLDA++-0.2\model原创 2014-03-20 15:06:22 · 4067 阅读 · 2 评论 -
【python系列】使用mayavi作3d图
mayavi介绍Mayavi2完全用Python编写,因此它不但是一个方便实用的可视化软件,而且可以方便地用Python编写扩展,嵌入到用户编写的Python程序中,或者直接使用其面向脚本的API:mlab快速绘制三维图。mayavi介绍链接:http://code.enthought.com/projects/mayavi/作图代码from numpy import原创 2014-03-21 17:10:02 · 13257 阅读 · 1 评论 -
【python系列】经常用到的random模块
Python中的random模块用于生成随机数。下面介绍一下random模块中最常用的几个函数。random.randomrandom.random()用于生成一个0到1的随机符点数: 0 random.uniform random.uniform的函数原型为:random.uniform(a, b),用于生成一个指定范围内的随机符点数,两个参数其中一个是上限,一转载 2014-03-30 21:09:20 · 926 阅读 · 0 评论 -
【数据结构&&算法系列】归并排序简单介绍及python代码
代码原创 2014-04-22 22:24:23 · 1052 阅读 · 0 评论 -
【数据结构&&算法系列】堆排序简单介绍及其实现
#coding:utf-8# 左孩子节点坐标def left(i): return 2*i + 1 # 如果用位运算的话,注意是 (i<<1) + 1 而不是 i<<1+1 (相当于4*i) , 因为位运算优先级小于加减运算优先级# 右孩子节点坐标def right(i): return 2*i + 2# 父节点坐标def parent(i): return (i-1)>>原创 2014-04-23 16:07:23 · 878 阅读 · 0 评论 -
【数据结构&&算法系列】快速排序简单介绍及实现
#coding:utf-8def quick_sort(arr,p,r): if p<r: q = partition(arr,p,r) quick_sort(arr,p,q-1) quick_sort(arr,q,r)def partition(arr,p,r): key = arr[r] i = p-1 for j in range(p,r): if arr[j原创 2014-04-23 17:27:25 · 874 阅读 · 0 评论 -
python发送qq邮件
# coding:utf8import smtplibfrom email.MIMEMultipart import MIMEMultipartfrom email.MIMEText import MIMETextmsg = MIMEMultipart()msg['From'] = '123456@qq.com'msg['To'] = '张三'msg['Su原创 2016-06-23 20:36:23 · 982 阅读 · 1 评论 -
python操作csv
import csvreader = csv.reader(open("data/psid_creative_ctr_new.csv", "rU"), dialect=csv.excel_tab)for items in reader: for item in items: print "\t".join(item.split(";"))csv操作,简单记录下原创 2016-06-30 14:21:34 · 767 阅读 · 0 评论 -
java getBytes() | python bytearray()
最近在处理密钥相关的项目,需要将java代码转换为python,其中java有个函数是getBytes(),需要转换成python的函数,经查找资料发现python用的是bytearray().java python 代码分别如下:java : Passwd.getBytes()python : bytearray(passwd)原创 2016-03-17 11:04:23 · 8633 阅读 · 0 评论 -
【python txt2xls】个人开发的python文本转表格工具txt2xls
简介开发了一个将指定格式的文本转换成xls表格的程序,需要安装xlwt。说明支持多个sheet。使用方法python txt2xls.py student.txt student.xlstxt样例tablename 计科0801班starttitle 姓名 年龄 性别notitle 张三 22 男notitle 韩梅梅 21 女en原创 2015-09-18 15:03:09 · 2209 阅读 · 0 评论 -
sae上使用jieba
sae上使用jieba会有一点修改的地方,请浏览全文查看。下载jiebahttps://github.com/fxsjy/jieba手动安装拷贝jieba目录到sae的目录中。测试第一次测试时会出现一点错误修改jieba只需稍作修改,修改jieba目录的 __原创 2014-12-24 16:56:55 · 948 阅读 · 0 评论 -
Python 程序在cmd执行的import问题解决
转自:http://inexus.iteye.com/blog/1652613建成工程的python程序,经常启动函数在某一个模块下,一旦其中有引用本模块以外的情况,就会报错说某某模块找不到:有两种方式可以解决环境变量的问题:一种是cmd命令执行前加上:Cmd代码 SET PYTHONPATH=. py转载 2014-07-10 16:11:52 · 4496 阅读 · 0 评论 -
【python系列】python画报表(Chartkick、Flask)(附中文乱码解决方案)
chartkick 可以画原创 2014-06-26 18:17:49 · 6845 阅读 · 1 评论 -
【python系列】dict、list的中文显示
代码#coding: utf-8import jsonclass CCode: def str(self,content): # 只支持json格式 # indent 表示缩进空格数 return json.dumps(content, encoding='utf-8', ensure_ascii=False, indent=4)原创 2014-06-27 12:43:15 · 7344 阅读 · 0 评论 -
【python系列】使用 BeautifulSoup 获取 meta 信息
soup.findAll(attrs={"name":"description"})参考资料原创 2014-06-24 18:04:09 · 13954 阅读 · 0 评论 -
【python系列】python设置代理
有时需要代理来访问外网,windows原创 2014-06-24 16:47:11 · 4046 阅读 · 0 评论 -
【python系列】mysqldb模块操作数据库
简单介绍mysql是一个优秀的开源数据库,它现在的应用非常的广泛,因此很有必要简单的介绍一下用python操作mysql数据库的方法。python操作数 据库需要安装一个第三方的模块,在http://mysql-python.sourceforge.net/有下载和文档。代码#-*- encoding: gb2312 -*-import os, sys, stringimp转载 2014-03-18 20:23:53 · 1072 阅读 · 0 评论 -
【机器学习系列】kNN(k近邻算法)的python实现
模型代码模型文件命名为kNN.py#coding:utf-8from numpy import *import operatordef createDataSet(): group=array([[1.0,1.1],[1.0,1.0],[0,0],[0,0.1]]) labels=['A','A','B','B'] return group,labels原创 2014-03-17 15:49:10 · 2077 阅读 · 0 评论 -
【python系列】python 遍历文件夹和文件
python 遍历文件夹和文件import osimport os.pathrootdir = “d:\data” # 指明被遍历的文件夹for parent,dirnames,filenames in os.walk(rootdir): #三个参数:分别返回1.父目录 2.所有文件夹名字转载 2014-02-23 19:18:38 · 1236 阅读 · 0 评论 -
【python系列】Python 字符串操作(string替换、删除、截取、复制、连接、比较、查找、包含、大小写转换、分割等)
s.strip() .lstrip() .rstrip(',') 去空格及特殊符号复制字符串Python1#strcpy(sStr1,sStr2)2sStr1 = 'strcpy'3sStr2 = sStr14sStr1 = 'st转载 2014-01-14 09:46:56 · 1165 阅读 · 0 评论 -
【python系列】Python启动外部程序,以及进程间交互
1、os.systemos.system(cmd)直接执行系统支持的命令,相当于Windows的bat、Linux的shell环境执行cmd命令,需要注意的是当前工作路径。会等待外部命令执行完了再返回2、subprocessps = subprocess.Popen(cmd)ps.wait()可以决定是否等待外部程序执行完毕3、w转载 2014-01-13 09:31:05 · 4134 阅读 · 0 评论 -
【python系列】python中的可变参数
刚学用Python的时候,特别是看一些库的源码时,经常会看到func(*args, **kwargs)这样的函数定义,这个*和**让人有点费解。其实只要把函数参数定义搞清楚了,就不难理解了。先说说函数定义,我们都知道,下面的代码定义了一个函数funcAdef funcA(): pass 显然,函数funcA没有参数(同时啥也不干:D)。下面这个函数fun转载 2014-01-10 18:45:48 · 912 阅读 · 0 评论 -
【python系列】列表list的操作讲解
列表list在python中作用很强在,列表可以包含不同类型的数据对像,同时它是一个有序的集合。所有序列能用到的标准操作方法,列表也都可以使用。比如切片、索引等,python的列表是可变数据类型,它支持添加、修改、删除等操作。创建一个新列表可以把列表list理解为任意对像的序列,只要把需要的参数值放入到中括号[ ]里面就可以了,就像下面这样操作: names = ['ad转载 2014-01-09 09:32:26 · 1008 阅读 · 0 评论 -
【python系列】datetime时间格式化
获取当前时间,并通过字符串输出。格式为:%Y-%m-%d %H:%M:%S'datetime.datetime.now().strftime('%Y-%m-%d %H:%M:%S' )获取当前时间,但只保留日期datetime.datetime.now().date()将字符串转换为datetime类型输入字符串格式为:'%Y-%m-%d'原创 2014-01-08 12:27:15 · 2411 阅读 · 0 评论 -
【python系列】python编程中几个实用的技巧
1)在作比较时你可以这样写: 3.143.14 and pi2)Int类型不会在超过31bit或32bit后溢出,它们会变成long型。在python里,long并非就是64位,他就是"长"类型,(python的长类型可以容纳数万位大的整数),效率会降低一点。在python 3000中,甚至连int与long的区别都没有了。3)默认值只会在编译时被赋值一次,而非运行时。试试这个转载 2014-01-07 12:50:20 · 924 阅读 · 0 评论 -
【python系列】字典的浅拷贝和深拷贝
第一种(使用‘=’直接赋值)是浅拷贝第二种(使用函数 copy())是深拷贝python 中有两种方式可以实现将一个变量的值传递给另一个变量。一种是使用‘=’直接赋值。另一种是使用函数 copy();例如:>>> d = {'a':'a','b':'b'}>>> e = d.copy()>>> f = d>>> print e,f{'a':'a','b':'转载 2014-01-06 14:16:32 · 1498 阅读 · 0 评论 -
【python系列】使用正则表达式去除HTML字符串
关键代码见标红部分# -*- coding: utf-8-*-import re##过滤HTML中的标签#将HTML中标签等信息去掉#@param htmlstr HTML字符串.def filter_tags(htmlstr):#先过滤CDATA re_cdata=re.compile('//]*//\]\]>',re.I) #匹配CDATA re_scrip转载 2013-12-30 10:30:50 · 2549 阅读 · 0 评论 -
【python系列】set类型的操作
[python] view plaincopypython的set和其他语言类似, 是一个无序不重复元素集, 基本功能包括关系测试和消除重复元素. 集合对象还支持union(联合), intersection(交), difference(差)和sysmmetric difference(对称差集)等数学运算. sets 支持 x in set, le转载 2014-01-03 10:24:32 · 895 阅读 · 0 评论 -
【python系列】python sorted函数
我们需要对List进行排序,Python提供了两个方法对给定的List L进行排序,方法1.用List的成员函数sort进行排序方法2.用built-in函数sorted进行排序(从2.4开始)--------------------------------sorted--------------------------------------->>> help(sorte转载 2014-02-25 11:14:44 · 1050 阅读 · 0 评论 -
【python系列】Python常用数学函数整理
函数说明abs(number)返回数字的绝对值,如abs(-10) 返回 10pow(x,y[,z])返回x的y次幂(所得结果对z取模),如pow(2,3)返回8,pow(2,3,3) 返回2cmath.sqrt(number)返回数字的平方根,数字可以为负数,返回类型为实数,如cmath.sqrt(4)返回 2+0jfloat(object)转载 2014-02-17 17:05:27 · 2728 阅读 · 0 评论 -
【机器学习系列】EM算法求解三硬币问题(python版本)
三硬币模型 假设有3枚硬币,分别记作A,B,C。这些硬币正面出现的概率分别为π,p和q。投币实验如下,先投A,如果A是正面,即A=1,那么选择投B;A=0,投C。最后,如果B或者C是正面,那么y=1;是反面,那么y=0;独立重复n次试验(n=10),观测结果如下:1,1,0,1,0,0,1,0,1,1假设只能观测到投掷硬币的结果,不能观测投掷硬币的过程。问如何估计三硬币正面出现的概率,即π,p和原创 2014-02-26 18:54:47 · 5413 阅读 · 0 评论 -
【python系列】python给函数传值的奇葩方法
python中万物皆对象,函数也是对象,因此可以在A函数中给B函数(函数也是个对象)里面的成员赋值,尽管这个成员没有在B函数中声明或定义。传值方法如下:#coding:utf-8def fun1(): print fun1.x print fun1.ydef fun2(): fun1.x=1 fun1.y=2 fun1.z=3原创 2014-03-18 09:36:54 · 1226 阅读 · 0 评论 -
【python系列】使用pickle进行数据的序列和反序列化
pickle模块简单介绍python的pickle模块实现了基本的数据序列和反序列化。通过pickle模块的序列化操作我们能够将程序中运行的对象信息保存到文件中去,永久存储;通过pickle模块的反序列化操作,我们能够从文件中创建上一次程序保存的对象。 基本接口 pickle.dump(obj, file, [,protocol]) 注解:将对象obj保存到文件f原创 2014-03-18 10:28:54 · 1902 阅读 · 0 评论