- 博客(37)
- 收藏
- 关注
原创 python文件读写总结
0. python 读取excel__author__ = 'HM'#Use the excellent xlrd package, which works on any platform. That means you can read Excel files from Python in Linux! Example usage:#Open the workbookimport
2015-11-14 15:58:34 932
原创 windows下安装系统或者重要程序总结
1. 老毛桃重新安装win http://www.laomaotao.net/help/2013/0930/2194.html注意:最后的时候(重启),将电脑关闭,把u盘拔下来,否则安装失败~!2. python+PyQT+Eric安装配置http://www.2cto.com/kf/201110/106640.html3.
2015-11-14 15:50:36 479
转载 推荐系统入门(协同过滤 基于内容 基于用户 基于项目 )
http://blog.163.com/lnhenrylee@126/blog/static/2414832520123269713813/
2013-12-12 09:15:02 1183
转载 feature selection (互信息 去掉和类标签无关特征 + PCA)
http://www.cnblogs.com/jerrylead/archive/2011/04/18/2020209.html 真实的训练数据总是存在各种各样的问题:1、[冗余] 比如拿到一个汽车的样本,里面既有以“千米/每小时”度量的最大速度特征,也有“英里/小时”的最大速度特征,显然这两个特征有一个多余。2、 [冗余] 拿到一个数学系的本科生期末考试成绩单,里面有三列
2013-12-02 21:09:38 1544
原创 naive bayesian classifier
__author__ = 'HM'f = open('data.txt','r')first_line = f.readline().split()attributes = first_line[:-1]attr_len = len(attributes)classname = first_line[-1]data_set_raw = []class_label_pool = se
2013-11-30 19:08:19 726
原创 decison tree
__author__ = 'HM'from treelib import *class innerNode(Node): def __init__(self,attribute,parent_node_assert,identifier=None, expanded=True): self.parent_node_assert = parent_node_assert
2013-11-29 21:08:34 755
转载 python 优化
介绍:http://blog.csdn.net/lanphaday/article/category/328657实践:http://blog.csdn.net/gzlaiyonghao/article/details/1502290简而言之: import cProfile,pstats cProfile.run("main()","G:\\asta
2013-11-25 19:46:54 836
原创 heap in python
from heapq import heappop,heappusha = [1,3,5,7,2,34,0,2]heap = []for i in a: heappush(heap,i)for x in range(len(a)): print heappop(heap)
2013-11-25 19:31:53 721
转载 Python特殊语法:filter、map、reduce、lambda
http://hi.baidu.com/black/item/307001d18715fc322a35c747Python内置了一些非常有趣但非常有用的函数,充分体现了Python的语言魅力!filter(function, sequence):对sequence中的item依次执行function(item),将执行结果为True的item组成一个List/String/Tuple(取决
2013-11-14 16:23:33 427
原创 python 点滴
1.比较set中的内容(fp-growth实现时)a = set(['338','337'])b = [set(['337','338']),set(['339' ,'340'])]if a in b: print 'yes'else: print 'no'
2013-11-13 19:27:25 517
原创 python related web
如果官方没有64-bit的包的话:http://www.lfd.uci.edu/~gohlke/pythonlibs/
2013-11-09 19:37:58 467
原创 call external .exe in python
simple way:import ospathname = "Untitled1.exe"os.system(pathname)with parameter
2013-11-07 11:09:57 671
原创 python 新建文件夹
import ospathname = r'G:\work\2.purchaseInterest\data'if not os.path.isdir(pathname): os.mkdir(pathname)for i in range(10): subname = pathname+'\\'+"u%d"%i if not os.path.isdir(subname
2013-10-31 16:12:16 1180
原创 生成组合、排列数
import itertoolsfor i in range(1,4): for e in itertools.combinations('abc',i): print(e),
2013-10-31 10:43:44 717
转载 python中的uuid
http://www.douban.com/note/69073375/概述: UUID是128位的全局唯一标识符,通常由32字节的字符串表示。 它可以保证时间和空间的唯一性,也称为GUID,全称为: UUID —— Universally Unique IDentifier Python 中叫 UUID GUID —
2013-10-31 10:20:56 638
原创 generate prompt
level = 1num = 70if level==1: a = ' '*(level-1)*4+'#'+'-'*(num-1)else: a = ' '*(level-1)*4+'#'+'-'*(num-1)content = "Specify the input and output "b = ' '*(level-1)*4+'#'+' '*20+content+'
2013-10-31 10:04:46 609
转载 Python中的easy_install
http://hi.baidu.com/thinkinginlamp/item/69cab949518d9aea1e19bcc1如果想使用easy_install工具,可能需要先安装setuptools,不过更酷的方法是使用ez_setup.py脚本:wget -q http://peak.telecommunity.com/dist/ez_setup.pypython ez_se
2013-10-30 20:57:53 812
转载 .py to .exe (by py2exe)
http://blog.sina.com.cn/s/blog_8811d2380101azrr.html三、py2exe的用法如果你有一个名为helloworld.py的python脚本,你想把它转换为运行在windows上的可执行程序,并运行在没有安装python的windows系统上(这个是重点),那么首先你应写一个用于发布程序的设置脚本例如mysetup.py(该文件最好放置在你
2013-10-30 20:54:43 760
原创 fp_growth
import collectionsmin_support = 3def sp(s): return [a for a in s]#=====================================================================# main funtnion
2013-10-26 16:01:00 694
原创 basic apriori method
#=====================================================================# data and parameters |#=========================================================
2013-10-22 20:42:10 618
转载 每天拿出来2小时浪费(文/王路) 作者: 王路
每天拿出来2小时浪费(文/王路) 作者: 王路前文略说了精进的主旨,此文再详说精进的要义。前文是精进的第一义,此文是精进的第二义。 上回提到王阳明讲“杀人须就咽喉上着刀”,我想到《黑道风云二十年》里说,打群架时,最不怕对手拿砍刀,最怕对手拿匕首。砍刀虽然大,只是唬人的,不伤及要害,全身砍上十几二十刀,住院十天半月就没事了,而拿匕首的人是真的想拼命的,一枪刺下去,就能要人
2013-09-07 16:44:52 1456
转载 python中 class 或对象属性转化成dict 、dict转换成对象
http://blog.csdn.net/chenyulancn/article/details/8203763
2013-09-07 10:22:40 972
原创 稍微复杂的分类器(加入了Normalization)
class Classifier: def __init__(self, filename): self.data = [] self.getData(filename) self.dimension = 2 self.medians = [] self.asds = [] self.norma
2013-08-15 15:49:11 622
原创 最简单的分类器(nearest neighbor )
原理:先计算出与物品最近的物品(用manhattan距离),然后以最相似物品的评分来估计现在的。users = {"Angelica": {"Dr Dog/Fate": "L", "Phoenix/Lisztomania": "L", "Heartless Bastards/Out at Sea": "D",
2013-08-15 09:24:17 984
原创 Weighted Slope One (python实现)
chapter 3 (collabative filtering ) of 《guide to db》slope one 算法比较简单:1.先构造 collection of deviation(average deviation) 2.weighted slope one ,已经打分的项+该项的
2013-08-14 15:57:57 1188
转载 python 字典的get方法
get()方法。 字典可以直接用a[b]的方式访问字典项,但如果b不存在时,会报异常。为了避免这种情况,可以使用get()方法来访问字典项,a.get(b)当b存在时,结果和a[b]一样,如果b不存在,不会报异常,而是返回None。除此之外,get()方法还可以设置第二个参数,如果b不存在,可以将第二个参数做为默认值返回。==================================
2013-08-14 15:01:35 1497
转载 Python - 列表、字典和元组的排序
地址: http://sjolzy.cn/Python-lists-dictionaries-and-tuples-of-the-sort.htmlPython有几个内建的排序函数能实现排序。1. list列表排序对于Python的列表list进行排序,可以使用内建的sort函数。>>> s=[2,1,3,0]>>> s.sort()[0, 1, 2,
2013-08-13 11:24:35 791
原创 Pearson+Cosine Similarity+K-Nearest Neighbor 代码
这本书比较简单,适合做推荐系统入门级读物。作者写的很仔细,一些复杂的公式都拆开讲。这是他的网站:http://guidetodatamining.com/一、通过用户的相似度(最相似用户)进行推荐。主要有三种方式:1.距离 2.pearson 3.cosine原理就不说了,书中都有,很简单。主要贴下代码: 1 recommend by distancefrom
2013-08-12 15:24:59 1180
转载 LDA 【介绍】※※※
转自http://blog.csdn.net/huagong_adu/article/details/7937616 主题模型有两种:pLSA(ProbabilisticLatent Semantic Analysis)和LDA(Latent Dirichlet Allocation),下面主要介绍LDA。(二)LDA介绍 如何生成M份包含N个单词的文档,
2013-01-27 17:20:42 584
转载 主题模型是什么、工作原理【基础概念】※※※※※
转自:http://blog.sina.com.cn/s/blog_9d7bca9f01015580.html摘要:两篇文档是否相关往往不只决定于字面上的词语重复,还取决于文字背后的语义关联。对语义关联的挖掘,可以让我们的搜索更加智能化。本文着重介绍了一个语义挖掘的利器:主题模型。主题模型是对文字隐含主题进行建模的方法。它克服了传统信息检索中文档相似度计算方法的缺点,并且能够在
2013-01-27 11:35:00 769
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人