python
guoguo_dreamfly
这个作者很懒,什么都没留下…
展开
-
windows 安装python的scipy库,报错error: no lapack/blas resources found
如果使用pip install 包名安装出错如下错误,可以尝试使用如下的库链接下载 .whl 文件,再使用pip install whl的路径进行离线安装。C:\Users\xxx>easy_install scipySearching for scipyReading https://pypi.python.org/simple/scipy/Best match: scipy 0.1原创 2016-02-19 13:15:39 · 7466 阅读 · 0 评论 -
决策树个人理解
"""香农熵: 在信息论中,熵是接收的每条消息中包含的信息的平均量,又被称为信息熵、信源熵、平均自信息量。这里, 消息代表来自分布或数据流中的事件、样本或特征。 (熵最好理解为不确定性的量度而不是确定性的量度,因为越随机的信源的熵越大。) 决策树: 1、计算当前的信息熵HB,计算每个特征的信息熵的期望Hi,选择能使HB-Hi最大的那个 特征作为这次的分类特征。(能否理原创 2016-03-13 20:14:22 · 1124 阅读 · 1 评论 -
解决matplotlib中文乱码问题
解决中文乱码问题import matplotlib.font_manager as fmmyfont = fm.FontProperties(fname='C:/Windows/Fonts/msyh.ttc')import matplotlib.pyplot as pltplt.clf() # 清空画布plt.plot([1, 2, 3], [4, 5, 6])plt.转载 2016-03-11 10:36:09 · 803 阅读 · 0 评论 -
朴素贝叶斯实践
朴素贝叶斯实践文本分类问题定义如果一个已经知道的文本分类数据,文本为Ti,文本的类别为ci。如果给你一个新的文本,问NT更可能属于某个类别。1、首先我们需要将文本抽象出来,如果要比较文本那要一个统一的标准,而这个标准如何选取呢?我们可以统计所有单词,得到一个词典。2、给词典的每个单词给一个索引,每个索引下存储的值来表示该单词是否出现了,或者说是出现了几次。3、对于每个文本,初始化一个单词向量,根据文原创 2016-03-21 20:06:19 · 1257 阅读 · 0 评论 -
朴素贝叶斯
基于概率论的分类方法:朴素贝叶斯背景贝叶斯理论和贝叶斯概率以托马斯·贝叶斯(1702-1761)命名,他证明了现在称为贝叶斯定理的一个特例。术语贝叶斯却是在1950年左右开始使用,很难说贝叶斯本人是否会支持这个以他命名的概率非常广义的解释。拉普拉斯证明了贝叶斯定理的一个更普遍的版本,并将之用于解决天体力学、医学统计中的问题,在有些情况下,甚至用于法理学。但是拉普拉斯并不认为该定理对于概率论很重要。他原创 2016-03-21 11:10:51 · 655 阅读 · 0 评论 -
谱聚类的理解
感谢: https://www.zybuluo.com/frank-shaw/note/117235 A tutorial on spectral clustering,Ulrike von Luxburg, 2007背景: 聚类是数据分析的常用技术,人们为了获得对数据的第一印象,尝试着去辨别每一组的行为相似性。谱聚类是聚类转载 2016-03-15 17:16:28 · 3089 阅读 · 0 评论 -
apriori和关联规则算法
问题的背景: 超市的会员卡记录了大量的用户购买数据,通过分析这些数据可以帮助商店分析用户的购买行为。从大规模数据集中寻找物品间的隐含关系被称为关联规则分析(association analysis)或关联规则学习(association rule learning)。举个例子说就是发现用户购买了一件商品(如帽子)后,会购买另一件商品(如围巾)的概率。关联规则分析需要从大规模的商品数据中,原创 2016-02-21 10:32:48 · 5621 阅读 · 1 评论 -
KNN算法
"""K最近邻算法kNN算法的核心思想是:存在一个样本数据集合,也称作训练样本集合,并且样本集中每个数据都存在标签,即我们知道样本集中每一个数据与所属分类的对应关系。输入没有标签的新数据后,将新数据的每个特征与样本集中数据对应的特征进行比较,然后算法提取样本集中特征最相似数据(最近邻)的分类标签。一般来说K是不大于20的整数。最后,选择最相似数据中出现次数最多的分类,作为新数据的分类。 优点是:精原创 2016-03-06 16:37:21 · 638 阅读 · 0 评论 -
谱聚类
一、复杂网络中的一些基本概念1、复杂网络的表示 在复杂网络的表示中,复杂网络可以建模成一个图,其中,表示网络中的节点的集合,表示的是连接的集合。在复杂网络中,复杂网络可以是无向图、有向图、加权图或者超图。2、网络簇结构 网络簇结构(network cluster structure)也称为网络社团结构(network community structure),是复杂转载 2016-02-19 15:05:21 · 1829 阅读 · 0 评论 -
决策树实践,参考《机器学习实战》
数据集def createDataSet(): dataSet = [[1, 1, 'yes'], [1, 1, 'yes'], [1, 0, 'no'], [0, 1, 'no'], [0, 1, 'no']] labels = ['no surfacing原创 2016-03-13 21:06:19 · 708 阅读 · 0 评论