关闭
当前搜索:

结巴分词使用方法

0.下载      结巴分词包下载地址:http://download.csdn.net/detail/robin_xu_shuai/9691188 1.安装      将其解压到任意目录下,然后打开命令行进入该目录执行:python setup.py install 进行安装 2.测试       安装完成后,进入python交互环境,import jieba 如果没有报错,则...
阅读(5469) 评论(8)

python使用pymongo连接mongo数据库

0.本文讲述的环境是linux + python3.x + pymongo3.x 1.pymongo的安装:     (1)pymongo下载地址:http://download.csdn.net/detail/robin_xu_shuai/9687530,下载下来的文件如下图所示:pymongo-3.3.0.tar.gz      (2)使用命令tar解压:tar zxf...
阅读(1638) 评论(0)

个性化推荐算法和二部图-论文学习

本文为学习论文《Bipartite network projection and personal recommendation》的简要备忘笔记。 0,一般来说,一个推荐系统由用户user和商品object组成,每一个用户会选择一些商品,记商品集合和用户集合分别如下:  ,    如果用户仅仅选择商品而不对其进行评价。那么推荐系统可以完全由一个n×m的邻接矩阵表示,其中如果用户ui选择过了商...
阅读(2491) 评论(0)

机器学习之线性回归-AndrewNg学习笔记

监督学习 从讨论监督学习问题的例子出发,假设我们有某个地区住房面积和相应房价的数据集合。对于这样的给定的数据, 我们的目的是要利用已有的信息,来对房价建立预测模型。即对于给定的房屋信息(房屋面积)预测其房价。 为了方便以后的使用,我们首先定义一些符号标记。我们使用x(i)表示输入变量(或者是特征),使用y(i)表示我们将要预测的输出变量或者说是目标变量(或者叫做标记)。(x(i), y(i))...
阅读(962) 评论(0)

二叉树的基本操作

常用的二叉树的链式存储结构有二叉链表和三叉链表来表示,其数据结构的C语言定义以及示意图如下: 本来介绍基于二叉链表的存储结构上的二叉树的几个常用的操作:   1.二叉树的创建,   2.使用递归算法进行二叉树的先序,中序和后序遍历。   3.使用非递归算法进行二叉树的中序遍历(u需要借助于栈)   4.借助于数据结构队列实现二叉树的层序遍历。   5.一些其他的函数,求取叶子节...
阅读(537) 评论(0)

拉格朗日对偶性问题-《统计学习方法》学习笔记

0. 内容介绍         在约束最优化问题中, 常常利用拉个朗日对偶性将原始问题转化为对偶问题,通过解对偶问题而得到原始问题的解,该方法应用在很多的统计学习方法中。例如在上一篇文章中(http://blog.csdn.net/robin_xu_shuai/article/details/52791306)所说的最大熵模型。在学习最大熵模型中我们看到,需要求解满足所有已知条件并且使得熵最大的...
阅读(1039) 评论(0)

逻辑斯谛回归与最大熵模型-《统计学习方法》学习笔记

0. 概述: Logistic回归是统计学中的经典分类方法,最大熵是概率模型学习的一个准则,将其推广到分类问题得到最大熵模型, logistic回归模型与最大熵模型都是对数线性模型。 本文第一部分主要讲什么是logistic(逻辑斯谛)回归模型,以及模型的参数估计,使用的是极大对数似然估计以及梯度下降法,第二部分介绍什么是最大熵模型,首先介绍最大熵原理, 然后根据最大熵原理推...
阅读(4512) 评论(1)

八大排序算法及实现

将一个元素插入到已经排好序的有序表中,从而使得有序表的   个数+1。 算法从第二个元素开始。将一待排序序列第一个元素看做一个有序序列,把第二个元素到最后一个元素当成是未排序序列。  *  *2) 从头到尾依次扫描未排序序列,将扫描到的每个元素插入有序序列的适当位置以使得其变成有序的序列。  *  (如果待插入的元素与有序序列中的某个元素相等,则将待插入元素插入到相等元素的后面。)  *...
阅读(671) 评论(0)

higher-ordering cluster的C语言实现

#include #include #include #include #define INITIAL_SIZE 100 #define INCREMENT_SIZE 100 int vertax_size; int edge_size; char filename_edge[20]; typedef struct Node{ double value; int index; }Node...
阅读(455) 评论(1)

《Higher-order organization of complex networks》-论文学习笔记

0.前言:        最近阅读了Benson等人发表在science上的论文《Higher-order organization of complex networks》,在该论文中作者提出了一种通用的框架,可在网络中基于高阶连接模式进行聚类。 和以往接触的聚类方法(K-means, 层次聚类, DBSCAN, 或者OPRICS)等不同的是: K-means等在对item进行聚类的时候,...
阅读(1013) 评论(4)

C语言进度条

有点无聊的小程序, 但是在以后算大网络时, 可以加进来观看进度。 #include #define MAXSTEP 1000 main(void) { int i, j, progess, prg_temp; progess = prg_temp = 0; for( i = 1; i <= MAXSTEP; ++i ) { progess = (int)((double)i / ...
阅读(382) 评论(0)

通过似然分析预测丢失的边和虚假的边--的C语言代码实现

#include #include #include #include int kc = 12; int training_set_size; int probe_set_size; int vertax_set_size; char training_filename[200]; char probe_filename[200]; char vertax_filename[200]; int...
阅读(418) 评论(0)

通过似然分析预测丢失的边和虚假的边(潘黎明,周涛著)

真实网络中的数据往往是不完全,存在噪音的。这时, 丢失边预测算法和虚假边的识别算法就有了用武之地。在这里提出了一种算法的框架:网络的似然可以通过预先定义好的哈密顿量来计算, 这个哈密顿量的定义考虑了网络形成的一些重要的驱动因素, 这样的话,一条没有被观测到的边的存在的“得分”可以通过计算将这条边加入已经观测到的网络中的似然来表示。 对于丢失边的预测问题,其目的是要根据已有的网路的拓扑结构和节点的...
阅读(868) 评论(0)

找出无向图中所有的环的算法

本文给出了一个找到无向图中所有的环的递归算法,该算法是基于DFS(深度优先搜索)的,大概的思路是:在深度优先搜索无向图的过程中,当遇到起始点的时候,会认定为出现环(在本文中只是找出了无向图中所有的长度大于等于3的环(长度为1和2的环没有意思),所以在深搜的过程中,当遇到的是起始点的时候,还需要进行判断是否是环),当确定是出现了环之后,根据是否在遇到环之前的那个点还有其他的路径,来决定是进一步的进行...
阅读(4506) 评论(5)

OPTICS算法的C语言实现

在这个方法中,不像前面的相关的聚类的文章中产生数据集合的聚类结果,而是产生一个基于密度的表示数据的固有的聚类结构的一个增广的排序,除了应用到DBSCAN中的相关的概念(核心对象, 直接密度可达,密度可达,和密度相连),有增加了两个概念, 一个是核心距离:即使得一个object满足称为核心对象的最小的距离(即,在用户输入的ε和MinPtr的情况下成为核心对象的最小的距离,如果改对象不是在ε和MinP...
阅读(916) 评论(0)
86条 共6页首页 上一页 1 2 3 4 5 ... 下一页 尾页
    个人资料
    • 访问:88313次
    • 积分:1723
    • 等级:
    • 排名:千里之外
    • 原创:86篇
    • 转载:0篇
    • 译文:0篇
    • 评论:51条
    最新评论