- 博客(6)
- 资源 (19)
- 收藏
- 关注
原创 ubuntu下neo4j的安装
环境:ubuntu14.04neo4j-enterprise-1.9.4-unix.tar.gzneo4j-enterprise-2.3.0-M02同样可行单机:1、下载neo4j并解压地址:http://neo4j.com/download/other-releases/wget -O - https://debian.neo4j.org/neote...
2017-10-30 15:05:49 1671
原创 ipython开发工具Jupyter Notebook安装
第一步:安装ipython,安装完成后输入ipython,如下图,输入exit可退出 pip install ipython第二步:安装jupyter pip install jupyter第三步:配置环境,通过远程方式访问jupyter notebook jupyter notebook --generate-config如果出现以下提示,请在之...
2017-10-20 13:48:43 2299
转载 xgboost原理及应用
1.背景 关于xgboost的原理网络上的资源很少,大多数还停留在应用层面,本文通过学习陈天奇博士的PPT地址和xgboost导读和实战地址,希望对xgboost原理进行深入理解。2.xgboost vs gbdt 说到xgboost,不得不说gbdt。了解gbdt(梯度提升树)可以看我这篇文章 地址,gbdt无论在理论推导还是在应用场景实践都是相当完美的,但有一个问题:第n颗树训练时,需...
2017-10-19 16:13:22 3048
转载 机器学习中的各种距离
在做分类时常常需要估算不同样本之间的相似性(Similarity Measurement),这时通常采用的方法就是计算样本间的“距离”(Distance)。采用什么样的方法计算距离是很讲究,甚至关系到分类的正确与否。本文的目的就是对常用的相似性度量作一个总结。本文目录:1. 欧氏距离2. 曼哈顿距离3. 切比雪夫距离4. 闵可夫斯基距离
2017-10-16 15:03:16 394
转载 Neo4j数据库基础
1、Neo4j简介可能很多同学之前没有接触过图数据库,Neo4j就是一个图数据库,首先对Neo4j做一个初步的介绍: Neo4j是一个——面向网络的数据库——基于磁盘的、具备完全的事务特性的Java持久化引擎,但是它将结构化数据存储在网络上而不是表中。网络(从数学角度叫做图)是一个灵活的数据结构,可以应用更加敏捷和快速的开发模式。2、Neo4j基本特点它有以下一些基本特点: 1)、N...
2017-10-10 10:21:40 1146
原创 图形数据库的优势是什么,以Neo4j为例子
最近在抓取一些社交网站的数据,抓下来的数据用MySql存储。问我为什么用MySql,那自然是入门简单,并且我当时只熟悉MySql。可是,随着数据量越来越大,有一个问题始终困扰着我,那就是社交关系的存储。 就以新浪微博举例,一个大V少则十几万,多则几千万的粉丝,这些关注关系要怎么存呢?在MySql中,一条关注关系(大V id,大V的一个粉丝 id)存为一条数据,那么当用户数量上...
2017-10-10 09:51:40 15722
Mushroom Classification--xgboost训练数据
2018-03-02
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人