ubuntu IDEA15安装

UbuntuIdea 15安装、破解、创建快捷方式 http://www.cnblogs.com/Lyush/p/4114971.html 1.安装包      jdk1.7.0_71下载地址:http://www.oracle.com/technetwork/java/javase/dow...

2016-11-21 10:39:25

阅读数 588

评论数 0

使用IDEA/Ipython来编写python代码

python programming using IDEA or Ipython python机器学习常用package: Numpy Scipy scikit-learn: is a Python module for machine learning built on top of...

2016-11-18 14:31:29

阅读数 3057

评论数 0

Jupyter

原来是ipyhon 最新Jupyter 官网:http://jupyter.org/ 安装:http://jupyter.readthedocs.io/en/latest/install.html 安装说明: We recommend using the Ana...

2016-11-18 14:29:34

阅读数 657

评论数 0

python程序打包

在python程序中,一个.py文件被当作一个模块,在各个模块中定义了不同的函数。当我们要使用某一个模块中的某一个函数时,首先须将这个模块导入,否则就会出现函数未定义的情况. (1) python文件, test.py: def testFunc(): print("...

2016-11-18 14:28:39

阅读数 540

评论数 0

Sk-learn及算法笔记

查看所有的API: http://scikit-learn.org/stable/modules/classes.html XGBoost的python API中提供了sklearn版本的API: https://xgboost.readthedocs.io/en/latest/python...

2016-11-18 14:27:38

阅读数 2927

评论数 0

numpy scipy pandas sk-learn gensim

Numpy Scipy 矩阵向量处理。 Numpy provides a high-performance multidimensional array and basic tools to compute with and manipulate these arrays.  ...

2016-11-18 14:26:31

阅读数 834

评论数 0

Anaconda笔记

Anaconda 会自动安装python需要的包。install及uninstall参考下面的链接: https://docs.continuum.io/anaconda/install#linux-install (1) 下载按住文件: In your browser down...

2016-11-18 14:24:33

阅读数 508

评论数 0

局部敏感哈希LSH

参考资料: 简单介绍:http://www.cnblogs.com/maybe2030/p/4953039.html 在茫茫人海中发现相似的你——局部敏感哈希(LSH): http://www.cnblogs.com/fengfenggirl/p/lsh.html 基本思想...

2016-11-18 11:34:26

阅读数 331

评论数 0

Glove笔记

论文出处: http://nlp.stanford.edu/projects/glove/ 下面准备测试的是python实现版本: github地址:https://github.com/maciejkula/glove-python 安装: sudo...

2016-11-18 11:33:01

阅读数 3794

评论数 0

语音识别

语音识别没有动手做过,在这里记录一些预先需要了解的知识: GMM算法: http://www.cnblogs.com/mindpuzzle/archive/2013/04/24/3036447.html 语音识别常用到GMM算法。 1.单高斯模型       如题,就是单个高斯分...

2016-11-18 11:32:05

阅读数 2394

评论数 1

word2vec笔记

word2vec原始版本应用可以参考博文:http://blog.csdn.net/jj12345jj198999/article/details/11069485 在linux上安装使用的步骤大概是:下载源码,make,执行如下命令进行训练: ./word2vec -train re...

2016-11-18 11:22:33

阅读数 2229

评论数 0

分词算法笔记

分词模型通常有三种: 基于词典的匹配(trie树,最大匹配法),HMM,CRF 查字典的办法最早被提出,就是:把句子从左向右扫描一遍,遇到词典(trie树形式存储)里有的词就标识出来,遇到复合词就找最长的词匹配,遇到不认识的词就分割成单字词。 下面使用的是python结巴分词:...

2016-11-18 11:21:12

阅读数 3129

评论数 0

参数服务器笔记

主要用于对分布式机器学习算法/深度学习算法参数优化。 简介:http://sanwen8.cn/p/174rUaE.html 原理介绍:http://blog.csdn.net/cyh_24/article/details/50545780 李沐和陈天奇等...

2016-11-18 11:18:44

阅读数 1495

评论数 0

Kaggle笔记

kaggle比赛:https://www.kaggle.com/competitions 在这里可以看到一些机器学习中数据分析的问题,同时在kernels中可以看到哪些技术能够比较好的解决对应的 经验贴:https://zhuanlan.zhihu.com/p/22266330 预测...

2016-11-18 11:17:53

阅读数 704

评论数 0

Hyperopt

hyper parameter 调参框架: optunity:http://optunity.readthedocs.io/en/latest/index.html Hyperopt Hyperopt是一个python库,结合MongoDB可以进行分布式调参,快速找到相对较优的参数。...

2016-11-18 11:16:28

阅读数 2089

评论数 0

AutoMl

Do we Need Hundreds of Classifiers to Solve Real World Classification Problems? http://www.jmlr.org/papers/volume15/delgado14a/delgado14a.pdf autoML...

2016-11-18 11:14:55

阅读数 3598

评论数 0

xgboost and xgboost4j

XGBoost Scalable, Portable and Distributed Gradient Boosting (GBDT, GBRT or GBM) Library, for Python, R, Java, Scala, C++ and more. Runs on single...

2016-11-18 11:14:03

阅读数 12222

评论数 2

OLAP

OLAP又是什么鬼?参考:数据挖掘与数据统计、OLAP之间不同之处是什么?     大数据的OLAP技术 OLAP(On-line Analytical Processing,联机分析处理)是在基于数据仓库多维模型的基础上实现的面向分析的各类操作的集合。说人话就是我们的交易数据包含很多信息(...

2016-11-18 11:12:03

阅读数 424

评论数 0

知识图谱笔记

资料: https://github.com/memect/kg-beijing (北京知识图谱学习小组) http://www.china-cloud.com/zhongyunxy/20140612_38070.html(王昊奋:大规模知识图谱技术) http://www.36dsj.co...

2016-11-18 11:11:01

阅读数 2467

评论数 0

Neo4j笔记

在构建知识图谱的时候,Neo4j用来建立实体之间的关系非常方便,下面简单介绍一下它的使用方法: 开发者教程:http://neo4j.com/docs/developer-manual/3.0/ (Cypher clauses:4.2. Patterns in Practice) 安装: ...

2016-11-18 11:08:08

阅读数 3466

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭