排序:
默认
按更新时间
按访问量

python pip及conda指南

最近做实验,换了新环境。OSX + Pycharm + Anaconda2 之前在Ubuntu上都是直接在终端中使用pip安装相关的包。但是在OSX中却会遇到一些坑。同时Anaconda2本身自带了很多有用的包,加上conda的包管理,总体来说比pip优秀一些。但是conda安装也会有些坑,这里...

2018-04-19 23:23:56

阅读数:38

评论数:0

机器学习-逻辑回归模型公式推导

LR介绍 Logistic Regression 是一种非线性的回归模型,同时也可以使用逻辑回归模型来作分类任务。 Logistic Regression回归模型使用的Sigmoid函数作为假设模型。 hθ(x)=11+e−xhθ(x)=11+e−x h_{\theta}(x) = \fra...

2018-03-25 20:51:14

阅读数:85

评论数:0

机器学习-聚类(K-Means)

K-Means原理初探 传统K-Means算法流程 K-Means初始化优化K-Means++ 在上节我们提到,k个初始化的质心的位置选择对最后的聚类结果和运行时间都有很大的影响,因此需要选择合适的k个质心。如果仅仅是完全随机的选择,有可能导致算法收敛很慢。K-Means++算法就是对K-Me...

2018-03-25 19:20:21

阅读数:41

评论数:0

神经网络推导

BP神经网络算法(单变量版本) 网络结构定义 输入变量XmXmX_m,其中m=1,2,3,...,Ninputm=1,2,3,...,Ninputm=1,2,3,...,N_{input} 要预测的变量tmtmt_m,其中m=1,2,3,...,Ninputm=1,2,3,...,Ninp...

2018-03-04 18:57:49

阅读数:96

评论数:0

python数据分析代码优化小结

过去一段时间在对python版本的评分卡模型做效率优化。之前的版本已经实现了所有功能但是速度实在太慢。13W的数据量包含130个特征(其中30个连续值)使用原来的版本需要花费将近两小时的时间才能够计算出所有特征值的IV。这个效率实在是。。。。 经过优化,现在可以将时间控制在5s左右。可以说是相当...

2018-01-06 17:32:49

阅读数:141

评论数:0

医疗影像数据预处理-nrrd

Nrrd文件简单预处理

2017-12-25 22:19:28

阅读数:1006

评论数:0

VIM剪贴板使用指南

VIM剪贴板使用智囊

2017-12-22 23:04:37

阅读数:71

评论数:0

word2vec的使用(未完成)

最近希望使用TextCNN来进行文本分类,还以为很简单。然后去github clone了两个项目。想着先用gensim.word2vec就可以获得很好的效果。结果发现下载下来的代码都是使用google word2vec。gensim.word2vec是基于google word2vec写的,但是g...

2017-09-14 20:15:30

阅读数:348

评论数:0

解决matplotlib中文乱码问题(Ubuntu16.04)

网上教程很多,但是折腾了好久才弄好。特此记录一下。

2017-09-06 22:59:30

阅读数:2508

评论数:0

机器学习-聚类(K-Means)

K-Means算法是无监督的聚类算法,它实现起来比较简单,聚类效果也不错,因此应用很广泛。K-Means算法有大量的变体,本文就从最传统的K-Means算法讲起,在其基础上讲述K-Means的优化变体方法。包括初始化优化K-Means++, 距离计算优化elkan K-Means算法和大数据情况下...

2017-08-08 19:40:48

阅读数:235

评论数:0

Caffe(CPU)-Ubuntu16.04下安装教程(未完成)

由于需要使用深度学习做一些实验,所以需要安装Caffe。 这里主要介绍安装pycaffe 而自己电脑的比较老旧,GPU无法使用。所以需要安装Caffe(CPU)版本。 这里主要记录主要步骤和遇到的一些坑。 由于仅仅安装CPU版本,所以跳过GPU版本的安装。 安装所需要的依赖包 在r...

2017-08-08 11:36:30

阅读数:138

评论数:0

Spark-大数据处理框架的安装

Spark安装教程

2017-06-28 11:13:59

阅读数:289

评论数:0

Hadoop分布式集群搭建

Hadoop分布式集群搭建

2017-06-26 23:41:56

阅读数:327

评论数:0

ZeroTier-全网畅连

小伙伴们是不是有时候想在宿舍远程ping自己实验室的主机但是发现网段不对没法ping通? 按照最近想搭建Hadoop分布式集群,可是自己的主机就一台,那怎么搭建分布式集群呢? 对了,实验室有不少主机,完全可以用实验室的主机来搭建Hadoop分布式集群嘛。 想法很好,可是如何进行网络连接却成了...

2017-06-25 23:40:30

阅读数:6597

评论数:2

Sklearn源码学习入门

sklearn源码学习入门(不定期更新)

2017-05-30 23:30:45

阅读数:2060

评论数:0

Ubuntu下安装PySpark

1、PySpark的按照 2、Ipython notebook中使用PySpark

2017-04-16 00:21:41

阅读数:4479

评论数:2

Pandas学习笔记(不定期更新)

Pandas学习笔记同时记录一些小坑

2017-04-09 23:06:37

阅读数:1282

评论数:0

Scikit-learn(python)学习笔记 (不定期更新)

Sckkit-learn学习笔记

2017-04-08 00:28:30

阅读数:536

评论数:0

《统计学习方法》学习总结(未完待续)

统计学习方法的三要素:模型(model)、策略(strategy)、算法(algorithm). 生成模型和判别模型分类 生成模型:可以还原出联合概率分布P(X,Y),学习收敛速度更快,存在隐变量时还是可以使用。 朴素贝叶斯分类法 隐马尔可夫模型 判别模型:直接学习条件概率P(X|Y)或决策函...

2017-03-02 00:12:23

阅读数:248

评论数:0

Linux-硬件检查常用代码

硬件检查常用代码

2017-03-01 22:51:50

阅读数:197

评论数:0

提示
确定要删除当前文章?
取消 删除
关闭
关闭