- 博客(683)
- 资源 (104)
- 收藏
- 关注
原创 Machine Learning - XVII. Large Scale Machine Learning大规模机器学习 (Week 10)
机器学习Machine Learning - Andrew NG courses学习笔记Large Scale Machine Learning大规模机器学习Learning With Large Datasets大数据集学习Stochastic Gradient Descent随机梯度下降Mini-Batch Gradient Descent迷你批处理梯度下降
2015-04-06 19:32:58 8603
原创 推荐系统:参数协同过滤
http://blog.csdn.net/pipisorry/article/details/44850971机器学习Machine Learning - Andrew NG courses学习笔记。Machine Learning - XVI. Recommender Systems 推荐系统(Week 9)相关参考:基于内容的推荐[推荐系统:基于内容的推荐]和基于cosin相似度的非参数协同过
2015-04-03 09:26:10 9261
翻译 Python下的数据处理和机器学习,对数据在线及本地获取、解析、预处理和训练、预测、交叉验证、可视化
在[1]:%matplotlib inline抓取的数据一个简单的HTTP请求在[2]:import requestsprint requests.get("http://example.com").text Example
2015-04-02 16:13:14 3651
原创 todotodo
http://blog.csdn.net/pipisorry/article/details/44801859from:ref:
2015-04-01 09:11:00 2649
原创 Machine Learning - XV. Anomaly Detection异常检测 (Week 9)
机器学习Machine Learning - Andrew NG courses学习笔记Anomaly Detection异常检测Problem Motivation问题的动机Gaussian Distribution高斯分布Algorithm算法Developing and Evaluating an Anomaly Detection S
2015-03-31 19:17:56 5616
原创 python函数: 内置函数
http://blog.csdn.net/pipisorry/article/details/44755423python内置函数Python内置(built-in)函数随着python解释器的运行而创建。在Python的程序中,你可以随时调用这些函数,不需要定义。Built-in Functions abs() dict() help() m...
2015-03-30 19:25:11 6635
原创 Machine Learning - XIV. Dimensionality Reduction降维 (Week 8)
机器学习Machine Learning - Andrew NG courses学习笔记Dimensionality Reduction降维Motivation Data Compression数据压缩Motivation Visualization可视化Principal Component Analysis Problem Formulation主成
2015-03-28 20:08:31 2662
原创 linux命令:常用shell命令及应用
http://blog.csdn.net/pipisorry/article/details/44681081小技巧命令行中直接查看linux shell命令及解释man commandLinux下更好用的帮助命令—cheat#pip install cheat$cheat tar [Linux下更好用的帮助命令—cheat]命令行中复制、粘贴Ubuntu终端窗口中,复制粘贴的快捷键需要加上
2015-03-27 19:40:40 4115
原创 Machine Learning - XIII. Clustering聚类 (Week 8)
机器学习Machine Learning - Andrew NG courses学习笔记Unsupervised Learning_ Introduction非监督学习介绍K-Means Algorithm K-均值算法Optimization ObjectiveRandom InitializationChoosing the Numb
2015-03-27 15:10:21 3401
原创 Git版本控制:Git远程仓库
在github上创建完一个repository或者create a new repository on the command line在本地的某个要使用git版本控制的目录下git init添加excludegit add .Note: 上面就是来自在github上创建完一个repository后的提示。
2015-03-27 09:49:18 8645 1
原创 远程连接及远程控制
http://blog.csdn.net/pipisorry/article/details/44594911本文主要内容为windows和linux(ubuntu)远程服务器的简单配置,及windows和linux(ubuntu)客户端的配置。linux server服务器设置添加一个新用户并设置密码就可以了[linux下添加删除修改用户 ]皮皮bl
2015-03-24 17:22:37 9270
原创 Git版本控制:Git本地仓库
在本地创建repository版本管理的步骤如下:1 安装git2 全局设置3 在本地的某个要使用git版本控制的目录下git init添加excludegit add .在安装Git中,我们已经配置了user.name和user.email,实际上,Git还有很多可配置项。让Git显示颜色这样,Git会适当地显示不同的颜色,比如git status命令,文件名就会标上颜色。配置别名以后提交--global参数是全局参数,也就是这些命令在这台电脑的所有Git仓库下都有用。在撤销修改。
2015-03-24 11:38:54 11024 2
原创 Machine Learning - XII. Support Vector Machines支持向量机(Week 7)
http://blog.csdn.net/pipisorry/article/details/44522881机器学习Machine Learning - Andrew NG courses学习笔记Support Vector Machines支持向量机{学习复杂非线性函数的有力方法}优化目标Optimization Objective逻辑回归SVM的Cost function另一个角度看待单个样...
2015-03-21 21:48:54 3465 1
原创 随机采样和随机选择
http://blog.csdn.net/pipisorry/article/details/44491727离散分布的随机变量的取样问题Question:随机播放音乐(随机数相关,带权重) 假设张三的mp3里有1000首歌,现在希望设计一种随机算法来随机播放。与普通随机模式不同的是,张三希望每首歌被随机到的改了吧是与一首歌的豆瓣评分(0~10分)成正比的,如item0评分...
2015-03-20 15:10:43 3106
原创 Java - Random生成随机数
调用这个Math.Random()函数能够返回带正号的double值,该值大于等于0.0且小于1.0,即取值范围是[0.0,1.0)的左闭右开区间,返回值是一个伪随机选择的数,在该范围内(近似)均匀分布。在定义的时候分别指定了相同的种子之后,在分别用r1和r2去[0,30)的随机数,结果编译执行后悔发现结果都是呈现AABB型的,说明r1和r2取的随机数是一模一样的(下图为实验截图)。:返回下一个伪随机数,它是取自此随机数生成器序列的、呈高斯(“正态”)分布的double值,其平均值是0.0标准差是1.0。
2015-03-18 16:02:38 16093 1
原创 Java - 多线程Callable、Executors、Future
http://blog.csdn.net/pipisorry/article/details/44341579java并发工具类,主要使用的:CountDownLatch、CyclicBarrier、Semaphore、Exchanger。IntroductionCallable接口代表一段可以调用并返回结果的代码;Future接口表示异步任务,是还没有完成的任务给出的未来结...
2015-03-17 14:55:44 1953
翻译 Comprehensive learning path – Data Science in Python深度学习路径-用python进行数据学习
Comprehensive learning path – Data Science in PythonJourney from a Python noob to a Kaggler on PythonSo, you want to become a data scientist or may be you are already one and want to expand yo
2015-03-13 20:42:11 3283
原创 Machine Learning - XI. Machine Learning System Design机器学习系统设计(Week 6)系统评估标准
http://blog.csdn.net/pipisorry/article/details/44119187机器学习Machine Learning - Andrew NG courses学习笔记Machine Learning System Design机器学习系统设计Prioritizing What to Work On优先考虑做什么the first decision we must m
2015-03-13 20:38:54 3777
原创 Machine Learning - X. Advice for Applying Machine Learning机器学习算法的诊断和改进 (Week 6)
http://blog.csdn.net/pipisorry/article/details/44119187机器学习Machine Learning - Andrew NG courses学习笔记Advice for Applying Machine Learning机器学习应用上的建议{解决应用机器学习算法遇到的trainning set和test set预测不高的问题}机器学习...
2015-03-13 20:34:12 3356
原创 python字符串编码及乱码解决方案
http://blog.csdn.net/pipisorry/article/details/44136297字符编码详解[字符编码ASCII,Unicode和UTF-8]主要非英文字符集的编码范围范围 编码 说明 2E80~33FFh 中日韩符号区 收容康熙字典部首、中日韩辅助部首、注音符号、日本假名、韩文音符, 中日韩的符号、标点、带...
2015-03-08 20:26:50 55421 4
原创 Machine Learning - 神经网络的表示和学习 (Week 4 - 5)
http://blog.csdn.net/pipisorry/article/details/44119187机器学习Machine Learning - Andrew NG courses学习笔记Machine Learning - VIII. Neural Networks Representation神经网络的表示 (Week 4)Machine Learning - IX. Neural
2015-03-07 20:03:38 5402 5
原创 todotodo
from:http://blog.csdn.net/greenqingqingws/article/details/7395213ref:
2015-03-04 10:33:03 4697
原创 knowledge_based topic model - 基于知识的主题模型概述
http://blog.csdn.net/pipisorry/article/details/44040701LDA (Bleiet al., 2003)术语Mustlink states that two words should belong to the same topicCannot-link states that two words sho
2015-03-03 17:23:07 3013 2
原创 顺序数据:状态空间模型
http://blog.csdn.net/pipisorry/article/details/4397356顺序数据之前注意力集中在数据集里的数据点是独立同分布的情形。这个假设使得我们将似然函数表示为在每个数据点处计算的概率分布在所有数据点上的乘积。然而,对于许多应用来说,独立同分布的假设不成立。考虑这样的数据集中的一个重要的类型,即描述了顺序数据的数据集。这些数据集通常产生于沿着时间...
2015-02-27 22:29:31 12221
翻译 New to Machine Learning? Avoid these three mistakes
New to Machine Learning? Avoid these three mistakesCommon pitfalls when learning from dataMachine learning (ML) is one of the hottest fields in data science. As soon as ML entered the mainstre
2015-02-27 21:56:43 1545
原创 Machine Learning - VII. Regularization规格化 (Week 3)
http://blog.csdn.net/pipisorry/article/details/43966361机器学习Machine Learning - Andrew NG courses学习笔记规格化RegularizationThe Problem of Overfitting过拟合问题线性规划的例子(housing prices)
2015-02-27 12:22:40 3198
原创 Machine Learning - VI. Logistic Regression逻辑回归 (Week 3)
http://blog.csdn.net/pipisorry/article/details/43884027机器学习Machine Learning - Andrew NG courses学习笔记Logistic Regression逻辑回归{逻辑回归是一种线性分类模型,而不是回归模型。也就是说,输入的因变量target y是离散值,如分类类别1,0等等,而不是连续型的数据。}C...
2015-02-19 22:42:27 5278
原创 Octave教程 Octave Tutorial
http://blog.csdn.net/pipisorry/article/details/43565653本文教你掌握octave基本知识。Octave Tutorial Octave教程为什么学习机器学习要学octave等 较高级的原型语言?If you want to build a large scale deployment of a learning algorithm, what
2015-02-06 16:13:16 31445 2
原创 Machine Learning - IV. Linear Regression with Multiple Variables多变量线性规划 (Week 2)
机器学习Machine Learning - Andrew NG courses学习笔记linear regression works with multiple variables or with multiple features多变量线性规划Multiple Features多变量Gradient Descent for Multiple
2015-02-05 16:44:09 6580
原创 Machine Learning - III. Linear Algebra Review线性代数 (Week 1, Optional)
机器学习Machine Learning - Andrew NG courses学习笔记矩阵和向量及其表示介绍what are matrices矩阵matrix is just another way for saying, is a 2D or a two dimensional array.dimension of the matrixis going to be
2015-02-04 20:09:23 2496
原创 python模块导入及属性:import
http://blog.csdn.net/pipisorry/article/details/43313197模块和包1. python程序由包(package)、模块(module)和函数组成。2. 包是由一系列模块组成的集合。当不同作的模块进行按文件夹分类后再组成一个整体的库,可以称为包。为了让Python将目录当做内容包,目录中必须包含__init__.py文件,用于标识当前文件...
2015-01-30 20:39:45 37611 2
原创 Scipy教程 - 线性代数库scipy.linalg
http://blog.csdn.net/pipisorry/article/details/43277755Linear Algebra(scipy.linalg) scipy线性代数库简介When SciPy is built using the optimized ATLAS LAPACK and BLAS libraries, it has very fast linear
2015-01-29 20:49:58 34283
原创 knowledge_based topic model - AMC
http://blog.csdn.net/pipisorry/article/details/43271429ABSTRACT Topic modeling has been widely used to mine topics from documents. However,a key weakness of topic modeling is that it
2015-01-29 14:59:28 2999 1
原创 Linux:shell变量功能和Bash shell的操作环境
http://blog.csdn.net/pipisorry/article/details/43235263shell的变量功能sh和bash命令两者都是shell,都是解析工具。bash(Bourne Again SHell) 是Linux标准的默认shell ,它基于Bourne shell,吸收了C shell和Korn shell的一些特性。sh(Bourne she...
2015-01-28 19:07:16 4559
原创 Machine Learning - II. Linear Regression with One Variable单变量线性回归 (Week 1)
http://blog.csdn.net/pipisorry/article/details/43115525机器学习Machine Learning - Andrew NG courses学习笔记Linear regression with one variable单变量线性回归模型表示Model representation例子:这是Regression Problem(one of supe
2015-01-25 17:50:22 3467
原创 Machine Learning - I. Introduction机器学习综述 (Week 1)
机器学习的来源和用例:Machine Learning- Grew out of work in AI- New capability for computersExamples:- Database miningLarge datasets from growth of automation/web.E.g., Web click data, medical re
2015-01-24 20:35:41 4792
原创 Stanford Parser的使用——进行词法语法分析
http://blog.csdn.net/pipisorry/article/details/42976457stanford-parser的使用1、到斯坦福官方网站http://nlp.stanford.edu/software/lex-parser.shtml下载软件包,解压。2、在eclipse中新建一个java project,把解压得到根目录下的sta
2015-01-21 20:44:01 23289
原创 java环境配置:安装java和集成开发环境idea
http://Java是由Sun公司开发的一种应用于分布式网络环境的程序设计语言,Java语言拥有跨平台的特性,它编译的程序能够运行在多种操作系统平台上,可以实现“一次编写,到处运行”的强大功能。
2015-01-20 15:45:32 6525 1
Parameter estimation for text analysis
2016-05-23
pdfstudio安装文件及破解
2016-03-24
matplotlib安装包
2016-01-02
pandas安装文件
2016-01-01
matplotlib安装文件
2016-01-01
GB2UTF8.exe
2015-08-07
Introduction to Computation and Programming Using Python
2015-05-03
A First Course in Probability 第8版 Sheldon Ross
2014-10-31
wps symbol fonts
2017-02-27
Anand.Rajaraman-Mining of Massive Datasets
2016-06-01
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人