godotlee-CSDN博客

原创 CRF 理解

CRF概念CRF(conditional random field) 条件随机场模型是由Lafferty在2001年提出的一种典型的判别式模型．　它在观测序列的基础上对目标序列进行建模．重点解决　序列化标注的问题，条件随机场的模型既具有判别式模型的优点，又具有产生式模型考虑到上下文标记时间的转移概率，　以序列化形式进行全局参数优化和解码的特点，解决了其他判别式模型（如最大熵马尔可夫模型）难以避免的标

2017-03-26 15:34:55 2337

原创 linux 常用指令

ls ［选项］［目录名］列出目标目录中所有的子目录和文件cd ［目录名］切换当前目录至目标目录pwd ［选项］查看当前工作目录的完整路径mkdir ［选项］目录...在指定位置创建文件夹或目录rm ［选项］文件...删除文件或目录rmdir ［选项］...　目录...从一个目录中删除一个或多个子目录mv ［选项］源文件或目录　　目标文件或目录将文

2017-02-11 16:15:59 259

原创聚类算法：ｋ均值(k-means)

k-means算法接受一个未标记的数据集，然后将数据聚类成不同的组，k-means是一个迭代算法，步骤如下：１．首先选择ｋ个随机的点(即聚为ｋ组)，作为聚类中心(cluster centroids)．２．对于数据集中的每一个数据，计算其到每一个中心点的距离，并与距离最近的中心点关联起来，与同一个中心点关联的所有点聚成一类３．计算每一组的平均值，将改组的中心点移动到中心值的位置４．重

2016-12-29 16:36:25 389

原创训练神经网络

使用神经网络的步骤：网络结构，即决定选择多少层及每层分别有多少个单元：第一层的单元数即我们训练集的特征数量最后一层的单元数即我们训练集的结果的类的数量如果隐藏层数大于１，确保每个单元层的单元个数相同，通常情况下隐藏层单元个数越多越好．训练神经网络：参数的随机初始化利用正向传播方法计算所有的h_θ(x)编写计算代价函数J的代码利用反向传播方法计算所有偏导数

2016-12-29 10:56:03 454

原创特征缩放(Feature Scaling)

特征缩放解释：数据中某一维度的数值过大或过小时，将他们尽量缩放到［－１，１］或［０，１］之间．所谓特征的尺度，即代表该特征的维度上的数值大小．特征缩放作用：如K-NN算法中，如果某一维度上的值比其维度的大，则在计算样本欧式距离时，将会被该维度的值所主导．如梯度下降算法中，将所有特征的尺度尽量缩放到［－１，１］之间，能够减少迭代的次数，即加快收敛特征缩放的方法;

2016-12-28 10:54:03 944

原创梯度下降　随机梯度下降　批量梯度下降

设训练样本有n个数据梯度下降公式损失函数公式梯度下降（Gradient Descent），一次更新θ，使用训练样本中所有样本随机梯度下降（Stochastic Gradient Descent），一次更新θ，使用训练样本中一个数据批量梯度下降（Batch Gradient Descent），　一次更新θ，使用训练样本中一批训练数据

2016-12-28 10:31:53 386

原创 linux常用指令记录

du -sh 查看当前文件夹大小(需root权限)df -h 查看所有分区情况du -h --max-depth=1 查看文件夹的大小

2016-12-16 14:26:43 434

转载类与对象

本段落解释了类与对象及其之间的关系1、对象对象就是封装了数据及在这些数据之上的操作的封装体，这个封装体有一个名字标示它，而且可以向外界提供一组操作（或服务）。2、类类是对具有相同属性和操作的一组对象的抽象描述。3、类和对象的关系类代表了一组对象的共性和特征，类是对象的抽象，即类忽略对象中具体的属性值而只保留属性。而对象是对类的实例化，即将类中的属性赋

2016-11-10 13:42:43 231

原创推荐系统学习笔记（四）

第4章基于近邻推荐方法综述 4.1 用户反馈类型：分级反馈(评分) 二元反馈（喜欢/不喜欢）一元反馈（购买、浏览）4.1.1评测推荐系统效果对于评分集合，常用测试预测准确性的标准分别为平均绝对误差（MAE）、均方根误差（RMAE）对于二元反馈，常用准确率（precision）和召回率（recall） 4.1.2推荐方法概要

2016-07-06 09:48:33 670

原创推荐系统学习笔记（三）

第3章基于内容的推荐系统：前沿和趋势 3.1 简介基于内容的推荐系统试图推荐给定用户过去喜欢的相似物品协同过滤推荐方式的系统识别出拥有相似喜好的用户，并推荐给他们喜欢过的物品 3.2.1 基于内容的推荐系统的高层次结构内容分析器：将来自信息源的对象的内容表示成恰当的格式（特征抽取技术）。信息学习器：收集用户偏好的数据特征，并试图泛化（

2016-07-06 09:36:21 337

原创推荐系统学习笔记（二）

第1章推荐系统中的数据挖掘方法数据挖掘的三个步骤：1、数据预处理2、数据分析3、结果解释距离度量方法：1、欧氏距离 2、Jaccard距离(1-SIM(x,y)) 3、余弦距离(表示为0到180之间的度数) 4、编辑距离(长度之和减去最长公共子序列) 5、海明距离(两个向量中不同分量的个数) 6、马氏距离抽样方法

2016-07-06 09:28:23 482

原创推荐系统学习笔记（一）

第1章概述 1.1 简介推荐系统主要针对缺乏个人经验和能力的人，他们无法评估大量可供选择的物品【有些人则不受推荐系统的影响？】个性化推荐与非个性化推荐推荐系统被证明是一种解决信息过载问题的有效工具，通过为用户指引该用户不熟悉的新物品来解决信息过载现象。用户可能接受也可能不接受推荐，可能马上或过段时间提供显式或隐式的反馈，所有这些行为和反馈可以存

2016-07-06 09:18:45 397

godotlee的博客