![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
文章平均质量分 90
William张
计算机研究生,自然语言处理方向,专注于语音。
展开
-
搜索相关知识总结
背景对于规模较大的团队,都会开发自己的搜索引擎,加入各种定制需求、方便优化;对于规模较小的项目或者创业团队,一般都会用一些开源的轮子,比如ElasticSearch、Lucene。(个人感觉,搜索、推荐、广告算法,三者是商业化时代必不可少的领域,对于创造商业价值具有强有力的推动作用。也是我比较喜欢的想做的领域,通过从事该领域,可以深入了解用户行为习惯,了解客户需求,对于业务需求,可以理解的很透彻。也希望自己可以从事该领域,算是找到自己喜欢感兴趣的方向,希望可以做下去的。。先从自学开始。。。嘻嘻)并且,原创 2021-01-08 22:04:33 · 623 阅读 · 0 评论 -
统计学习方法-笔记
https://blog.csdn.net/jiaoyangwm/article/details/81139362分类问题(label是有限。离散的)逻辑回归,解决二分类问题。在空间中找到一个决策边界来完成分类的决策。逻辑回归是将线性回归的连续值结果,通过sigmoid函数映射到(0,1)之间,完成分类问题,还能获取到每个类别的概率。损失函数:对数损失函数。对数形式,损失函数的梯度图是碗形...原创 2019-04-01 21:35:16 · 171 阅读 · 0 评论 -
HMM, CRF(还有EM、GMM)
隐含马尔科夫模型(hidden Markov model, HMM), 可以用于标注问题的统计学习模型,由隐藏的马尔科夫链,随机生成观测序列的过程,属于生成模型。关于时序的概率模型熵,最大熵,是基础。熵:表现了系统所处状态的不确定性程度。平均信息量(平均不确定程度)。最大熵:保留全部的不确定性,将风险降到最小。指数函数形式,形式漂亮简单,实际实现计算复杂。...原创 2019-04-16 17:41:25 · 2190 阅读 · 0 评论 -
SVM + 决策树 + 提升方法 (还有LR、最大熵、)
SVM(Support Vector Machines),支持向量机, 是一种二分类模型, 基本模型是定义在特征空间上的间隔最大的线性分类器,核函数的使用,使它成为实质上的非线性分类器,学习策略,间隔最大化,三类支持向量机:线性可分的支持向量机,(通过硬间隔最大化,学习线性分类器,即线性可分支持向量机,又称硬间隔支持向量机)线性支持向量机, (数据近似线性可分时,通过软间隔最大化,学习一...原创 2019-05-02 20:20:52 · 2794 阅读 · 0 评论 -
无监督学习
聚类原型聚类:聚类结构能通过一组原型刻画,原型是指样本空间中具有代表性的点。算法先对原型进行初始化,然后对原型迭代更新求解。 如: KMeans密度聚类:从样本密度的角度,考察样本之间的可连接性,基于可连接样本,不断扩展聚类簇,以获得最终的结果。层次聚类:从不同层次,对数据集进行划分,从而形成树形的聚类结构。数据集的划分,可采用“自底向上”、“自顶向下”的方式。AP聚类Affin...原创 2019-07-31 23:49:50 · 318 阅读 · 0 评论