机器学习
文章平均质量分 90
敲代码的胖虎
什么样的年龄,做什么样的事。
展开
-
python2(中文编码问题):UnicodeDecodeError: 'ascii' codec can't decode byte 0x?? in position 1
python2(中文编码问题):UnicodeDecodeError: 'ascii' codec can't decode byte 0x?? in position 1 ...转载 2019-10-26 12:23:34 · 3340 阅读 · 0 评论 -
numpy的ndarray与pandas的series和dataframe之间互转
在大数据分析中,比较常用的两个数据分析包就是numpy和pandas,而pandas正是基于numpy构建的含有更高级数据结构和工具的数据分析包,在金融领域应用更是广泛。在实际的工程中,经常遇到的问题就是numpy的ndarray数据结构与pandas的series和dataframe数据结构之间的互相转换问题。现在我分3种情况,在python程序中列一下互转的情况,应该比较全面了。情况...转载 2019-10-24 10:40:26 · 295 阅读 · 0 评论 -
自然语言处理之Word2Vec
nltk库nltk著名的自然语言处理库,自带语料库、词性分类库;自带分类、分词等功能;自带强大的社区;简单版本wrapper;nltk.download()会弹出该页面,进行资源的下载标题NLTK的module功能APINLTK自带语料库,nltk.corpus是语料的集合,import nltknltk.download('brown') # 需要先下载语料库br...原创 2019-10-24 10:22:58 · 1415 阅读 · 0 评论 -
特征工程解读
原创 用户特征工程 超详细解读 ...转载 2019-10-24 09:56:47 · 377 阅读 · 0 评论 -
机器学习——决策树与随机森林
一、决策树1.决策树的结构 决策树为树形结构,主要组成部分为非叶子节点(代表一个属性测试)、分支(代表测试输出)、叶子节点(代表一种类别)。2.基本思想 以信息熵为度量构造一颗熵值下降最快的树,到叶子节点的熵值为0(感觉类似于哈夫曼,贪心法)。根节点处熵值最大,熵值为0,表示不确定性为0。3.决策树学习的算法 决策树学习的算法的最大优点可以自学...原创 2019-03-31 16:45:23 · 248 阅读 · 0 评论 -
奇异值分解(SVD)与PCA(主成分分析)
奇异值分解(Singular Value Decomposition,以下简称SVD)是在机器学习领域广泛应用的算法,它不光可以用于降维算法中的特征分解,还可以用于推荐系统(稍后讲解),以及自然语言处理等领域,是很多机器学习算法的基石。下面将从SVD的原理、SVD的推导、分析SVD与PCA之间的关系等进行讲解,一步步到最后的推荐系统。一、SVD原理1.1 SVD定义若A是一个m*n的矩...原创 2019-09-10 12:03:15 · 6862 阅读 · 2 评论 -
主成分分析(PCA)详解
一、介绍PCA(PrincipalComponents Analysis)即主成分分析,常用于对多变量(变量之间具有相关性时)降维的方法,由于各变量之间存在一定的相关关系,因此可以考虑将关系紧密的变量变成尽可能少的新变量,使这些新变量是两两不相关的,将各个变量综合为少数若干个有代表性的变量。怎样衡量有代表性的变量(特征)?(学术——工业:变量——特征)能代表原始特征的绝大部分信息 组合后...原创 2019-09-08 17:34:59 · 3698 阅读 · 1 评论 -
(最大期望)EM算法案例详解
一、EM算法简介EM算法全称为Exception Maximization Algorithm,即最大期望算法,以下简称EM算法。它是一种迭代的算法,主要用于含有隐变量的概率参数模型的极大似然和极大后验概率估计。EM算法也经常用于机器学习和计算机视觉的聚类领域,是一个非常重要的算法。二、EM算法原理要了解EM算法,就必须先了解极大似然估计,因为整个的EM算法的演算、推导,都...原创 2019-09-08 11:45:45 · 3490 阅读 · 0 评论 -
机器学习——决策树(一)
决策树(DT)是用于分类和回归的非参数监督学习方法。目标是创建一个模型,通过学习从数据特征推断出的简单决策规则来预测目标变量的值。例如,在下面的示例中,决策树从数据中学习以使用一组if-then-else决策规则来近似正弦曲线。树越深,决策规则越复杂,模型越适合。决策树的优点简单易懂和解释,直观 只需少量的数据准备 能够处理数字和分类数据 能够处理多输出问题 可以使用统计测...翻译 2019-04-09 16:18:12 · 330 阅读 · 0 评论 -
Google上线的Tensorflow系列课程
Tensorflow网上公开课https://developers.google.cn/machine-learning/crash-course/prereqs-and-prework机器学习算法的网站(决策树算法-受阻于graphviz运行不了)https://scikit-learn.org/stable/modules/tree.htmlTensorflow干货大全ht...转载 2019-03-31 19:12:28 · 197 阅读 · 0 评论