![](https://img-blog.csdnimg.cn/20201014180756918.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
文章平均质量分 86
深深の深
。
展开
-
机器学习之特征提取(下)
目录4.中文特征提取5.Tf-idf文本特征提取4.中文特征提取思考:如果将数据替换为中文会怎样?将data里的英文字符替换为中文字符。data = ["我们总把人生想得太坏,像旁人不允许我们的怪。"]运行结果:很明显,这与我们平常划分词汇的方式不同。原来,CountVectorizer()的方法是以空格来划分单词的。因此,我们通过人为加空格的方式将字符进行分隔。data = ["我们 总 把 人生 想得 太坏,像 旁人 不允许 我们 的 怪。"]运行结果:思考:如果数据原创 2021-02-22 22:09:45 · 312 阅读 · 0 评论 -
机器学习之特征提取(上)
目录1.什么是特征提取2.字典特征提取1.什么是特征提取定义: 将任意数据(如文本或图像)转换为可用于机器学习的数字特征。2.字典特征提取举个????: 我们对以下数据进行特征提取。数据字典:[{‘Name’:‘Lucy’, ‘Score’:80},{‘Name’:‘Tony’, ‘Score’:95},{‘Name’:‘John’, ‘temperature’:73}]流程分析:(1)实例化DictVectorizer(2)调用fit_transform方法输入数据并转换具体实原创 2021-02-21 21:26:49 · 1483 阅读 · 0 评论 -
逻辑回归算法初步涉猎
目录1. 聚类与分类的区别2. 聚类算法在现实生活中的应用3.聚类算法实现流程4.聚类算法API初步调用1. 聚类与分类的区别(1)分类举个????:大家平常使用的阿里邮箱、QQ邮箱、网易邮箱都有个「垃圾邮件」的功能,其原理是根据人们打标的结果进行分析,从而实现系统自动过滤垃圾软件的功能。分类是从特定的数据中挖掘模式,做出判断的过程。本质是向事物分配标签,其本身是一种监督学习算法。(2)聚类聚类最终的目的也是实现数据分类,但是事先并不知道如何去划分,完全是通过算法判数据之间的相似性,它就是将相似原创 2021-02-16 21:47:08 · 217 阅读 · 0 评论 -
聚类算法初步涉猎
目录1.认识聚类算法1.1 聚类与分类的区别1.2 聚类算法在现实生活中的应用1.认识聚类算法1.1 聚类与分类的区别1.分类举个????:大家平常使用的阿里邮箱、QQ邮箱、网易邮箱都有个「垃圾邮件」的功能,其原理是根据人们打标的结果进行分析,从而实现系统自动过滤垃圾软件的功能。分类是从特定的数据中挖掘模式,做出判断的过程。本质是向事物分配标签,其本身是一种监督学习算法。2.聚类聚类最终的目的也是实现数据分类,但是事先并不知道如何去划分,完全是通过算法判数据之间的相似性,它就是将相似的事物放在原创 2021-02-15 22:29:03 · 588 阅读 · 0 评论 -
K-近邻算法初步涉猎
目录一、K-邻近算法1.什么是K-邻近算法二、下拉菜单三、上传文件四、饭后总结之前,我们主要学习的是对输入框进行操作。而通过本节内容的学习,你将掌握更多的控件定位技能,准备好了嘛,快和我一起吧~一、K-邻近算法1.什么是K-邻近算法举个????:假设某天小白来到了杭州,但是他不知道自己属于哪个区。他想起很多的大学同学都生活在杭州,于是就打电话问小猫、小狗等等的朋友,他们分别在哪个区,距离自己几公里。问了几个朋友后,发现自己离小兔子最近,那他就觉得自己目前在萧山区。**思想:**根据最近的距离来原创 2021-02-13 21:49:03 · 295 阅读 · 1 评论