![](https://img-blog.csdnimg.cn/20201014180756919.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
文章平均质量分 90
考古学家lx(李玺)
[ 笃信仁厚 , 慎思勤勉 ] 《爬虫逆向进阶实战》作者
展开
-
支持向量机
.分类作为数据挖掘领域中一项非常重要的任务,它的目的是学会一个分类函数或分类模型(或者叫做分类器)。支持向量机(Support Vector Machine, SVM)是一类按监督学习(supervised learning)方式对数据进行二元分类(binary classification)的广义线性分类器(generalized linear classifier)。其决...原创 2019-04-04 16:08:39 · 2112 阅读 · 0 评论 -
常用电影推荐方法简述
根据评分进行排序的电影推荐:基于内容的电影推荐:基于协同推荐的电影推荐:(Collaborative Filtering,简称CF)第一步:建立用户电影矩阵模型: 协同过滤算法的输入数据通常表示为一个m*n的用户评价矩阵Matrix,m是用户数,n是电影数,Matrix[ij]表示第i个用户对第j个电影的评价第二步:发现兴趣相似的用户: 通过计算目标用户与其他用户之间的相似度,...原创 2019-09-09 15:26:47 · 1232 阅读 · 1 评论 -
利用机器学习识别验证码(从0到1)
最近喜欢先把测试结果图放前面。大家可以先看下效果。识别速度并不是很快,代码并没有进一步优化。本篇主要讲的是 从制作验证码开始,到我们利用机器学习识别出来结果的过程。之前写过一篇利用opencv进行验证码处理,感兴趣可以看看,本篇的验证码并没有过多处理:https://blog.csdn.net/weixin_43582101/article/details/90609399利用机器学习识...原创 2019-06-07 22:13:07 · 4935 阅读 · 5 评论 -
京东20W条数据统计清洗分析
Readme:针对京东商城20W条美的热水器评论数据进行统计清洗分析。分析出所有正面评论和负面评论。分词统计热词出现频率。分析出销售问题所在。开发环境:本项目的文本情感分析使用的是基于情感字典的文本情感分析。为了能够正确标注一段中文文本的情感。需要如下几个情感字典:①停用词字典:用于过滤掉一段文本中的噪声词组。②情感词字典:用于得到一段文本中带有情感色彩的词组及其评分。...原创 2019-04-14 19:38:17 · 6003 阅读 · 0 评论 -
卷积神经网络
看这种文章,来首高山流水吧,省的太过干涩。 卷积神经网络卷积神经网络,它们也被称作CNNs或着ConvNets,是深层神经网络领域的主力。它们已经学会对图像进行分类,在某些情况下甚至超过了人类。如果有一个方法证明了这种假设,那就是CNN。下图为卷积神经网络流程图:(这里看不懂没关系)为了帮助指导你理解卷积神经网络,我们讲采用一个非常简化的例子:确定一幅图像是包含有"X"还...原创 2019-04-01 21:22:13 · 1918 阅读 · 0 评论 -
Python 调用摄像头进行人脸识别
之前发过一篇关于对图片上人脸检测的博客。链接:https://blog.csdn.net/weixin_43582101/article/details/88702254本篇则是讲解通过计算机摄像头来识别人脸并捕捉人脸位置。源码加依赖在最后会完整托管在githup上。测试结果如下:直接贴代码了,基本上都有注释。就不多说了。导入要使用的模块 cv2,tensorflowimport t...原创 2019-03-30 15:24:05 · 30413 阅读 · 45 评论 -
基于Opencv的图片人脸检测
本篇内容介绍如何使用opencv,scipy,tensorflow来实现计算机人脸检测。(用一点也是用 =.=)先声明一下,本篇内容是在图片中的人脸检测,下次会更新调动计算机摄像头的人脸识别。效果图:(图片在百度图片搜索而来,如有侵权请联系我。)先介绍一下要使用的模块:SciPy模块。 安装方法 pip install scipySciPy是一款方便、易于使用、专为科学...原创 2019-03-20 22:34:34 · 7403 阅读 · 6 评论 -
KNN算法实现手写数字识别
KNN 最邻近分类算法:(近邻取样)邻近算法,或者说K最近邻(kNN,k-NearestNeighbor)分类算法是机器学习分类技术中最简单的方法之一。所谓K最近邻,就是k个最近的邻居的意思,说的是每个样本都可以用它最接近的k个邻居来代表。属于监督学习,有类别标记,且KNN是惰性学习。叫做Memory-based learning、也叫instance-based learning. 他...原创 2019-03-24 01:58:35 · 23760 阅读 · 20 评论 -
K-means算法分析航空公司客户价值
信息时代的来临使得企业营销焦点从产品转向了客户,客户关系管理(Customerrelationship management,CRM)成为企业的核心问题。客户关系管理的关键问题是客户分群。通过客户分群,区分无价值客户和高价值客户。企业针对不同价值的客户制订优化的个性化服务方案,采取不同营销策略,将有限营销资源集中于高价值客户,实现企业利润最大化目标。准确的客户分群结果是企业优化营销资源分配的重要依...原创 2019-03-22 10:15:18 · 10946 阅读 · 8 评论 -
IMDB算法(贝叶斯算法)
大家中秋快乐!MDB TOP250的电影评分计算方法正是大名鼎鼎的贝叶斯统计算法。要想领悟这种算法的精妙之处,我们首先需要看一个例子:电影A,十个人看过,全部评分均为10分;电影B,十万个人看过,评分平均值为9.8分。请问你愿意相信哪部电影更加优秀??贝叶斯算法的核心思想就是避免让电影A的最终得分会超过B。具体是如果做到的呢?首先IMDB统计了目前数据库所有的电影的平均评分(为6....原创 2019-09-13 18:03:03 · 4661 阅读 · 0 评论