Blessy_Zhu的博客

本人的博客是平常学习的一个知识点记录和学习心得,希望可以和你多一些交流,共同进步...

Python爬虫之微博评论数据的爬取(十)

微博是中国最早兴起的自媒体平台,人人都可以在上面发表自己的观点。到现在微博已经成为了官方,明星等“新闻发布“的第一阵地。更为重要的是:**==微博不同于QQ空间、微信朋友圈,不需要对方加你,也不需要你关注对方,你就可以看到对方的全部动态,个人信息。所以,微博变成了唯一可以爬的社交媒体平台==。**...

2019-03-09 11:44:39

阅读数 5702

评论数 8

ANN人工神经网络(Artificial Neuron Network )

这篇内容分别介绍了MP神经元模型、单层神经网络、两层神经网络和常见的激活函数。内容翔实,理解起来较为简单

2019-06-25 16:43:28

阅读数 30

评论数 0

机器学习---有监督和无监督

监督学习就是:训练的数据包含已知结果,模型相对这些结果进行训练; 无监督学习:训练数据不包含任何已知结果。算法自行发现数据中的联系。

2019-06-24 16:27:59

阅读数 12

评论数 0

机器学习(十五)-DBSCAN算法及Python实例

DBSCAN(Density-Based Spatial Clustering of Applications with Noise)是一个比较有代表性的基于密度的聚类算法。与划分和层次聚类方法不同,它将簇定义为密度相连的点的最大集合,能够把具有足够高密度的区域划分为簇,并可在噪声的空间数据库中发...

2019-06-20 22:44:45

阅读数 23

评论数 0

机器学习(十四)-GMM混合高斯模型(Gaussian mixture model)算法及Python实例

实际上,GMM的目的就是找到一个合适的高斯分布(也就是确定高斯分布的参数μ,Σ),使得这个高斯分布能产生这组样本的可能性尽可能大(即:拟合样本数据)。高斯混合模型也​被视为一种聚类方法,是机器学习中对“无标签数据”进行训练得到的分类结果。其分类结果由概率表示,概率大者,则认为属于这一类

2019-06-19 08:36:04

阅读数 74

评论数 0

机器学习(十三)-EM(Exceptation-Maximization Algorithm)最大期望算法及Python实例

EM算法是常用的算法,算法里已知的是观察数据,未知的是隐含数据和模型参数,在E步,所做的事情是固定模型参数的值,优化隐含数据的分布,而在M步,我们所做的事情是固定隐含数据分布,优化模型参数的值。 EM算法有很多的应用,最广泛的就是GMM混合高斯模型、聚类、HMM等等。

2019-06-15 11:23:02

阅读数 1396

评论数 1

从感知机到深度学习发展史

本篇文章主要介绍了从机器学习到深度学习,从感知机到深度学习的内容。

2019-06-12 21:39:51

阅读数 1391

评论数 0

机器学习(十二)-基于规则的分类器

本文主要介绍给予规则的分类器的相关内容

2019-06-11 09:22:47

阅读数 2016

评论数 0

什么是机器学习

转载: 博文计算机的潜意识之从机器学习谈起,原文请点击链接(https://www.cnblogs.com/subconscious/p/4107357.html) 强烈推荐一篇关于机器学习入门导论的博文,里面的内容非常详实,加上作者的理解和感悟精华出来的一篇佳作。我从里面抽取出一些重点的内容,在...

2019-06-10 19:43:02

阅读数 2070

评论数 0

机器学习(十一)-Naïve Bayes Classifier朴素贝叶斯分类器及Python实现

朴素贝叶斯分类是一种十分简单的分类算法,叫它朴素贝叶斯分类是因为这种方法的思想真的很朴素。朴素贝叶斯的思想基础是这样的:对于给出的待分类项,求解在此项出现的条件下各个类别出现的概率,哪个最大,就认为此待分类项属于哪个类**别。尽管这些特征相互依赖或者有些特征由其他特征决定,然而朴素贝叶斯分类器认为...

2019-06-04 10:04:08

阅读数 1986

评论数 0

SQLServer无法实现远程连接

在【系统属性】中已经设置了允许远程桌面连接了,但是还是不能远程桌面的话,很可能是你的windows防火墙处于“启用”状态,防火墙阻止了windows 7系统的远程桌面连接。你可以使用以下的方法检查解决。

2019-06-03 10:22:05

阅读数 2078

评论数 0

机器学习(十)-KNN算法及Python实现

KNN算法是一个理论上比较成熟的方法,最初由Cover和Hart于1968年提出,其思路非常简单直观,易于快速实现,以及错误低的优点。k-近邻算法(kNN,k-NearestNeighbor),是最简单的机器学习分类算法之一,其核心思想在于用距离目标最近的k个样本数据的分类来代表目标的分类(这k个...

2019-06-02 09:56:09

阅读数 1824

评论数 0

机器学习(九)-k-means算法及优化和Python

K-means算法是很典型的基于距离的聚类算法,采用距离 作为相似性的评价指标,即认为两个对象的距离越近,其相似度就越大。该算法认为簇是由距离靠近的对象组成的,因此把得到紧凑且独立的簇作为最终目标。 k-means算法特点在于:同一聚类的簇内的对象相似度较高;而不同聚类的簇内的对象相似度较小

2019-05-29 16:05:42

阅读数 747

评论数 0

人工智能的利与弊

万事皆有利有弊。使机器有自己的思维是否会对人类自身产生威胁,这是人们需要考虑的事情。就像电影《我,机器人》便描述了一个机器人反而要消灭人类的悲剧。同时,大量人工智能的产生会造成大量的失业。由此而见,科学家需要做的还有很多。但有一点事确定的,只要正确运用人工智能,它将极大程度上推动人类文明的进步。接...

2019-05-19 20:10:23

阅读数 4098

评论数 0

Python爬虫之定时给TA发送微信消息(十七)

对朋友很久没联系 不是因为感情变了 而是因为生活变了 毕竟年龄增长了 肩负的责任重了 身边的牵挂多了…… 何不如,写一个程序,每天都给TA发送,TA喜欢的、或者是你想对TA说的话。今天,就利用Python中的wxpy模块,将你想说的话发给TA吧!!!!!!!!!!!!!!!!

2019-05-15 14:30:58

阅读数 3795

评论数 2

Python爬虫之多线程图虫网数据爬取(十六)

今天要爬取的网站是[图虫网](https://tuchong.com/explore/)(网址:https://tuchong.com/explore/),这是一个个人非常喜欢的图片分享展示和交流的平台。上面的作品质量非常高,对于我这个摄影小白来说是一个非常不错的学习和欣赏大家作品的优质平台。没有...

2019-05-14 10:11:11

阅读数 5305

评论数 2

机器学习笔记(八)-PCA降维Wine Data Set详细过程

在上一篇博文[机器学习笔记(七)-主成分分析PCA](https://blog.csdn.net/weixin_42555080/article/details/89633287) 中,已经介绍了主成分分析PCA的基本内容。接下来的这篇文章,主要是通过一个多维的数据集,一步步去了解PCA的实现过程...

2019-05-12 22:42:36

阅读数 2663

评论数 2

Python爬虫之网易云音乐数据爬取(十五)

网易云音乐上面的评论数据具有很重要的作用。通过获取这些评论数据,包括:评论用户ID,评论用户昵称,评论用户位置,评论用户评论内容,该评论被点赞人数,用户头像地址,评论时间等信息。通过用户相关的数据,可以分析用户的组成成分,从而进行更具有针对性的用户推荐,通过评论数据集可以进一步做中文分词、命名实体...

2019-05-11 11:29:50

阅读数 5385

评论数 2

机器学习笔记(七)-主成分分析PCA

这篇博文主要介绍了,PCA主成分分析。首先通过几何概念引出维度爆炸带来的问题,接下来通过PCA数据降维来解决之。在主讲PCA内容时主要介绍了:经典主成分分析、最大投影方差、最小重构距离,SVD奇异值分解。最后通过Python实现PCA。这篇文章就到这里了,欢迎大佬们多批评指正,也欢迎大家积极评论多...

2019-04-28 20:55:58

阅读数 1121

评论数 2

机器学习笔记(六)-支持向量机SVM

本篇内容主要介绍了SVM支持向量机,分别介绍了Hard-Margin SVM中的凸优化、KKT约束、对偶化问题,而且还介绍了Soft-margin SVM的思想,并对SVM的Hard-Margin模型进行验证。这篇文章就到这里了,欢迎大佬们多批评指正,也欢迎大家积极评论多多交流。

2019-04-27 22:21:40

阅读数 1115

评论数 1

提示
确定要删除当前文章?
取消 删除
关闭
关闭