自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Blessy_Zhu的博客

本人的博客是平常学习的一个知识点记录和学习心得,希望可以和你多一些交流,共同进步...

原创 Python爬虫之微博评论数据的爬取(十)

微博是中国最早兴起的自媒体平台,人人都可以在上面发表自己的观点。到现在微博已经成为了官方,明星等“新闻发布“的第一阵地。更为重要的是:**==微博不同于QQ空间、微信朋友圈,不需要对方加你,也不需要你关注对方,你就可以看到对方的全部动态,个人信息。所以,微博变成了唯一可以爬的社交媒体平台==。**...

2019-03-09 11:44:39 22836 57

原创 词袋模型(Bag-of-words model)

词袋模型的三部曲:分词(tokenizing),统计修订词特征值(counting)与标准化(normalizing) 词袋模型: 词袋模型(Bag of Words,简称BoW),所谓的词袋模型是一种用机器学习算法对文本进行建模时表示文本数据的方法。 词袋模型假设我们不考虑文本中词与词之间的上下...

2019-11-28 10:25:02 571 0

原创 解决:'chromedriver' executable needs to be in PATH问题

chromedriver的安装一定要与Chrome的版本一致,不然就不起作用: 下载地址是: http://chromedriver.storage.googleapis.com/index.html https://npm.taobao.org/mirrors/chromedriver/ 1.首...

2019-10-29 21:02:12 252 1

原创 IndentationError: unindent does not match any outer indentation level问题解决

【问题】 一个python脚本,本来都运行好好的,然后写了几行代码运行的时候,却出现语法错误: IndentationError: unindent does not match any outer indentation level 【解决过程】 对于此错误,最常见的原因是,没有对齐。 ....

2019-10-26 15:41:50 341 0

原创 OSError: pydot failed to call GraphViz.Please install GraphViz问题解决

OSError: pydot failed to call GraphViz.Please install GraphViz问题解决 在keras可视化模型输出时,往往用: from keras.utils import plot_model plot_model(model, to_file=‘...

2019-10-24 17:49:17 631 0

原创 解决使用 plt.savefig() 保存图片时一片空白

当使用如下代码保存使用 plt.savefig 保存生成的图片时,结果打开生成的图片却是一片空白。 import matplotlib.pyplot as plt """ 一些作图代码 """ plt.show() plt.savefi...

2019-10-24 16:04:58 1181 1

原创 LSTM学习

学习LSTM需要通过五大问题来全面的理解:为什么会出现LSTM?LSTM是怎么解决RNN梯度消失的问题的?LSTM的主要内容是什么?LSTM如何代码实现?LSTM现在发展到什么地步(即有哪些变体)?通过这五个问题,了解LSTM的前世今生。

2019-09-30 21:44:56 573 0

原创 从全连接神经网络FCN到LSTM

本文主要介绍了深度学习的发展:从感知机、Fisher判别分析,到全连接神经网络、BP神经网络、CNN、RNN、SLTM等等

2019-09-25 21:12:58 1276 0

原创 TensorFlow的环境配置与安装

TensorFlow是一个基于数据流编程(dataflow programming)的符号数学系统,被广泛应用于各类机器学习(machine learning)算法的编程实现,其前身是谷歌的神经网络算法库DistBelief。 Tensorflow拥有多层级结构,可部署于各类服务器、PC终端和网页...

2019-09-10 18:12:57 76134 37

原创 citespae初步了解

实际上,简单理解SiteSpace就是,它是一种辅助论文文献科学分析的、基于Java语言环境的、可视化的科学知识图谱分析软件。它的主要作用就是,在科学文献中,识别研究前沿、寻找和标注关键的研究点,进而显示展示出某一学科、研究的历史动态和未来走向。

2019-08-01 08:21:11 459 0

原创 CiteSpace实践—中文CSSCI数据分析

根据CiteSpace进行数据分析的四个步骤,进行实例探究中文CSSCI数据分析

2019-08-01 08:20:57 4800 2

原创 CiteSpace实践—中文CNKI数据分析

根据CiteSpace进行数据分析的四个步骤,进行实例探究中文CNKI数据分析

2019-08-01 08:20:41 6914 6

原创 CiteSpace实践——英文Web of Science数据分析

这篇文章主要介绍英文数据库Web of Science的数据分析。这篇文章中,就不再严格的一步一步的按照文章中的citespae初步了解中介绍的关于CiteSpace进行数据分析的四个步骤进行编写了,主要介绍数据如何获取、以及数据如何保存(至于数据格式转换,这里是不需要的)。

2019-08-01 08:20:23 4801 3

原创 Python爬虫之猫眼APP电影数据(十八)

一声响指,宇宙间半数生命灰飞烟灭。几近绝望的复仇者们在惊奇队长(布丽·拉尔森 饰)的帮助下找到灭霸(乔什·布洛林 饰)归隐之处,却得知六颗无限宝石均被销毁,希望彻底破灭......,今天我们就来用Python爬取猫眼的电影数据

2019-07-14 17:32:11 3832 4

原创 径向基(Radial Basis Function:RBF)神经网络学习笔记

RBF神经网络是为了解决大部分基于反向传播的多层前馈网络的学习算法必须基于某种非线性优化技术的缺点 ,计算量大、学习速度慢的问题。RBF通过使用高斯和函数的方法,使得,网络由输入到输出的映射是非线性的,而网络输出对可调参数而言却又是线性的。网络的权就可由线性方程组直接解出,从而大大加快学习速度并避...

2019-07-12 16:47:33 3068 2

原创 BP(Back Propagation)神经网络学习笔记

BP神经网络算法是在BP神经网络现有算法的基础上提出的,是通过任意选定一组权值,将给定的目标输出直接作为线性方程的代数和来建立线性方程组,解得待求权,不存在传统方法的局部极小及收敛速度慢的问题,且更易理解。

2019-07-04 19:11:06 33393 8

原创 ANN人工神经网络(Artificial Neuron Network )

这篇内容分别介绍了MP神经元模型、单层神经网络、两层神经网络和常见的激活函数。内容翔实,理解起来较为简单

2019-06-25 16:43:28 2938 2

原创 机器学习---有监督和无监督

监督学习就是:训练的数据包含已知结果,模型相对这些结果进行训练; 无监督学习:训练数据不包含任何已知结果。算法自行发现数据中的联系。

2019-06-24 16:27:59 1465 0

原创 机器学习(十五)-DBSCAN算法及Python实例

DBSCAN(Density-Based Spatial Clustering of Applications with Noise)是一个比较有代表性的基于密度的聚类算法。与划分和层次聚类方法不同,它将簇定义为密度相连的点的最大集合,能够把具有足够高密度的区域划分为簇,并可在噪声的空间数据库中发...

2019-06-20 22:44:45 1943 0

原创 机器学习(十四)-GMM混合高斯模型(Gaussian mixture model)算法及Python实例

实际上,GMM的目的就是找到一个合适的高斯分布(也就是确定高斯分布的参数μ,Σ),使得这个高斯分布能产生这组样本的可能性尽可能大(即:拟合样本数据)。高斯混合模型也​被视为一种聚类方法,是机器学习中对“无标签数据”进行训练得到的分类结果。其分类结果由概率表示,概率大者,则认为属于这一类

2019-06-19 08:36:04 11927 1

原创 机器学习(十三)-EM(Exceptation-Maximization Algorithm)最大期望算法及Python实例

EM算法是常用的算法,算法里已知的是观察数据,未知的是隐含数据和模型参数,在E步,所做的事情是固定模型参数的值,优化隐含数据的分布,而在M步,我们所做的事情是固定隐含数据分布,优化模型参数的值。 EM算法有很多的应用,最广泛的就是GMM混合高斯模型、聚类、HMM等等。

2019-06-15 11:23:02 1890 1

原创 从感知机到深度学习发展史

本篇文章主要介绍了从机器学习到深度学习,从感知机到深度学习的内容。

2019-06-12 21:39:51 2406 0

原创 机器学习(十二)-基于规则的分类器

本文主要介绍给予规则的分类器的相关内容

2019-06-11 09:22:47 5455 1

原创 什么是机器学习

转载: 博文计算机的潜意识之从机器学习谈起,原文请点击链接(https://www.cnblogs.com/subconscious/p/4107357.html) 强烈推荐一篇关于机器学习入门导论的博文,里面的内容非常详实,加上作者的理解和感悟精华出来的一篇佳作。我从里面抽取出一些重点的内容,在...

2019-06-10 19:43:02 5226 0

原创 机器学习(十一)-Naïve Bayes Classifier朴素贝叶斯分类器及Python实现

朴素贝叶斯分类是一种十分简单的分类算法,叫它朴素贝叶斯分类是因为这种方法的思想真的很朴素。朴素贝叶斯的思想基础是这样的:对于给出的待分类项,求解在此项出现的条件下各个类别出现的概率,哪个最大,就认为此待分类项属于哪个类**别。尽管这些特征相互依赖或者有些特征由其他特征决定,然而朴素贝叶斯分类器认为...

2019-06-04 10:04:08 3015 0

原创 SQLServer无法实现远程连接

在【系统属性】中已经设置了允许远程桌面连接了,但是还是不能远程桌面的话,很可能是你的windows防火墙处于“启用”状态,防火墙阻止了windows 7系统的远程桌面连接。你可以使用以下的方法检查解决。

2019-06-03 10:22:05 5027 0

原创 机器学习(十)-KNN算法及Python实现

KNN算法是一个理论上比较成熟的方法,最初由Cover和Hart于1968年提出,其思路非常简单直观,易于快速实现,以及错误低的优点。k-近邻算法(kNN,k-NearestNeighbor),是最简单的机器学习分类算法之一,其核心思想在于用距离目标最近的k个样本数据的分类来代表目标的分类(这k个...

2019-06-02 09:56:09 2172 0

原创 机器学习(九)-k-means算法及优化和Python

K-means算法是很典型的基于距离的聚类算法,采用距离 作为相似性的评价指标,即认为两个对象的距离越近,其相似度就越大。该算法认为簇是由距离靠近的对象组成的,因此把得到紧凑且独立的簇作为最终目标。 k-means算法特点在于:同一聚类的簇内的对象相似度较高;而不同聚类的簇内的对象相似度较小

2019-05-29 16:05:42 3024 0

原创 人工智能的利与弊

万事皆有利有弊。使机器有自己的思维是否会对人类自身产生威胁,这是人们需要考虑的事情。就像电影《我,机器人》便描述了一个机器人反而要消灭人类的悲剧。同时,大量人工智能的产生会造成大量的失业。由此而见,科学家需要做的还有很多。但有一点事确定的,只要正确运用人工智能,它将极大程度上推动人类文明的进步。接...

2019-05-19 20:10:23 4803 0

原创 Python爬虫之定时给TA发送微信消息(十七)

对朋友很久没联系 不是因为感情变了 而是因为生活变了 毕竟年龄增长了 肩负的责任重了 身边的牵挂多了…… 何不如,写一个程序,每天都给TA发送,TA喜欢的、或者是你想对TA说的话。今天,就利用Python中的wxpy模块,将你想说的话发给TA吧!!!!!!!!!!!!!!!!

2019-05-15 14:30:58 10860 14

原创 Python爬虫之多线程图虫网数据爬取(十六)

今天要爬取的网站是[图虫网](https://tuchong.com/explore/)(网址:https://tuchong.com/explore/),这是一个个人非常喜欢的图片分享展示和交流的平台。上面的作品质量非常高,对于我这个摄影小白来说是一个非常不错的学习和欣赏大家作品的优质平台。没有...

2019-05-14 10:11:11 5904 3

原创 机器学习笔记(八)-PCA降维Wine Data Set详细过程

在上一篇博文[机器学习笔记(七)-主成分分析PCA](https://blog.csdn.net/weixin_42555080/article/details/89633287) 中,已经介绍了主成分分析PCA的基本内容。接下来的这篇文章,主要是通过一个多维的数据集,一步步去了解PCA的实现过程...

2019-05-12 22:42:36 3869 3

原创 Python爬虫之网易云音乐数据爬取(十五)

网易云音乐上面的评论数据具有很重要的作用。通过获取这些评论数据,包括:评论用户ID,评论用户昵称,评论用户位置,评论用户评论内容,该评论被点赞人数,用户头像地址,评论时间等信息。通过用户相关的数据,可以分析用户的组成成分,从而进行更具有针对性的用户推荐,通过评论数据集可以进一步做中文分词、命名实体...

2019-05-11 11:29:50 7798 6

原创 机器学习笔记(七)-主成分分析PCA

这篇博文主要介绍了,PCA主成分分析。首先通过几何概念引出维度爆炸带来的问题,接下来通过PCA数据降维来解决之。在主讲PCA内容时主要介绍了:经典主成分分析、最大投影方差、最小重构距离,SVD奇异值分解。最后通过Python实现PCA。这篇文章就到这里了,欢迎大佬们多批评指正,也欢迎大家积极评论多...

2019-04-28 20:55:58 1763 3

原创 机器学习笔记(六)-支持向量机SVM

本篇内容主要介绍了SVM支持向量机,分别介绍了Hard-Margin SVM中的凸优化、KKT约束、对偶化问题,而且还介绍了Soft-margin SVM的思想,并对SVM的Hard-Margin模型进行验证。这篇文章就到这里了,欢迎大佬们多批评指正,也欢迎大家积极评论多多交流。

2019-04-27 22:21:40 1278 2

原创 机器学习笔记(五)-高斯判别分析

在机器学习笔记(四)-逻辑回归中已经介绍了,软分类又分为概率判别模型:为代表的模型是逻辑回归;还有概率生成模型,为代表的是高斯判别分析(GDA:Guassian Discrimant Analysis)。GDA是本文的主角。本文主要是对GDA算法学习和Python验证

2019-04-25 10:26:22 1936 3

原创 机器学习笔记(四)-逻辑回归

逻辑回归算法讲解与实现

2019-04-24 21:59:17 1883 2

原创 机器学习笔记(三)-线性判别分析

在文章[机器学习笔记(一)-线性回归](https://blog.csdn.net/weixin_42555080/article/details/89357470)中已经介绍了线性回归,文中提到,线性回归是最基本最简单的机器学习算法,但是,在打破线性回归的某一特性时会出现新的算法。正如文章[机器...

2019-04-24 11:40:39 2951 2

原创 机器学习笔记(二)-感知机

在文章[机器学习笔记-线性回归](https://blog.csdn.net/weixin_42555080/article/details/89357470)中的前言部分已经介绍了,当打破线性回归的某一特性,就会形成新的模型算法,这篇文章介绍的感知机就是尝试打破了线性中的全局非线性这一性质——它...

2019-04-20 11:50:20 1145 2

原创 机器学习笔记(一)-线性回归

在概率引入到机器学习之后,就可以从两个角度:频率角度和贝叶斯角度来讨论问题。其中频率派逐渐发展为统计机器学习;贝叶斯派逐渐发展为概率图模型。今天介绍的Linear Regrssion线性回归分析,在统计机器学习中占据了核心地位,为什么呢?因为它是最基础、最简单的统计机器学习模型。

2019-04-18 14:19:09 710 2

提示
确定要删除当前文章?
取消 删除