机器学习
willsgao
这个作者很懒,什么都没留下…
展开
-
关于《流浪地球》炸裂的口碑,机器学习竟然是这样评价的————Python文本情感极性分析详解(上)
NLP(神经语言程序学/自然语言学习)是当前机器学习领域一个重要的分支,就是用机器学习模型来理解处理人类的自然语言,并给出符合自然语言逻辑的反馈。自然语言学习中具体的工作包括,教会程序用算法来正确地提取句子的主体成分(分词),判断句子的情感色彩(情感分析)等,并基于此实现文本分类,语言翻译,自动回复等更高级功能。此文尝试建立多种NLP模型,并利用《流浪地球》影评评语作为样本数据进行训练,对比...原创 2019-02-25 23:34:25 · 1516 阅读 · 9 评论 -
关于《流浪地球》炸裂的口碑,机器学习竟然是这样评价的————Python文本情感极性分析详解(下)
二、基于机器学习的文本情感极性分析基于词向量Word2Vec建立机器学习模型1、模型数学抽象本文构建模型的目的是进行文本(影评)情感色彩识别,属于分类问题。NLP处理涉及分词(中文分词器:jieba,loso,smallseg等),选择jieba工具包。建立机器学习模型涉及标签分类,选择SVM和MLP模型。# 导入相关基础工具包import sysimport numpy ...原创 2019-02-25 23:34:52 · 1203 阅读 · 0 评论 -
如何跟着OpenCV飞起来?——kaggle水果数据库图片识别案例
一、项目简介OpenCV是一个用于图像处理、分析、机器视觉方面的开源工具包。无论科学研究,还是商业应用,OpenCV都是进行图像识别的不二之选。熟练掌握OpenCV的图片识别能力,在图片识别领域里飞起来不是梦!本文利用kaggle数据库上的水果图片数据集(fruit-images-for-object-detection)展示如何训练机器学习模型识别水果图片的类别。数据地址(kaggle数...原创 2019-03-09 12:32:28 · 10817 阅读 · 17 评论 -
搜狗实验室新闻数据文本分类深度学习案例 ———Tensorflow+CNN深度学习全流程(下)
五、模型的训练与预测进行2000轮训练观察损失函数loss和预测准确率accuracy1、创建模型保存路径# 创建保存对象saver = tf.train.Saver()# 最优结果best_acc = 0# 创建保存训练模型的路径model_path = 'save_models/'if not os.path.exists(model_path): os.mak...原创 2019-03-06 20:48:51 · 1511 阅读 · 0 评论 -
搜狗实验室新闻数据文本分类深度学习案例 ———Tensorflow+CNN深度学习全流程(上)
一、项目简介tensorflow是谷歌开源的深度学习框架,是进行深度学习的坚船利炮。此文基于“搜狗实验数据库”的海量新闻数据,全流程展示如何基于tensorflow采用CNN算法实现文章的分类。方便学习者全面地理解深度学习及NLP文本分析的原理和实现步骤。二、数据预处理此部分详细代码见《如何有效地进行文本分类——数据预处理》https://blog.csdn.net/weixin_434...原创 2019-03-06 20:48:37 · 5451 阅读 · 3 评论 -
把声音画出来,会长成什么样?——HMM模型实例展示语音识别全流程
一、项目简介语音识别是人工智能领域的一个重要的应用场景,那么程序究竟是如何听懂语音的呢?本文将用真实的音频案例,用代码呈现语音识别的基本原理和流程。同时,将各种声音信号的MFCC矩阵进行可视化,“把声音的美丽画成图”。1、基本原理计算机只能识别二进制的数字信息,是无法直接识别音频信息的。因此让机器具有听懂“人话”的功能,必须要将声音的模拟信号转化为数字信号;就是利用模型将声音的音频数...原创 2019-03-07 18:55:21 · 2738 阅读 · 1 评论 -
那些看起来友好的数字验证码,原来可以这么容易就搞定!难怪被12306抛弃!
12306的原罪一提起春运,大家就能想起12306和它的两大原罪。一大原罪是票抢不上;另外一大,就是验证码恶心至极(见下图)。12306为什么不选择对乘客更加友好的纯数字验证码呢?原因当然也很简单,就是对乘客友好的数字验证码,对于抢票软件来说更友好。而一般的乘客是抢不过签票软件的。那么,这里就让我们来看看怎样用代码自动生成友好的纯数字验证码。1、引入第三方包from captch...原创 2019-03-11 18:24:11 · 375 阅读 · 0 评论 -
验证码是怎么被机器识别的?Keras+CNN模型验证码识别详解
一、项目简介本项目将利用Keras建立CNN模型对验证码数字进行识别,展示数字验证码识别的基本流程。此项目不采用OpenCV工具包的数字识别功能,而是将rgb数字图像转化为gray灰度图,计算图片的像素值进行模型训练和识别。验证码的训练集和测试集事先已生成,可直接调用。部分测试集数据部分训练集数据二、数据预处理1、引入第三方工具包from PIL import Image f...原创 2019-03-13 10:27:17 · 1642 阅读 · 0 评论