Word2vec原理及其Python实现

目录 一、为什么需要Word Embedding 二、Word2vec原理 1、CBOW模型 2、Skip-gram模型 三、行业上已有的预训练词向量 四、用Python训练自己的Word2vec词向量 一、为什么需要Word Embedding 在NLP(自然语言处理)里面,最细...

2018-11-16 00:00:53

阅读数 858

评论数 0

Mac下载安装nlp处理工具pyltp及其python实现

目录 一、操作环境 二、编译安装pyltp 三、填充pyltp中的空ltp文件夹 四、python处理NLP问题还需调用模型文件 pyltp 是哈工大出品的NLP处理工具,是 LTP 的 Python 封装。该工具提供了分词,词性标注,命名实体识别,依存句法分析,语义角色标注的功能,关于...

2018-11-05 01:23:05

阅读数 796

评论数 4

Python标准库详解——turtle、random、time

目录 前言 一、turtle库 1、一个小例子 2、turtle绘图的基础知识 1. 画布(canvas) 2. 画笔 二、random库 1、随机浮点数 2、随机整数 3、随机字符 4、随机洗牌 5、另:numpy里的random方法 三、time库 1、获取当前时间...

2018-10-23 19:10:35

阅读数 751

评论数 0

逻辑回归——机器学习(图解+理论+python实现)

目录 前言 一、Sigmoid函数(核心) 二、确定最佳回归系数 三、思路总结 四、用Python实现逻辑回归算法 前言 逻辑回归虽然带有回归两字,但实际上是做分类任务的,并且是一个经典的二分类算法。在我们选择使用机器学习算法的时候,通常呢,首先考虑的就是逻辑回归算法,再去考虑另外复...

2018-08-30 22:40:32

阅读数 809

评论数 2

Mac下载Mysql管理界面Sequel pro及其使用方法

一、Sequel pro的安装 Mac OS X 原生的应用工具Sequel Pro是一款管理 Mysql 的工具,界面简洁易用,你可以一次性连接多个数据库,允许快速访问那些你经常需要访问的数据库。 首先去官网下载Sequel pro的安装包:https://sequelpro.com/dow...

2018-08-14 20:37:17

阅读数 9103

评论数 0

LightGBM——提升机器算法(图解+理论+安装方法+python代码)

前言 LightGBM是个快速的,分布式的,高性能的基于决策树算法的梯度提升框架。可用于排序,分类,回归以及很多其他的机器学习任务中。 在竞赛题中,我们知道XGBoost算法非常热门,它是一种优秀的拉动框架,但是在使用过程中,其训练耗时很长,内存占用比较大。在2017年年1月微软在GitHub...

2018-08-04 21:41:12

阅读数 25989

评论数 11

DBSCAN聚类算法——机器学习(理论+图解+python代码)

一、前言 二、DBSCAN聚类算法 三、参数选择 四、DBSCAN算法迭代可视化展示 五、常用的评估方法:轮廓系数 六、用Python实现DBSCAN聚类算法 一、前言 去年学聚类算法的R语言的时候,有层次聚类、系统聚类、K-means聚类、K中心聚类,最后呢,被DBSCAN聚类算法...

2018-07-26 11:21:39

阅读数 11451

评论数 3

MacOS安装社区版Neo4j(图数据库)

知识图谱最近大热,Neo4j图数据库在这方面起到了很大的作用,也挺有意思的,安装它的时候走了不少弯路,在此分享Neo4j的安装过程。 Neo4j安装地址:https://neo4j.com/download-center/   ,我下载的是3.3.6的,都可以,然后就等着吧。   下载完...

2018-07-19 22:31:40

阅读数 2239

评论数 2

XGBoost——机器学习(理论+图解+安装方法+python代码)

目录 一、集成算法思想 二、XGBoost基本思想 三、MacOS安装XGBoost 四、用python实现XGBoost算法 在竞赛题中经常会用到XGBoost算法,用这个算法通常会使我们模型的准确率有一个较大的提升。既然它效果这么好,那么它从头到尾做了一件什么事呢?以及它是怎么样去做...

2018-07-13 15:25:32

阅读数 24862

评论数 2

sklearn中的GridSearchCV()!python中模型里各种参数取值有它方便多了

最近看机器学习的教学视频,老师反复提到了一个函数GridSearchCV()。举个例子,在python中用一个模型的时候,可能会涉及一些需要人为指定的参数,比如随机森林模型需要指定min_samples_split=?、n_estimators=?,在我们缺乏先验知识的时候,我们是不知道取什么样的...

2018-07-11 15:27:18

阅读数 2254

评论数 0

追求逻辑——概念是人们创造的,解释是人们观察到的

今天美国宾夕法尼亚州立大学一位教授来我校授课,授课的主题是《经济数学建模与神经网络和深度学习》让我又回忆起之前看到的一本书概念是人们创造的,解释是人们观察到的。找到一个合适的理论,验证它,成了,这就是一个真理。这种思想的出发点,不是追究事件是什么,而是创造一种观点来验证它,逻辑的走向很奇怪。今天美...

2018-07-10 17:48:21

阅读数 108

评论数 0

决策树算法——机器学习(理论+图解+python代码)

前言 暑假打算吃透一本书叫《机器学习》,大家也亲切的叫它西瓜书,看完决策树这部分想做做总结,虽然几年前对决策树的知识就有点印象,但是我发现现在又有了很多新的收获。 一、基本流程 二、划分选择 三、剪枝处理 四、连续与缺失值 五、多变量决策树 六、房价数据集的决策树算法python实现...

2018-07-09 22:01:34

阅读数 3405

评论数 2

深度学习之RNN循环神经网络(理论+图解+Python代码部分)

目录 前言 一、普通神经网络 二、循环神经网络 1.前向传播 2.反向传播算法BPTT 3.自然语言处理之RNN  4.梯度问题 4.1梯度爆炸 4.2梯度消失: 5.Keras建立RNN模型进行IMDb情感分析的Python代码 前言 前段时间实验室人手一本《Deep L...

2018-06-11 21:55:55

阅读数 4388

评论数 0

User-Agent的变迁——浏览器大战之前世今生

   一切的开始还得从NCSA Mosaic说起,Mosaic是由国家超级计算机应用中心开发的一款浏览器。称作 “NCSA_Mosaic/2.0(Windows 3.1)”,Mosaic支持在文本中展示图片,因此浏览器变的非常有趣了。      然而很快就出现了一个全新的浏览器,那就是著名的Moz...

2018-05-17 13:02:23

阅读数 42

评论数 0

准确率(Precision)、召回率(Recall)、F值(F-Measure)的简要说明

      一般来说,precision是检索出来的条目(文档、网页)有多少是准确的;recall就是所有准确的条目有多少被检索出来了;      不妨举这样一个例子:某池塘有1400条鲤鱼,300只虾,300只鳖。现在以捕鲤鱼为目的。撒一大网,逮着了700条鲤鱼,200只虾,100只鳖。那么,这...

2018-05-15 22:15:17

阅读数 438

评论数 0

深度学习的57个术语

激活函数(Activation Function) 为了让神经网络能够学习复杂的决策边界(decision boundary),我们在其一些层应用一个非线性激活函数。最常用的函数包括  sigmoid、tanh、ReLU(Rectified Linear Unit 线性修正单元) 以及这些函数的变...

2018-05-15 20:54:41

阅读数 84

评论数 0

【TensorFlow】tf.nn.softmax_cross_entropy_with_logits的用法

一、tf.nn.softmax_cross_entropy_with_logits:     在计算loss的时候,最常见的一句话就是tf.nn.softmax_cross_entropy_with_logits,那么它到底是怎么做的呢?首先明确一点,loss是代价值,也就是我们要最小化的值tf....

2018-05-15 20:36:52

阅读数 55

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭