自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Mr.Scofield

RxNLP.

原创 DeepNLP的表示学习·词嵌入来龙去脉·深度学习(Deep Learning)·自然语言处理(NLP)·表示(Representation)

DeepNLP的表示学习·词嵌入来龙去脉·深度学习(Deep Learning)·自然语言处理(NLP)·表示(Representation) 词向量、word embedding、分布式表示、word2vec、glove 术语解释! 自然语言处理表示学习 词向量、word2vec无门槛理解! ...

2017-04-04 20:48:33 25058 26

原创 来扯扯分布式数据库系统DDBS设计啊

我来扯扯分布式数据库系统DDBS的设计 注明:本文只是在完成一个高级数据库作业的文章,不能算是正儿八经登堂入室的paper,所以,不负责任哈,带坏小朋友不要找我哦 ^_~ 转载注明出处:Scofield's blog[  http://blog.csdn.net/scotfield_...

2017-03-04 21:01:41 2447 0

原创 TensorFlow RNN深度学习 BiLSTM+CRF 实现 sequence labeling 序列标注 源码

在TensorFlow (RNN)深度学习下 BiLSTM+CRF 跑 sequence labeling  双向LSTM+CRF跑序列标注问题 去年底样子一直在做NLP相关task,是个关于序列标注问题。这 sequence labeling属于NLP的经典问题了,开始尝试用HMM,哦不,用...

2017-03-04 20:32:54 42187 5

原创 深度学习DeepLearning推荐论文清单 初学者入门推荐学习路线

深度学习DeepLearning papers初学者入门推荐学习论文清单(供下载)—————————————每一位DL初学者都想找到一条卓有成效的学习路线,我推荐的是沿着历史发展路线将前辈们的经典papers一一读一遍。所以有的兄弟已经做好了工作了:这里有位仁兄的(Deep Learning Pa...

2017-01-08 01:01:17 17783 0

原创 概率图模型学习笔记:HMM、MEMM、CRF

概率图模型学习笔记:HMM、MEMM、CRF 原创博客,转载请注明出处。 From Scofield. RxNLP 一、Preface 二、Prerequisite     2.1 概率图         2.1.1 概览         2.1.2 有向图 vs. ...

2018-01-29 15:00:57 5060 2

原创 各框架下(tensorflow, pytorch, theano, keras)实现几个基础结构神经网络(mlp, autoencoder, CNNs, recurrent, recursive)

学习笔记:各大神经网络框架下(tensorflow, pytorch, theano, keras)实现几个基础结构神经网络(mlp, autoencoder, CNNs, recurrentNN, recursiveNN) several basic neural networks[mlp...

2018-01-19 16:09:43 6498 2

原创 scrapy爬取酒店评论数据

scrapy爬取酒店评论数据 代码 here:GitHub:scrapy_hotel_review 采用scrapy爬取酒店评论数据。 总共有28W条记录。 做某NLP任务,需要一些hotel reviews, 选择从www.booking.com搞一点数据来。 根据主页显示总共有2...

2018-01-19 15:35:08 3836 2

原创 NLP 工具包 大调查 自然语言处理工具包合集

NLP 工具包 大调查 自然语言处理工具包合集                 可以想一想,如何你把NLP领域的所有的工具都能掌握的数如家珍,是不是很NB?必然的。                 只用过这里面的一部分。。。                 这份调查是基于使用语言差别来归纳的...

2017-06-07 23:06:18 6131 0

原创 NLP 主题抽取 Topic LDA代码实践 gensim包 代码

NLP 主题抽取Topic LDA代码实践 gensim包 代码         分享一个代码实践:用gensim包的LDA模型实践NLP的一个典型任务,主题抽取。         顺带提一点,对于NLP任务,最好的方式就是先在代码上跑通起来,然后再进行理论深究,最后自己实现DIY学习模型...

2017-06-07 22:49:13 8094 0

原创 数据挖掘 NLP 之 文本挖掘 文本处理 通用流程

数据挖掘 NLP 之 文本挖掘 文本处理 通用流程   数据挖掘中的文本挖掘不论是对于企业应用,还是研究者工作,或者是参与数据竞赛项目,都是基础的工作。通过前面的一些实践工作,现总结出文本挖掘文本处理的通用流程。 注意,这里的文本挖掘任务主要指的是如文本分类、文本聚类、信息抽取、情感...

2017-06-07 22:18:52 11675 0

原创 从不同角度看机器学习的几种学习方式

从不同角度看机器学习的几种学习方式: 1、在线学习与离线学习 offline learning and online learning.  In offline learning, the whole training data must be available at ...

2017-04-27 20:11:22 5618 0

原创 机器学习 数据挖掘 数据集划分 训练集 验证集 测试集

机器学习之数据集划分: 训练集 验证集 测试集 Q:将数据集划分为测试数据集和训练数据集的常用套路是什么呢? A:three ways shown as follow: 1.像sklearn一样,提供一个将数据集切分成训练集和测试集的函数: 默认是把数据集的75%作为训练集,把数据集...

2017-04-10 12:40:59 9784 0

原创 《数学之美》知识点详细总结

《数学之美》知识点详细总结 From`RxNLP`Scofield 未完待续           《数学之美》这本书在本科期间电子版上偶尔进行了翻阅,后来有时间了就完整的进行了阅读。出于老习惯,看完一本书后总会去总结书本的知识点层次框架,以更好地融入到原有的框架中。尤其是现入坑NLP,作...

2017-04-05 17:15:32 4741 0

转载 [转发]机器学习资源大全

机器学习资源大全 本列表选编了一些机器学习领域牛B的框架、库以及软件(按编程语言排序)。 C++ 计算机视觉 CCV —基于C语言/提供缓存/核心的机器视觉库,新颖的机器视觉库 OpenCV—它提供C++, C, Python, Java 以及 MATLA...

2017-04-03 11:05:28 3359 0

原创 pycharm 2017激活码 有效

pycharm 2017激活码 有效 大家都知道,2016版的pycharm激活码都已经失效了, 现在贴出2017版的激活码,亲测有效! 43B4A73YYJ-eyJsaWNlbnNlSWQiOiI0M0I0QTczWVlKIiwibGljZW5zZWVOYW1lIjoibGFuIHl1I...

2017-03-18 21:43:49 15946 1

原创 python机器学习包 Windows下 pip安装 scikit-learn numpy scipy

python机器学习包 Windows10下 pip安装 scikit-learn numpy scipy requirements: ` windows10 ` python2.7 ` pip9.0.1 ` numpy ` scipy ` sklearn 1  pip的安装 1.1  ...

2017-03-18 21:21:33 6953 0

转载 自然语言处理(NLP)四步流程:Embed->Encode->Attend->Predict

过去半年以来,自然语言处理领域进化出了一件神器。此神器乃是深度神经网络的一种新模式,该模式分为:embed、encode、attend、predict四部分。本文将对这四个部分娓娓道来,并且剖析它在两个实例中的用法。 人们在谈论机器学习带来的提升时,往往只想到了机器在效率和准确率方面带给...

2017-03-14 19:42:53 5500 0

原创 python 函数参数:必选参数、默认参数、可变参数、关键字参数 和 命名关键字参数

python 函数参数:必选参数、默认参数、可变参数、关键字参数 和 命名关键字参数 在 Python 中定义函数,可以用必选参数、默认参数、可变参数、关键字参数和命名关键字参数 5种参数形式。 这 5 种参数都可以组合起来使用,但是注意,参数定义的顺序必须是:必选参数、默认参数、可变参数/...

2017-03-04 23:38:02 7548 0

原创 python pandas 报错:TypeError: parser_f() got an unexpected keyword argument 'skip_blank_lines'

python pandas 报错:TypeError: parser_f() got an unexpected keyword argument 'skip_blank_lines' 在用pandas读取csv数据进行处理时,报了个错: pd.read_csv...

2017-03-04 19:24:16 11125 0

原创 ubuntu下 tensorflow 升级到 新版本 0.11.0版本

ubuntu 升级 tensorflow 到 0.11.0版本 之前在ubuntu上安装的比较早的0.8版本的TensorFlow,现在遇到一些库的不兼容问题,所以得升级下tf包。 1:确认最可升级的最高版本【https://www.tensorflow.org/versions/】, 注...

2017-03-04 17:19:58 6354 0

转载 NLP 语料库 大全

此语料库清单包括了中文与英文,大家且看且珍惜…… 国内可用免费语料库(凡没有标注不可用的链接均可用) (一) 国家语委 1.国家语委现代汉语语料库http://www.cncorpus.org/ 现代汉语通用平衡语料库现在重新开放网络查询了。重开后的在线检索速度更快...

2017-03-04 16:46:42 8338 0

原创 PyLearn-Codes Python学习代码 下载 廖雪峰Python教程

PyLearn-Codes Python学习代码 廖雪峰Python教程this is a python learning codes project which was tutorialed by master 廖雪峰(http://www.liaoxuefeng.com/wiki/001431...

2017-02-24 22:21:09 924 0

原创 java 网络爬虫jsoup 抓取全中国 省市县镇村 完整全集信息 代码

java 网络爬虫 抓取全中国 省市县镇村 完整全集信息 代码代码下载地址scofield7419/ChinesePCCTVLocationExtractionChinesePCCTVLocationExtractionThis’s a cool try, budy.Description C...

2017-02-16 21:28:01 2424 1

原创 bat文件·启动程序&打开文件夹

bat文件·启动程序&打开文件夹 不想每次打开机子继续上一次的工作时去手工一个一个滴开启程序和打开文件夹,故想写一个bat双击解决。 1、启动程序: start download.bat: @echo off echo 准备启动Thunder。。。 start /...

2017-02-14 19:17:25 9459 1

原创 path与classpath区别

path与classpath区别 1.path的作用       path是系统用来指定可执行文件的完整路径,即使不在path中设置JDK的路径也可执行JAVA文件,但必须把完整的路径写出来,如C:\Program Files\Java\jdk1.6.0_10...

2017-02-07 13:51:39 356 0

原创 基于Android 精简版 Bluetooth 蓝牙 聊天 源码下载

Android Chat via Bluetooth基于Android的精简版蓝牙聊天室.源码下载地址 (Android-Chat-via-Bluetooth)·需要两个Android设备分别安装本APP. ·设备A、B都要先开启蓝牙. ·选择一个设备充当连接发起者,另一个接受连接. ·一旦双方都...

2017-01-23 14:05:08 611 0

原创 基于Android 精简版 WiFi 聊天 源码下载

Android Chat via WiFi基于Android的精简版WiFi聊天室.源码下载地址 (Android-Chat-via-Bluetooth)·需要两个Android设备分别安装本APP. ·设备A、B都要先开启WiFi. ·选择一个设备充当连接发起者client,另一个接受连接ser...

2017-01-23 14:02:23 899 0

原创 本证方程的本征值 与 特征方程的特征值 的 区别 辨析

本证方程的本征值 与 特征方程的特征值 的 区别 辨析 [原创博客,转载注明出处:] 在本科时候学习线性代数矩阵论时,接触到了特征方程以及特征值这个概念;到了后面学习了数学物理方程以及量子力学时,接触到了本征方程以及本征值的概念。这个时候,我开始对这两对概念产生了某种两者必有联系的想法,现...

2017-01-16 20:41:03 6509 0

原创 Ubuntu安装tensorflow报错:tensorflow-xx.whl not a supported wheel on this platform

解决Ubuntu安装tensorflow报错:tensorflow-0.5.0-cp27-none-linux_x86_64.whl is not a supported wheel on this platform. TensorFlow only be installed under a 64...

2017-01-08 17:18:39 17667 5

原创 ERP生产线管理系统 with WAMP

MyERPERP生产线管理系统 with WAMP这个”MyERP”是之前个人第一次基于wamp用PHP写的一个ERP生产线管理系统.有关于ERP系统的理论,请点击ERP系统MyERP,made by Scofield.Phil源码地址:MyERPThis is an ERP system cod...

2016-09-22 21:50:32 1234 0

原创 Android 音乐播放器 源码 下载 高仿魅族系统音乐播放器

Android音乐播放器 仿魅族系统音乐播放器款式”Scott’Droid”Android music player. 炫酷黑. 一个精简至极的android music player.全程模仿flyme5.0音乐播放器款式Android版音乐播放器,made by Scofield.Phil...

2016-09-22 17:31:16 2536 0

原创 文件系统之 簇&块

文件系统之 簇&块 〇、扇区的管理     扇区是磁盘最小的物理存储单元,一般而言是512kb大小每个扇区,但是操作通常不直接管理每一个扇区,而是通过将若干个扇区组成的一个更大的集合来去进行操作管理。     这个比扇区更大的集合,在Windows...

2016-09-20 17:21:40 5254 1

原创 c、 c++、 java 基本数据类型 对比辨析

c、 c++、 java 基本数据类型 对比辨析 一、java      1.数据类型表 二、C++      1.数据类型表 一、C      1.数据类型表

2016-09-19 22:25:43 723 0

转载 web网站架构演变过程

web网站架构演变过程 前言      我们以javaweb为例,来搭建一个简单的电商系统,看看这个系统可以如何一步步演变。     该系统具备的功能:   用户模块:用户注册和管理商品模块:商品展示和管理交易模块:创建交易和管理    阶段一、单机构建网站   网站的初期,我们...

2016-09-18 20:50:06 749 0

原创 Nginx搭建之正向代理与反向代理辨析

Nginx搭建之正向代理与反向代理辨析 一、正向代理 1.概念 正向代理 是一个位于客户端和原始服务器(origin server)之间的服务器,为了从原始服务器取得内容,客户端向代理发送一个请求并指定目标(原始服务器),然后代理向原始服务器转交请求并将获得的内容返回给客户端。客户端必须要进...

2016-09-18 20:33:07 611 0

原创 java之面向对象——继承、封装、多态

java之面向对象——继承、封装、多态 一、封装:   封装是实现面向对象程序设计的第一步,封装就是将数据或函数等集合在一个个的单元中(我们称之为类)。被封装的对象通常被称为抽象数据类型。    封装的意义: 封装的意义在于保护或者防止代码(数据)被我们无意中破...

2016-09-17 20:21:16 348 0

原创 常用正则表达式实例

常用正则表达式实例 非负整数:^\d+$   正整数:^[0-9]*[1-9][0-9]*$   非正整数:^((-\d+)|(0+))$   负整数:^-[0-9]*[1-9][0-9]*$   整数:^-?\d+$   非负浮点数:^\d+(\.\d+)?$ ...

2016-09-17 20:12:19 1322 0

原创 彩虹七色的RGB值

彩虹七色的RGB值 16进制码: 红色 #FF0000 橙色 #FF7F00 黄色 #FFFF00 绿色 #00FF00 青色 #00FFFF 蓝色 #0000FF 紫色 #8B00FF RGB值: 赤色 【RGB】255, ...

2016-09-17 20:07:53 7283 0

转载 理解矩阵

理解矩阵 一年前看过一篇非常关于线性代数的矩阵的博客,这边文章对我影响挺大的,至少改变了我对矩阵的认识,让我在量子力学课程、图像处理课程上有了更理性的认识!现在我把这个文章分享出来。 ···············································...

2016-09-17 19:59:12 496 0

原创 open GL 、DirectX、open CV、 open Inventor 、cocos2dx、unity3d、3dmax辨析

open GL 、DirectX、open CV、 open Inventor 、cocos2dx、unity3d、3dmax辨析 一、open GL 、DirectX      open GL是一个非常底层的框架,相当于“面向过程的语言”,其他的东西就是基于他...

2016-09-17 19:56:28 1727 0

提示
确定要删除当前文章?
取消 删除