自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Mr.Scofield

RxNLP.

  • 博客(102)
  • 资源 (1)
  • 收藏
  • 关注

原创 DeepNLP的表示学习·词嵌入来龙去脉·深度学习(Deep Learning)·自然语言处理(NLP)·表示(Representation)

DeepNLP的表示学习·词嵌入来龙去脉·深度学习(Deep Learning)·自然语言处理(NLP)·表示(Representation)词向量、word embedding、分布式表示、word2vec、glove 术语解释!自然语言处理表示学习词向量、word2vec无门槛理解! 其实顺便分享下,在我个人的方法论思维中,一个带有完整上下文以及结构构建良好的知识框架,在某种程度上,比一些细枝末节的详细知识点来的重要的多了!因为,一旦构建了一个完备的知识结构框架,那么剩下你要做的是将一些零零碎

2017-04-04 20:48:33 34302 32

原创 来扯扯分布式数据库系统DDBS设计啊

我来扯扯分布式数据库系统DDBS的设计注明:本文只是在完成一个高级数据库作业的文章,不能算是正儿八经登堂入室的paper,所以,不负责任哈,带坏小朋友不要找我哦 ^_~转载注明出处:Scofield's blog[  http://blog.csdn.net/scotfield_msn  ]一、   引入目前本人所确定的研究方向是自然语言处理、文本挖掘,实际

2017-03-04 21:01:41 3260

原创 TensorFlow RNN深度学习 BiLSTM+CRF 实现 sequence labeling 序列标注 源码

在TensorFlow (RNN)深度学习下 BiLSTM+CRF 跑 sequence labeling 双向LSTM+CRF跑序列标注问题去年底样子一直在做NLP相关task,是个关于序列标注问题。这 sequence labeling属于NLP的经典问题了,开始尝试用HMM,哦不,用CRF做baseline,by the way, 用的CRF++。关于CRF的理论就不再啰

2017-03-04 20:32:54 45065 5

原创 深度学习DeepLearning推荐论文清单 初学者入门推荐学习路线

深度学习DeepLearning papers初学者入门推荐学习论文清单(供下载)—————————————每一位DL初学者都想找到一条卓有成效的学习路线,我推荐的是沿着历史发展路线将前辈们的经典papers一一读一遍。所以有的兄弟已经做好了工作了:这里有位仁兄的(Deep Learning Papers Reading Roadmap就归纳了还比较齐全的paper清单。里面提供了下载器,但限于TGW的

2017-01-08 01:01:17 20828 1

原创 概率图模型学习笔记:HMM、MEMM、CRF

概率图模型学习笔记:HMM、MEMM、CRF原创博客,转载请注明出处。From Scofield. RxNLP一、Preface二、Prerequisite    2.1 概率图         2.1.1 概览         2.1.2 有向图 vs. 无向图         2.1.3 马尔科夫假设&马尔科夫性     2.2 判别式模型 vs.

2018-01-29 15:00:57 7672 2

原创 各框架下(tensorflow, pytorch, theano, keras)实现几个基础结构神经网络(mlp, autoencoder, CNNs, recurrent, recursive)

学习笔记:各大神经网络框架下(tensorflow, pytorch, theano, keras)实现几个基础结构神经网络(mlp, autoencoder, CNNs, recurrentNN, recursiveNN)several basic neural networks[mlp, autoencoder, CNNs, recurrentNN, recursiveNN] impl

2018-01-19 16:09:43 8094 2

原创 scrapy爬取酒店评论数据

scrapy爬取酒店评论数据代码 here:GitHub:scrapy_hotel_review采用scrapy爬取酒店评论数据。总共有28W条记录。做某NLP任务,需要一些hotel reviews, 选择从www.booking.com搞一点数据来。 根据主页显示总共有20个城市from diferrent countries,每个城市下有若干个酒店,每个酒店下若干条评论

2018-01-19 15:35:08 4611 3

原创 NLP 工具包 大调查 自然语言处理工具包合集

NLP 工具包 大调查 自然语言处理工具包合集                可以想一想,如何你把NLP领域的所有的工具都能掌握的数如家珍,是不是很NB?必然的。                只用过这里面的一部分。。。                这份调查是基于使用语言差别来归纳的,别问我什么这么分类哈。。。一、多语言多环境编译1、THULA

2017-06-07 23:06:18 7125

原创 NLP 主题抽取 Topic LDA代码实践 gensim包 代码

NLP 主题抽取Topic LDA代码实践 gensim包 代码        分享一个代码实践:用gensim包的LDA模型实践NLP的一个典型任务,主题抽取。        顺带提一点,对于NLP任务,最好的方式就是先在代码上跑通起来,然后再进行理论深究,最后自己实现DIY学习模型算法框架。        顺带再提一点,跑通NLP或者ML任务,推荐在Python下用

2017-06-07 22:49:13 10167

原创 数据挖掘 NLP 之 文本挖掘 文本处理 通用流程

数据挖掘 NLP 之 文本挖掘 文本处理 通用流程  数据挖掘中的文本挖掘不论是对于企业应用,还是研究者工作,或者是参与数据竞赛项目,都是基础的工作。通过前面的一些实践工作,现总结出文本挖掘文本处理的通用流程。注意,这里的文本挖掘任务主要指的是如文本分类、文本聚类、信息抽取、情感分类等等的常规NLP问题。一、获取语料获取文本语料通

2017-06-07 22:18:52 14893

原创 从不同角度看机器学习的几种学习方式

从不同角度看机器学习的几种学习方式:1、在线学习与离线学习offline learning and online learning. In offline learning, the whole training data must be available at the time of model training. Only when training is c

2017-04-27 20:11:22 8124

原创 机器学习 数据挖掘 数据集划分 训练集 验证集 测试集

机器学习之数据集划分: 训练集 验证集 测试集Q:将数据集划分为测试数据集和训练数据集的常用套路是什么呢?A:three ways shown as follow:1.像sklearn一样,提供一个将数据集切分成训练集和测试集的函数:默认是把数据集的75%作为训练集,把数据集的25%作为测试集。2.交叉验证(一般取十折交叉验证:10-fold

2017-04-10 12:40:59 12740 1

原创 《数学之美》知识点详细总结

《数学之美》知识点详细总结From`RxNLP`Scofield未完待续         《数学之美》这本书在本科期间电子版上偶尔进行了翻阅,后来有时间了就完整的进行了阅读。出于老习惯,看完一本书后总会去总结书本的知识点层次框架,以更好地融入到原有的框架中。尤其是现入坑NLP,作为入门书,更应是好好吸收下。        评价:1、整本书的知识广度大于深度,

2017-04-05 17:15:32 5937

转载 [转发]机器学习资源大全

机器学习资源大全本列表选编了一些机器学习领域牛B的框架、库以及软件(按编程语言排序)。C++计算机视觉CCV —基于C语言/提供缓存/核心的机器视觉库,新颖的机器视觉库OpenCV—它提供C++, C, Python, Java 以及 MATLAB接口,并支持Windows, Linux, Android and Mac OS操作系统。

2017-04-03 11:05:28 3595

原创 python机器学习包 Windows下 pip安装 scikit-learn numpy scipy

python机器学习包 Windows10下 pip安装 scikit-learn numpy scipyrequirements:` windows10` python2.7` pip9.0.1` numpy` scipy` sklearn1  pip的安装1.1  下载pip下载地址是:https://pypi.python.

2017-03-18 21:21:33 7567

转载 自然语言处理(NLP)四步流程:Embed->Encode->Attend->Predict

过去半年以来,自然语言处理领域进化出了一件神器。此神器乃是深度神经网络的一种新模式,该模式分为:embed、encode、attend、predict四部分。本文将对这四个部分娓娓道来,并且剖析它在两个实例中的用法。人们在谈论机器学习带来的提升时,往往只想到了机器在效率和准确率方面带给人们的提升,然而最重要的一点却是机器学习算法的通用性。如果你想写一段程序来识别社交媒体平台上的侮辱性帖

2017-03-14 19:42:53 6472

原创 python 函数参数:必选参数、默认参数、可变参数、关键字参数 和 命名关键字参数

python 函数参数:必选参数、默认参数、可变参数、关键字参数 和 命名关键字参数在 Python 中定义函数,可以用必选参数、默认参数、可变参数、关键字参数和命名关键字参数 5种参数形式。这 5 种参数都可以组合起来使用,但是注意,参数定义的顺序必须是:必选参数、默认参数、可变参数/命名关键字参数和关键字参数。def f1(a,b,c=0,*args,**kw)

2017-03-04 23:38:02 8368

原创 python pandas 报错:TypeError: parser_f() got an unexpected keyword argument 'skip_blank_lines'

python pandas 报错:TypeError: parser_f() got an unexpected keyword argument 'skip_blank_lines'在用pandas读取csv数据进行处理时,报了个错:pd.read_csv(train_path, delimiter='\t', quoting=csv.QUOTE_NONE, skip_bla

2017-03-04 19:24:16 19772

原创 ubuntu下 tensorflow 升级到 新版本 0.11.0版本

ubuntu 升级 tensorflow 到 0.11.0版本之前在ubuntu上安装的比较早的0.8版本的TensorFlow,现在遇到一些库的不兼容问题,所以得升级下tf包。1:确认最可升级的最高版本【https://www.tensorflow.org/versions/】,注意两点:a).你的平台是cpu 还是gpu    b).官方对应的版本有没有你的cp

2017-03-04 17:19:58 6837

转载 NLP 语料库 大全

此语料库清单包括了中文与英文,大家且看且珍惜……国内可用免费语料库(凡没有标注不可用的链接均可用)(一) 国家语委1.国家语委现代汉语语料库http://www.cncorpus.org/现代汉语通用平衡语料库现在重新开放网络查询了。重开后的在线检索速度更快,功能更强,同时提供检索结果下载。现代汉语语料库在线提供免费检索的语料约2000万字,为分词和词性标注

2017-03-04 16:46:42 11766

原创 PyLearn-Codes Python学习代码 下载 廖雪峰Python教程

PyLearn-Codes Python学习代码 廖雪峰Python教程this is a python learning codes project which was tutorialed by master 廖雪峰(http://www.liaoxuefeng.com/wiki/0014316089557264a6b348958f449949df42a6d3a2e542c000)project

2017-02-24 22:21:09 1226

原创 java 网络爬虫jsoup 抓取全中国 省市县镇村 完整全集信息 代码

java 网络爬虫 抓取全中国 省市县镇村 完整全集信息 代码代码下载地址scofield7419/ChinesePCCTVLocationExtractionChinesePCCTVLocationExtractionThis’s a cool try, budy.Description Complete Chinese location infos in the format of prov

2017-02-16 21:28:01 3291 1

原创 bat文件·启动程序&打开文件夹

bat文件·启动程序&打开文件夹不想每次打开机子继续上一次的工作时去手工一个一个滴开启程序和打开文件夹,故想写一个bat双击解决。1、启动程序:start download.bat:@echo off echo 准备启动Thunder。。。 start /min "" "D:\XXX\Thunder.exe"echo 准备启动百度云。。。

2017-02-14 19:17:25 13825 1

原创 path与classpath区别

path与classpath区别1.path的作用     path是系统用来指定可执行文件的完整路径,即使不在path中设置JDK的路径也可执行JAVA文件,但必须把完整的路径写出来,如C:\Program Files\Java\jdk1.6.0_10\bin\javac TheClass.java。path是用来搜索所执行的可执行文件路径的,如果执行

2017-02-07 13:51:39 501

原创 基于Android 精简版 Bluetooth 蓝牙 聊天 源码下载

Android Chat via Bluetooth基于Android的精简版蓝牙聊天室.源码下载地址 (Android-Chat-via-Bluetooth)·需要两个Android设备分别安装本APP.·设备A、B都要先开启蓝牙.·选择一个设备充当连接发起者,另一个接受连接.·一旦双方都同意了,便开始进入聊天室.Scofield.PhilEmail: [email protected]

2017-01-23 14:05:08 896

原创 基于Android 精简版 WiFi 聊天 源码下载

Android Chat via WiFi基于Android的精简版WiFi聊天室.源码下载地址 (Android-Chat-via-Bluetooth)·需要两个Android设备分别安装本APP.·设备A、B都要先开启WiFi.·选择一个设备充当连接发起者client,另一个接受连接server.·一旦双方都同意了,便开始进入聊天室.Scofield.PhilEmail: feish74

2017-01-23 14:02:23 1124

原创 本证方程的本征值 与 特征方程的特征值 的 区别 辨析

本证方程的本征值 与 特征方程的特征值 的 区别 辨析[原创博客,转载注明出处:]在本科时候学习线性代数矩阵论时,接触到了特征方程以及特征值这个概念;到了后面学习了数学物理方程以及量子力学时,接触到了本征方程以及本征值的概念。这个时候,我开始对这两对概念产生了某种两者必有联系的想法,现在现在就来挖挖。一、概念对比1.特征方程以及特征值特征方程(Chara

2017-01-16 20:41:03 16137

原创 Ubuntu安装tensorflow报错:tensorflow-xx.whl not a supported wheel on this platform

解决Ubuntu安装tensorflow报错:tensorflow-0.5.0-cp27-none-linux_x86_64.whl is not a supported wheel on this platform.TensorFlow only be installed under a 64bit platform but not a 32bit machine!亲,TensorFlow是不支持32位机的~

2017-01-08 17:18:39 19036 6

原创 ERP生产线管理系统 with WAMP

MyERPERP生产线管理系统 with WAMP这个”MyERP”是之前个人第一次基于wamp用PHP写的一个ERP生产线管理系统.有关于ERP系统的理论,请点击ERP系统MyERP,made by Scofield.Phil源码地址:MyERPThis is an ERP system coded by PHP with no popular PHP-Framework, which means

2016-09-22 21:50:32 1752

原创 Android 音乐播放器 源码 下载 高仿魅族系统音乐播放器

Android音乐播放器 仿魅族系统音乐播放器款式”Scott’Droid”Android music player. 炫酷黑. 一个精简至极的android music player.全程模仿flyme5.0音乐播放器款式Android版音乐播放器,made by Scofield.Phil源码地址:Scott’Droid一.简介这实在是一个“很久远”的项目了,因为时间的问题,这个项目玩到一

2016-09-22 17:31:16 3505

原创 文件系统之 簇&块

文件系统之 簇&块〇、扇区的管理    扇区是磁盘最小的物理存储单元,一般而言是512kb大小每个扇区,但是操作通常不直接管理每一个扇区,而是通过将若干个扇区组成的一个更大的集合来去进行操作管理。    这个比扇区更大的集合,在Windows下叫做簇;在Linux下叫做块(block)。一、Windows:簇

2016-09-20 17:21:40 15414 1

原创 c、 c++、 java 基本数据类型 对比辨析

c、 c++、 java 基本数据类型 对比辨析一、java     1.数据类型表二、C++     1.数据类型表一、C     1.数据类型表

2016-09-19 22:25:43 971

转载 web网站架构演变过程

web网站架构演变过程前言    我们以javaweb为例,来搭建一个简单的电商系统,看看这个系统可以如何一步步演变。   该系统具备的功能: 用户模块:用户注册和管理商品模块:商品展示和管理交易模块:创建交易和管理  阶段一、单机构建网站  网站的初期,我们经常会在单机上跑我们所有的程序和软件。此时我们使用一个容器,如t

2016-09-18 20:50:06 896

原创 java之面向对象——继承、封装、多态

java之面向对象——继承、封装、多态一、封装:  封装是实现面向对象程序设计的第一步,封装就是将数据或函数等集合在一个个的单元中(我们称之为类)。被封装的对象通常被称为抽象数据类型。   封装的意义:封装的意义在于保护或者防止代码(数据)被我们无意中破坏。在面向对象程序设计中数据被看作是一个中心的元素并且和使用它的函数结合的很密切,从而保护它不被其它的

2016-09-17 20:21:16 512

原创 常用正则表达式实例

常用正则表达式实例非负整数:^\d+$ 正整数:^[0-9]*[1-9][0-9]*$ 非正整数:^((-\d+)|(0+))$ 负整数:^-[0-9]*[1-9][0-9]*$ 整数:^-?\d+$ 非负浮点数:^\d+(\.\d+)?$ 正浮点数 : ^((0-9)+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9

2016-09-17 20:12:19 1497

原创 彩虹七色的RGB值

彩虹七色的RGB值16进制码:红色 #FF0000橙色 #FF7F00黄色 #FFFF00绿色 #00FF00青色 #00FFFF蓝色 #0000FF紫色 #8B00FFRGB值:赤色 【RGB】255, 0, 0 橙色 【RGB】 255, 165, 0  黄色 【RGB】255, 255, 0 

2016-09-17 20:07:53 24513 1

转载 理解矩阵

理解矩阵一年前看过一篇非常关于线性代数的矩阵的博客,这边文章对我影响挺大的,至少改变了我对矩阵的认识,让我在量子力学课程、图像处理课程上有了更理性的认识!现在我把这个文章分享出来。···············································理解矩阵1前不久chensh出于不可告人的目的,要充当老师,教别人线性代数。于是我被揪

2016-09-17 19:59:12 639

原创 open GL 、DirectX、open CV、 open Inventor 、cocos2dx、unity3d、3dmax辨析

open GL 、DirectX、open CV、 open Inventor 、cocos2dx、unity3d、3dmax辨析一、open GL 、DirectX     open GL是一个非常底层的框架,相当于“面向过程的语言”,其他的东西就是基于他的。OpenGL是一个相对底层的框架。解决的是如何使用图形设备进行图形计算的问题。大体会有一系列函数框

2016-09-17 19:56:28 2730

原创 c++ 与 Java 之 红黑树 哈希表 辨析

关于c++ 与 Java 的红黑树 哈希表 红黑树与Hash的区别与选择:权衡三个因素: 查找速度, 数据量, 内存使用,可扩展性,有序性。 hash查找速度会比RB树快,而且查找速度基本和数据量大小无关,属于常数级别;而RB树的查找速度是log(n)级别。并不一定常数就比log(n) 小,hash还有hash函数的耗时,明白了吧,如果你考虑效率,特别是在元素达到一定数量级时,考虑考虑hash。但若你对内存使用特别严格, 希望程序尽可能少消耗内存,那么一定要小心,hash可能会让你陷入尴尬,

2016-09-17 14:04:54 818

原创 通配符与正则表达式

通配符与正则表达式通配符与正则表达式很容易混淆,首先要明白二者是不同的,个人感觉通配符用于Linux的shell命令(如文件名相关操作)中,而正则表达式用于文本内容中的字符串搜索和替换等。通配符是Linux系统本身就支持的,而正则表达式用于vim编辑器或awk程序,这些文本处理工具正是由于支持正则表达式才变得强大。通配符[a-z]或[12]:匹配方括号中指定范围

2016-09-17 14:00:33 650

Vuforia SDK上手指南

qualcomm Vuforia SDK上手指南,开发AR应用指南.

2015-06-19

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除