2017年07月_NLP工程化

12月 11月 10月 09月 08月 07月 06月 05月 04月 03月 02月 01月

原创 Maven和SBT学习日记1

1. Maven常用命令（1）创建Maven的Java项目mvn archetype:generate -DgroupId={project-packaging} -DartifactId={project-name}-DarchetypeArtifactId=maven-archetype-quickstart -DinteractiveMode=false（2）启动Tomcat服务

2017-07-26 23:25:33 556

原创自然语言处理学习日记1

1. Stanford CoreNLP解析：tokenize，cleanxml，ssplit，pos，lemma，ner，regexner，sentiment，truecase，parse，depparse，dcoref，relation，natlog，quote。2. NLTK[Natural Language Toolkit]解析：NLTK是一个开源的自然语言处理工具包，包含...

2017-07-25 17:12:22 2498

原创 TensorFlow学习日记7

1. tf.layers.average_pooling3d解析：average_pooling3d(inputs, pool_size, strides, padding='valid', data_format='channels_last',name=None)：Average pooling layer for 3D inputs (e.g. volumes).

2017-07-21 12:51:20 1258

原创 Git学习日记3

1. git fetch [remote-name]解析：从远程仓库中拉取所有本地仓库中没有的数据，然后可以在本地访问远程仓库中的所有分支，可将其中某个分支合并到本地。说明：git fetch origin master:temp：从远程的origin仓库的master分支下载到本地并新建一个分支temp。2. git fetch origin解析：拉取从上次克隆以来别人上......

2017-07-20 11:29:42 513

原创 TensorFlow学习日记6

1. tf.test.main解析：main(argv=None)：Runs all unit tests.2. tf.test.TestCase解析：import tensorflow as tf class SquareTest(tf.test.TestCase): def testSquare(self): with se

2017-07-19 16:48:11 5910

原创 TensorFlow学习日记5

1. TensorFlow可视化TensorFlow的工作方式是启动一个Web服务，该服务进程从TensorFlow程序执行所得的事件日志文件（event files）中读取概要（summary）数据，然后将数据在网页中绘制成可视化的图标。概要数据包括几种类别，如下所示：（1）标量数据：比如准确率、代价损失值，使用tf.summary.scalar加入记录算子。（2）参数数据：比如参数...

2017-07-18 23:46:19 1360

原创 Python与机器学习4

1.SMOTE过采样算法解析：SMOTE算法思想是合成新的少数类样本，合成的策略是对每个少数类样本a，从它的最近邻中随机选一个样本b，然后在a、b之间的连线上随机选一点作为新合成的少数类样本。2.DBSCAN解析：DBSCAN（Density-Based Spatial Clustering of Applications with Noise，具有噪声的基于密度的聚类方法...

2017-07-17 21:25:58 536

原创 TensorFlow学习日记4

1. RNN结构解析：（1）one to one表示单输入单输出网络。这里的但输入并非表示网络的输入向量长度为1，而是指数据的长度是确定的。比如输入数据可以是一个固定类型的数，可以是一个固定长度的向量，或是一个固定大小的图片。同理，模型输出规模也是确定的。传统神经网络和CNN都可以理解为是这种形式的结构。（2）one to many表示定长输入变长输出的网络结构。以单词释义问题

2017-07-17 16:30:03 8145

原创 TensorFlow学习日记3

1. tf.reduce_prod解析：Computes the product of elements across dimensions of a tensor.2. tf.reduce_sum解析：Computes the sum of elements across dimensions of a tensor.3. TensorFlow中的Graph对

2017-07-12 00:11:28 1184

原创 TensorFlow学习日记2

1. tf.app.run()解析：TensorFlow提供的一个主程序入口，tf.app.run()会调用定义的main函数。2. tf.group3. tf.control_dependencies4. tf.no_op5. tf.cast6. tf.get_variable7. tf.variable_scope

2017-07-09 18:33:26 708

人工智能干货推荐.txt

免费送1000+本人工智能电子书，将近20G人工智能干货资料。包括[01]Python书籍_183；[02]机器学习书籍_144；[03]数据挖掘书籍_86；[04]自然语言处理书籍_72；[05]计算机视觉书籍_83；[06]深度学习书籍_93；[07]强化学习书籍_19；[08]语音技术书籍_19；[09]大数据书籍_49；[10]人工智能商业报告_295

2019-06-20

flasky.zip

绝对多数的网站或APP都需要对用户进行认证，包括用户注册、用户登录、邮件确认、修改密码、修改邮箱等功能。有的还需要绑定手机号码，或者使用微信等第三方账号进行登录。该代码是基于Flask实现社交博客程序的用户认证部分。

2019-05-29

TextCNN的TensorFlow实现

TextCNN的核心点在于可以捕获信息的局部相关性，具体到文本分类任务中可以利用CNN来提取句子中类似N-Gram的关键信息。

2019-01-24

TextRNN的TensorFlow实现

TextCNN擅长捕获更短的序列信息，但是TextRNN擅长捕获更长的序列信息。具体到文本分类任务中，BiLSTM从某种意义上可以理解为可以捕获变长且双向的N-Gram信息。

2019-01-24

VGGNet和GoogLeNet等网络都表明有足够的深度是模型表现良好的前提，但是在网络深度增加到一定程度时，更深的网络意味着更高的训练误差。误差升高的原因是网络越深，梯度弥散[还有梯度爆炸的可能性]的现象就越明显，所以在后向传播的时候，无法有效的把梯度更新到前面的网络层，靠前的网络层参数无法更新，导致训练和测试效果变差。所以ResNet面临的问题是怎样在增加网络深度的情况下有可以有效解决梯度消失的问题。ResNet中解决深层网络梯度消失的问题的核心结构是残差网络。

2019-01-22

ResNet的TensorFlow实现

2019-01-22

LinkQueue.cpp

2014-11-10

二叉树顺序存储结构的基本操作

http://blog.csdn.net/ssw_1990/article/details/40511665代码。

2014-11-08

apache-ant-1.8.3-bin.tar

Ant是一个Apache基金会下的跨平台的构件工具，它可以实现项目的自动构建和部署等功能。在本文中，主要让读者熟悉怎样将Ant应用到Java项目中，让它简化构建和部署操作。

2014-11-02

概率与计算

《概率与计算》详细地介绍了概率技术以及在概率算法与分析发展中使用过的范例。《概率与计算》分两部分，第一部分介绍了随机抽样、期望、马尔可夫不等式、切比雪夫不等式、切尔诺夫界、球和箱子模型、概率技术和马尔可夫链等核心内容。第二部分主要研究连续概率、有限独立性的应用、熵、马尔可夫链蒙特卡罗方法、耦合、鞅和平衡配置等比较高深的课题。《概率与计算》适合作为高等院校计算机科学和应用数学专业高年级本科生与低年级研究生的教材，也适合作为数学工作者和科技人员的参考书。

2014-08-21

Git-1.9.4-preview20140611.exe

Git是用于Linux内核开发的版本控制工具。与CVS、Subversion一类的集中式版本控制工具不同，它采用了分布式版本库的作法，不需要服务器端软件，就可以运作版本控制，使得源代码的发布和交流极其方便。

2014-07-15

python-delicious-master

使用此组件，可以操作delicious。同时，分析源码也可以学习python。http://blog.csdn.net/ssw_1990/article/details/27341239

2014-05-28

menagerie-db.rar

mysql 5.1参考手册中使用的动物园数据库。

2014-05-08

macrodata数据集

利用Python进行数据分析，macrodata数据集。

2014-04-15

小费数据集

利用Python进行数据分析，小费数据集。

2014-04-15

ipython_bug.py

一个含有bug的python文件，主要是通过这个文件，学习ipython中ipdb的使用。

2014-04-07

MySQL源码分析整理

为了实现MySQL的更高级别的性能调优，我们通常需要理解其内部实现机制，并对其进行优化调试。在下面的系列中，我们会分别介绍MySQL的部分内部实现机制。

2013-05-08

JavaScript权威指南

Javascript是一种由Netscape的LiveScript发展而来的原型化继承的面向对象的动态类型的区分大小写的客户端脚本语言，主要目的是为了解决服务器端语言，比如Perl，遗留的速度问题，为客户提供更流畅的浏览效果。当时服务端需要对数据进行验证，由于网络速度相当缓慢，只有28.8kbps，验证步骤浪费的时间太多。于是Netscape的浏览器Navigator加入了Javascript，提供了数据验证的基本功能。

2013-03-22

Proteus入门教程

本书将简单介绍一下Proteus的使用。在这里，我用的Proteus版本是Proteus 6.7 sp3 Professional。

2013-03-11

知者无畏：一个真实的病毒世界

谈起电脑病毒，广大的读者恐怕都有谈虎色变的感觉，不知道这东西到底躲在什么地方，也不知道它们会对自己做些什么。不知道有谁说过这样一句话“无知者无畏”，我觉得真实情况恰恰相反，真正无畏的人只能是拥有了足够知识的人。人心中最大的恐惧就是对未知的恐惧，恐怖片之所以恐怖，是因为你不知道下面将要发生什么；电脑病毒之所以恐怖，也正是因为你不知道它们是什么，它们能做什么。而在电脑病毒这样一个迫切需要知识的领域，真正专业性的书籍很少，仅有的一些书，不是从哗众取宠的目的出发，拼凑一些骇人听闻的病毒／黑客故事，就是非常简单和粗浅的对80年代的病毒进行教科书似的描述。缺少具有专业性和权威性的著作，对于一些新的病毒和反病毒技术，象VBScript病毒、因特网蠕虫等，更是缺少足够的论述。

2013-03-10

MFC类库详解MFC类库详解

MFC类库详解MFC类库详解MFC类库详解MFC类库详解

2010-09-18

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人