2017年09月_Hearthougan

09月 08月 07月 06月 05月 03月 02月 01月

原创隐马尔科夫模型前向后向算法

本文是自己学习隐马尔科夫模型的一个总结，为了自己以后方便查阅，也算作是李航老师的《统计学习方法》的一个总结，若有疑问，欢迎讨论。推荐阅读知乎上Yang Eninala写的《如何用简单易懂的例子解释隐马尔可夫模型？》，写的非常好。我会联系两者，来作为自己的一篇学习笔记。隐马尔可夫模型：隐马尔可夫模型是关于时序的概率模型，描述由一个隐藏的马尔可夫链随机生成不可观测的状态随机序列，再由各个状态生成一个

2017-09-13 12:09:56 4536

条件熵：H(Y|X)表示在已知随机变量X的条件下，随机变量Y的不确定性，H(Y|X)定义为：举个例子：有一堆西瓜，已知这堆西瓜的色泽，以及每种色泽对应好瓜和坏瓜的个数，如下所示，设X表示色泽，Y表示好瓜或者坏瓜。则：这个例子就是计算条件熵的一个过程，现在证明条件熵公式：有很多书上的条件熵是这么定义的，如果继续化简就可以得到我们上面定义的条件熵，接着化简：得证！信息增益：，表示X出现后随机变量Y的不

2017-09-07 22:13:40 5634 1

原创彻底理解样本方差为何除以n-1

设样本均值为，样本方差为，总体均值为，总体方差为，那么样本方差有如下公式：很多人可能都会有疑问，为什么要除以n-1，而不是n，但是翻阅资料，发现很多都是交代到，如果除以n，对样本方差的估计不是无偏估计，比总体方差要小，要想是无偏估计就要调小分母，所以除以n-1，那么问题来了，为什么不是除以n-2、n-3等等。所以在这里彻底总结一下，首先交代一下无偏估计。无偏估计以例子来说明，假如你

2017-09-06 00:10:35 212116 103

原创如何理解用信息熵来表示最短的平均编码长度

之前弄明白了信息熵是什么，由于信息熵来源于信息论，要怎么才能跟编码联系起来呢？这个问题当时没有想明白，今天查了一下资料，理解了一下，做笔记整理一下，如有错误欢迎指正。如果信息熵不明白的请看这里：http://blog.csdn.net/hearthougan/article/details/76192381首先给出结果：最短的平均编码长度 = 信源的不确定程度 / 传输的表达能力。其中信源的不确定

2017-09-01 23:27:31 12873 5

xshell+xftp免费版

之前上传的那个xshell+xftp没办法使用了，所以又重新上传了一个，亲测可用

2019-01-12

图像的风格迁移

风格迁移示例，仅作为学习下载，有需要的请自行下载。

2018-12-18

keras2.0中文文档高清带书签.pdf

最新keras2.0中文文档，高清，带书签，有需要的自行下载。

2018-12-08

从Word Embedding到Bert模型—自然语言处理中的预训练技术发展史

从Word Embedding到Bert模型—自然语言处理中的预训练技术发展史，用于资料备份，便与查阅。

2018-11-19

word2vec系列资料

仅用于资料备份，便与查阅。 word2vec 中的数学原理详解.pdf Word2Vec-语言模型的前世今生PDF word2vec Parameter Learning Explained.pdf

2018-11-19

word2vec 中的数学原理详解

PDF出处：https://blog.csdn.net/itplus/article/details/37969519，本着查阅方便，无法设置免积分下载，有需要的请自行下载

2018-11-01

CRF++0.58-Linux+Windows

CRF++0.58-Linux+Windows，里面包含了Linux版CRF++-0.58.tar.gz，和Windows版CRF++-0.58.rar，这两个版本本，亲自测试可用，有需要请自行下载。

2018-09-29

npp++32位+NPPTextFx.dll

npp++ 32位，从官网下载的，因为处理文本需要，TextFx插件，但是这个插件只支持32位的。该压缩包包含： npp++ 32位 PluginManager TextFX.v0.26.unicode.bin

2018-09-27

李航-《统计学习方法》高清完整版（带书签）

之前积分被修改的太高了，重新传一次吧，《统计学习方法》是计算机及其应用领域的一门重要的学科。《统计学习方法》全面系统地介绍了统计学习的主要方法，特别是监督学习方法，包括感知机、k近邻法、朴素贝叶斯法、决策树、逻辑斯谛回归与最大熵模型、支持向量机、提升方法、EM算法、隐马尔可夫模型和条件随机场等。除第1章概论和最后一章总结外，每章介绍一种方法。叙述从具体问题或实例入手，由浅入深，阐明思路，给出必要的数学推导，便于读者掌握统计学习方法的实质，学会运用。为满足读者进一步学习的需要，书中还介绍了一些相关研究，给出了少量习题，列出了主要参考文献。

2018-09-17

中文同义词词库-同义词词库-access版本

中文同义词词库-同义词词库-access版本有需要的请自行下载

2018-09-15

自用xshell软件

XshellXftpPortable 备份一份软件，以供以后使用方便。

2018-09-03

LDA数学八卦-带书签

讲解LDA模型，相当经典的文档，里面的数学推理严谨。自制书签，方便查阅。有需要的自行下载。

2018-08-30

数论概论第三版（中文）

《数论概论》是2008年机械工业出版社出版的图书，作者是JosephH.Silverman。本书介绍了有关数论大量的知识，以及数论的一般方法和应用等.

2018-08-29

Stanford NLP note - Christopher Manning教授-完整吧

之前的少了几章，这个是完整版。授课老师是大名鼎鼎的Christopher Manning教授，他是两本书的第一作者：一本是《统计自然语言处理基础》（Foundations of Statistical Natural Language Processing），另一本是《信息检索导论》（Introduction to Information Retrieval），都是相应领域的入门经典。

2018-08-08

Stanford NLP note - Christopher Manning教授

授课老师是大名鼎鼎的Christopher Manning教授，他是两本书的第一作者：一本是《统计自然语言处理基础》（Foundations of Statistical Natural Language Processing），另一本是《信息检索导论》（Introduction to Information Retrieval），都是相应领域的入门经典。

2018-08-08

21天学通Java-第7版-超清带书签.pdf

《21天学通Java》是超清晰版本，带书签，压缩包内还有一个第6版，有需要的请自行下载。《21天学通Java:20小时多媒体语音视频教学》是Java语言的入门教程，由浅入深，循序渐进地讲授如何使用Java语言进行程序开发。全书内容包括Java开发环境、Java基本语法知识、Java面向对象特点、Java界面开发，以及Java数据库开发和网络编程开发。为了便于读者学习，《21天学通Java》最后一章对一个完整学生管理系统进行了分析。具体讲解了学生模块和老师模块，以及其他各个模块的功能分析。《21天学通Java》旨在为Java语言的初学者和大中专学生提供易于入门，便于全面了解和掌握Java编程技术的教辅资料，同时对有一定经验的Java编程者和学习者也有一定的参考价值。《21天学通Java》附赠DVD光盘1张，内容包括超大容量手把手视频、电子教案（PPT）、编程参考宝典电子书、源代码及各章习题答案。

2018-07-27

计算机统计自然语言处理PDF

哈工大关毅老师主编的教材，pdf，我自己简答插了书签，有需要的请自行下载。本书分为基础、原理和应用3个篇章。基础篇论述了自然语言处理技术的数学基础和中文语言处理特有的自动分词技术; 原理篇论述了基于统计和基于语言学规则的语言处理技术的基本原理; 应用篇论述了在音字转换、自动文摘、信息检索、手写体识别等应用领域中的实用语言处理方法。

2018-07-26

统计自然语言处理基础PDF（中英文-带书签）

统计自然语言处理基础PDF，包含中英文两版，带书签。统计自然语言处理第二版宗成庆。有需要的请自行下载。

2018-07-25

pytorch+cuda9.0

torch-0.3.0.post4-cp27-cp27mu-linux_x86_64.whl 官网总是打不开，再次备份一份，有需要的请自行下载

2018-04-10

Tensorflow 实战Google深度学习框架-清晰-带书签

TensorFlow是谷歌2015年开源的主流深度学习框架，目前已在谷歌、优步（Uber）、京东、小米等科技公司广泛应用。《Tensorflow实战》为使用TensorFlow深度学习框架的入门参考书，旨在帮助读者以最快、最有效的方式上手TensorFlow和深度学习。书中省略了深度学习繁琐的数学模型推导，从实际应用问题出发，通过具体的TensorFlow样例程序介绍如何使用深度学习解决这些问题。《Tensorflow实战》包含了深度学习的入门知识和大量实践经验，是走进这个最新、最火的人工智能领域的首选参考书。

2018-01-17

TensorFlow Machine Learning Cookbook.pdf

Explore machine learning concepts using the latest numerical computing library — TensorFlow — with the help of this comprehensive cookbook About This Book Your quick guide to implementing TensorFlow in your day-to-day machine learning activities Learn advanced techniques that bring more accuracy and speed to machine learning Upgrade your knowledge to the second generation of machine learning with this guide on TensorFlow Who This Book Is For This book is ideal for data scientists who are familiar with C++ or Python and perform machine learning activities on a day-to-day basis. Intermediate and advanced machine learning implementers who need a quick guide they can easily navigate will find it useful. What You Will Learn Become familiar with the basics of the TensorFlow machine learning library Get to know Linear Regression techniques with TensorFlow Learn SVMs with hands-on recipes Implement neural networks and improve predictions Apply NLP and sentiment analysis to your data Master CNN and RNN through practical recipes Take TensorFlow into production In Detail TensorFlow is an open source software library for Machine Intelligence. The independent recipes in this book will teach you how to use TensorFlow for complex data computations and will let you dig deeper and gain more insights into your data than ever before. You’ll work through recipes on training models, model evaluation, sentiment analysis, regression analysis, clustering analysis, artificial neural networks, and deep learning – each using Google’s machine learning library TensorFlow. This guide starts with the fundamentals of the TensorFlow library which includes variables, matrices, and various data sources. Moving ahead, you will get hands-on experience with Linear Regression techniques with TensorFlow. The next chapters cover important high-level concepts such as neural networks, CNN, RNN, and NLP. Once you are familiar and comfortable with the TensorFlow ecosystem, the last chapter will show you how to take it to production. Style and approach This book takes a recipe-based approach where every topic is explicated with the help of a real-world example.

2018-01-17

Automatic Speech Recognition A Deep Learning Approach

解析深度学习-语音识别实践-英文版，没有找到中文版的

2017-11-07

最大熵模型与自然语言处理

最大熵模型与自然语言处理.有需要的请自行下载。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。

2017-09-01

Baum-Welch

Baum-Welch,隐马尔可夫学习算法，自己备份。

2017-08-29

Deep Learning for Hybrid Unit Selection Synthesis - Apple

TTS，语音合成

2017-08-24

google-chrome-stable_current_amd64.deb

google浏览器需要的，请自行下载。

2017-08-11

Speech_Synthesis_Paul_Taylor.pdf

Speech Synthesis Paul Taylor.

2017-07-28

cudnn 5.1 for CUDA 8.0 Linux

cuDNN v5.1 Library for Linux. cuDNN v5.1 (Jan 20, 2017), for CUDA 8.0。

2017-07-05

Speech_Synthesis_Paul_Taylor

TTs

2017-06-17

matplotlib tutorial-(原版）

matplotlib tutorial，matplotlib教程，英文版，需要的自行下载

2017-03-27

机器学习.算法原理与编程实践+代码

机器学习.算法原理与编程实践，加代码，有需要的，自行下载。

2017-03-20

鱼c小甲鱼零基础学python全套课后题

前50课，需要的自行下载

2017-03-16

Scikit-learn 使用手册中文高清完整版.pdf

Scikit-learn 使用手册中文版，有需要的自行下载。

2017-03-09

scikit-learn.user_guide

scikit-learn.user_guide，英文版

2017-03-09

李宏毅一天搞懂深度学习.ppt版下载

本文是2016 台湾资料科学年会前导课程“一天搞懂深度学习”的全部讲义PPT（共268页），由台湾大学电机工程学助理教授李宏毅主讲。作者在文中分四个部分对神经网络的原理、目前存在形态以及未来的发展进行了介绍。深度学习的每一个核心概念在文中都有相关案例进行呈现，通俗易懂。一天的时间搞懂深度学习？其实并不是没有可能。需要的，请自行下载

2017-02-23

算法导论第三版答案（完整版）

网上的算法导论（第三版）答案都不完整，这个是完整版答案，分每章一个单独pdf格式的文件，易于查阅。有需要的请自行下载。

2017-01-11

李航博士《统计学习方法》课件

清华大学深圳研究生院的袁春老师为《统计学习方法》一书制作了完整的课件。感谢袁老师，同时推荐大家使用。

2016-11-13

机器学习实战（中文带书签+英文+源代码）

本书第一部分主要介绍机器学习基础，以及如何利用算法进行分类，并逐步介绍了多种经典的监督学习算法，如k近邻算法、朴素贝叶斯算法、Logistic回归算法、支持向量机、AdaBoost集成方法、基于树的回归算法和分类回归树（CART）算法等。第三部分则重点介绍无监督学习及其一些主要算法：k均值聚类算法、Apriori算法、FP-Growth算法。第四部分介绍了机器学习算法的一些附属工具。

2016-10-26

《机器学习》----[Tom M. Mitchell]--带书签

《机器学习》展示了机器学习中核心的算法和理论，并阐明了算法的运行过程。《机器学习》综合了许多的研究成果，例如统计学、人工智能、哲学、信息论、生物学、认知科学、计算复杂性和控制论等，并以此来理解问题的背景、算法和其中的隐含假定。《机器学习》可作为计算机专业本科生、研究生教材，也可作为相关领域研究人员、教师的参考书。

2016-10-16

《统计学习方法》李航-带书签高清完整PDF版

《统计学习方法》是计算机及其应用领域的一门重要的学科。《统计学习方法》全面系统地介绍了统计学习的主要方法，特别是监督学习方法，包括感知机、k近邻法、朴素贝叶斯法、决策树、逻辑斯谛回归与最大熵模型、支持向量机、提升方法、EM算法、隐马尔可夫模型和条件随机场等。除第1章概论和最后一章总结外，每章介绍一种方法。叙述从具体问题或实例入手，由浅入深，阐明思路，给出必要的数学推导，便于读者掌握统计学习方法的实质，学会运用。为满足读者进一步学习的需要，书中还介绍了一些相关研究，给出了少量习题，列出了主要参考文献。