读书笔记
文章平均质量分 94
煎饼证
法师
展开
-
【笔记】Python自然语言处理实战
文章目录《Python自然语言处理实战》概述NLP基础中文分词规则分词正向最大匹配法(Maximum Match Method, MM法)逆向最大匹配法(Reverse Maximum Match Method, RMM法)双向最大匹配法(Bi-direction Matching method)统计分词N元模型(n-gram model)隐马尔可夫模型(HMM)其他词性标注命名实体识别关键词提取算法TF-IDF算法TextRank算法LSA/LSI/LDALSA/LSI算法LDA算法实践部分句法分析其他T原创 2021-01-31 23:37:27 · 1419 阅读 · 0 评论 -
【统计学习方法】学习笔记-第3章-k近邻法
(知乎:https://zhuanlan.zhihu.com/p/314613894)k近邻法(k-nearest neighbor,k-NN)是一种基本分类和回归方法(这里讨论分类),对于新的实例,根据其k个最近邻的训练实例的类别,通过多数表决等方式预测。k近邻不具有显式的学习过程,是利用训练数据对特征空间进行划分,作为分类模型。k近邻法的三个基本要素——k值选择、距离度量、分类决策规则。3.1 k近邻算法【算法3.1(k近邻法)】当k=1时的特殊情况,称为最近邻算法。3.2 k近邻模原创 2020-11-27 02:09:34 · 331 阅读 · 3 评论 -
【统计学习方法】学习笔记-第2章-感知机
【统计学习方法】学习笔记-第2章-感知机感知机(perceptron)是一种二分类的线性分类模型,对应于输入空间中将实例划分为正负两类的分离超平面,属于判别模型。感知机的学习就是基于误分类的损失函数,利用梯度下降法对损失函数进行极小化,得到线性划分的分离超平面。模型:f(x)=sign(w⋅x+b)f(x)=\text{sign}(w\cdot x+b)f(x)=sign(w⋅x+b)策略:极小化损失函数L(w,b)=−∑xi∈Myi(w⋅xi+b)L(w,b)=-\sum_{x_i \in M}y原创 2020-11-23 03:17:32 · 153 阅读 · 1 评论 -
【统计学习方法】学习笔记-第1章-统计学习及监督学习概论
【知乎:https://zhuanlan.zhihu.com/p/305028771】【统计学习方法】学习笔记-第1章-统计学习及监督学习概论1.1 统计学习统计学习(statistical learning)是关于计算机基于数据构建概率统计模型并运用模型对数据进行预测和分析的一门学科。统计学习也称为统计机器学习(statistical machine learning)赫尔伯特·西蒙(Herbert A.Simon)对“学习”的定义:如果一个系统能够通过执行某个过程改进它的性能,这就是学习统计原创 2020-11-21 23:04:47 · 268 阅读 · 0 评论 -
【笔记】《Python大战机器学习》
简书: 简单的记录,有写于《统计学习方法》中明确的基本知识没记第1章 线性模型第2章 决策树第3章 贝叶斯分类器第4章 k近邻法第5章 数据降维第6章 聚类和EM算法第7章 支持向量机第8章 人工神经网络第9章 半监督学习第10章 集成学习第11章 数据预处理第12章 模型评估、选择与验证第1章 线性模型线性模型的形式:f(x⃗&nb...原创 2018-03-10 21:54:42 · 1020 阅读 · 0 评论 -
【笔记】《大话数据结构》
写在前面第1章 数据结构绪论第2章 算法第3章 线性表第4章 栈与队列第5章 串第6章 树第7章 图第8章 查找第9章 排序写在前面快速的过了一遍,对于初学者来说讲的很细,很有助于理解;对于有一定基础的人可能会觉得叙述太墨迹。。。第1章 数据结构绪论程序设计=数据结构+算法数据:是描述客观事物的符号,是计算机中可以操作的对象,是能被计算机识...原创 2018-04-08 21:55:05 · 4547 阅读 · 1 评论 -
【笔记】《Python地理空间分析指南(第2版)》
看这本书的目的在于记录一下Python做地理空间分析的工具,主要是开源的东西;快速翻一遍,且作记录概述部分地理空间数据地理空间技术概览Python地理空间分析工具Python与地理信息系统Python与遥感Python与高程数据Python地理空间高级建模实时数据概述部分埃博拉病毒与Ushahidi灾害系统法国西南部的拉斯科山洞,星空图壁画⇒⇒...原创 2018-05-06 17:31:30 · 8471 阅读 · 1 评论 -
【笔记】《写给大家看的设计书》
摘录,于2017年2月24日 1. 四大原则:亲密、对齐、重复、对比 2. 亲密:将相关的项组织在一起,物理位置的接近意味着存在关联 3. 亲密即信息分组,使其成为一个视觉单元 4. 对齐:任何元素都不能再页面上随意安防,每一项应当与页面上的某个内容存在某种视觉联系 6. 原则——页面上只能使用一种文本对齐 7. 要尽力避免使用两端对齐; 8. 不要在左对齐的征文或锁紧文...原创 2018-05-07 12:46:43 · 182 阅读 · 0 评论 -
【笔记】《Web全栈工程师的自我修养》
摘录,于2017年1月21作者博客:http://yuguo.us/“全栈”翻译自full-stack,表示为了完成一个项目,所需要的一系列技术的集合。服务器、数据库、服务器端编程语言、HTML、CSS、JavaScript等组合为Web栈(Web-Stack)。最常用的Web栈——LAMP(Linux-Apache-MySQL-PHP)整体解决方案:服务器给予Linux...原创 2018-05-07 12:49:47 · 515 阅读 · 0 评论 -
【笔记】《程序设计导论 Python语言实践》
摘录于2017年10月6日终于算完了,趁着十一草草看完,性价比不高不低吧,有些困惑的问题得到了解决所以还是很值得的,尤其是可变变量那块。数据结构和算法一章最为粗糙,计划换本专门的书看。记录一些程序设计/Python中的新知识或比较重要的理念目录第一章 程序设计的基本原色第二章 函数和模块第三章 面向对象的程序设计第四章 算法和数据结构目录...原创 2018-05-07 12:59:36 · 1957 阅读 · 0 评论 -
【笔记】《编写高质量Python代码的59个有效方法》
文章目录第一章 用Pythonic方式来思考1. 确认Python版本2. 遵循PEP8风格指南3. 了解bytes、str、unicode的区别4. 用辅助函数取代复杂表达式5. 了解切割序列的方法6. 单次切片操作内,不要同时指定start、end、stride7. 用列表推导(list comprehension)来取代map和filter8. 不要用含有两个以上表达式的列表推导9. 用生...原创 2019-05-02 23:58:08 · 667 阅读 · 0 评论 -
【笔记】《统计学习方法》(8)提升方法
简书:https://www.jianshu.com/p/eb9d50312de8第8章 提升方法强可学习与弱可学习式等价的,在概率近似正确(probably approximately correct, PAC)学习的框架下提升(boosting)要解决的两个问题: (1)每一轮如何改变训练数据的权值和概率分布 (2)弱分类器如何组合成一个强分类起AdaBoost的...原创 2018-03-10 17:51:14 · 287 阅读 · 0 评论 -
【笔记】《统计学习方法》(7)支持向量机
简书:https://www.jianshu.com/p/eb9d50312de8第7章 支持向量机支持向量机(support vector machines, SVM)是一种二类分类模型基本模型是定义在特征空间上的间隔最大的线性分类器,区别于感知机核技巧使其成为实质上的非线性分类起学习策略是间隔最大化,形式化为求解凸二次规划问题,等价于正则化的合页损失函数最小化问题...原创 2018-03-10 16:19:25 · 281 阅读 · 0 评论 -
<机器学习>自用笔记
一、《机器学习》第一张 绪论1、机器学习所研究的主要内容,是关于在计算机上从数据中产生“模型”(model)的算法,即“学习算法”(learning algorithm)2、基本概念:数据集(data set):一组记录的集合示例(instance)/样本(sample):一条记录对事件或对象的描述属性(attribute)/特征(feature):反映事件或对象在某方面的表现或性质的事项属性值(...原创 2016-07-09 20:16:46 · 3246 阅读 · 0 评论 -
MATLAB神经网络 笔记
原创 2016-07-20 17:28:16 · 391 阅读 · 0 评论 -
python入门笔记
python入门,记录http://www.imooc.com/learn/177数据类型1、整数:十六进制0x......2、浮点数:“1.23*10^9”——1.23e93、字符串:' '和" "一样4、布尔值:True和False,注意大小写5、空值:Noneprint语句,不同字符串逗号隔开,打印出为一个空格。使用+号直连。注释:#开始到本行结尾理解变量在计算机内存中的表示。当我们写:a ...原创 2016-10-01 21:54:22 · 486 阅读 · 0 评论 -
【笔记】《Python数据分析与实战挖掘》
《Python数据分析与实战挖掘》 张良均基础篇书推荐:《用python做科学计算》扩展库 简介Numpy数组支持,以及相应的高效处理函数Scipy矩阵支持,以及相应的矩阵数值计算模块Matplotlib强大的数据可视化工具、作图库Pandas强大、灵活的数据分析和探索工具StatsModels 统计建模和计量经济学,包括描述统计、统计模型估计和推断Scikit-Learn支持回归、分类、聚类等的...原创 2016-10-04 21:36:55 · 7644 阅读 · 1 评论 -
【笔记】《统计学习方法》(1)概论
本来因为在CSDN里上传图片很麻烦,所以转到简书了。结果简书居然还不支持Latex和目录TOC、、、公式比较多的只好回到CSDN了 《统计学习方法》是学习机器学习原理的“必修课”,抽出点时间把之前看的时候的标注数字化一下,供自己以后回忆用…主概念、理解和算法,不记推导 简书:https://www.jianshu.com/p/eb9d50312de8第1章 统计...原创 2018-03-07 17:08:54 · 329 阅读 · 0 评论 -
【笔记】《统计学习方法》(2)感知机
简书:https://www.jianshu.com/p/eb9d50312de8第2章 感知机(模型)感知机(perceptron)是一种线性分类模型,属于判别模型,感知机模型的假设空间是定义在特征空间中的所有线性分类模型(linear classification model)或线性分类器(linear classifier),即函数集合{f|f(x)=wx+b}{f|f...原创 2018-03-07 20:57:56 · 171 阅读 · 0 评论 -
【笔记】《统计学习方法》(3)k近邻法
简书:https://www.jianshu.com/p/eb9d50312de8第3章 k近邻法k近邻法(k-nearest neighbor, k-NN)是一种基本分类与回归方法。k近邻法的三个基本要素k值选择、距离度量、分类决策规则k近邻法算法 输入:训练数据集 T={(x1,y1),(x2,y2),...,(xN,yN)}T={(x1,y1),(x2,y2),....原创 2018-03-07 21:48:30 · 222 阅读 · 0 评论 -
【笔记】《统计学习方法》(4)朴素贝叶斯法
简书:https://www.jianshu.com/p/eb9d50312de8第4章 朴素贝叶斯法朴素贝叶斯(naive Bayes)法是基于贝叶斯定理与特征条件独立假设的分类方法。首先基于特征条件独立假设学习输入/输出的联合概率分布;然后基于此模型,对给定的输入x,利用贝叶斯定理求出后验概率最大的输出y。条件独立假设 P(X=x|Y=ck)=P(X(1)=x(1)...原创 2018-03-07 22:15:47 · 195 阅读 · 0 评论 -
【笔记】《统计学习方法》(5)决策树
简书:https://www.jianshu.com/p/eb9d50312de8第5章 决策树决策树(decision tree)是一种基本的分类与回归方法。可以认为是互斥且完备的if-then规则的集合。优点:模型具有可读性、分类速度快。通常包括三个步骤:特征选择、决策树的生成、决策树的修剪思想来源主要有ID3算法、C4.5算法、CART算法定义:分类决策树模型是一...原创 2018-03-08 20:09:08 · 381 阅读 · 0 评论 -
【笔记】《统计学习方法》(6)逻辑斯谛回归与最大熵模型
简书:https://www.jianshu.com/p/eb9d50312de8第6章 逻辑斯谛回归与最大熵模型逻辑斯谛回归(logistic regression)是经典分类方法。最大熵是概率模型学习的一个准则,推广至分类问题即为最大熵模型(maximum entropy model)。二者都属于对数线性模型逻辑斯谛分布(logistic distribution),设...原创 2018-03-10 15:14:52 · 254 阅读 · 0 评论 -
JAVA学习笔记
JAVA学习笔记备注:简易笔记,自用。可参考。2016年3月21日更新1、 JDK(Java SE Development Kits),即Java开发工具包,最新版的为JDK7.0,代号Dolphin2、 Java的三个版本。①JavaSE(Java Platform,Standard Edition):前身J2SE,为JAVA标准版,用于桌面程序,包含Java Web服务的一些类。②Java E...原创 2016-03-21 15:34:48 · 2051 阅读 · 0 评论