![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
Treasureashes
总有一条非走不可的弯路。
展开
-
使用K-NN时的维数灾难
K-NN最大的缺陷就是很容易引起维数灾难,在高维空间,数据变得异常稀疏,这就使得即使是最近的邻居数据点,所需计算数据点之间的距离也变得异常得远。这导致了随着变量的增加,训练集所要求的数据量呈指数级的增长,计算量也随之变得异常大。为了解决这个问题,有几种措施可以尝试:对变量(Predictor)进行降维,可以用PCA等降维方法。 尝试找到计算“最近邻”(almost nearest ...原创 2020-03-26 19:29:25 · 745 阅读 · 0 评论 -
【python】 'float'object is not iterable
这个错误遇到得太多了,这次是因为企图直接将'float' object转换为list:total_energys.append(list(total_energy))这里的total_energy的类型就是float。直接将其append就行:total_energys.append(total_energy)...原创 2020-03-09 16:32:41 · 28043 阅读 · 0 评论 -
InvalidArgumentError (see above for traceback): Shape [-1,60,60,2] has negative dimensions
详细错误信息最直接的错误,主要在最后一行: 2%|▌ | 998/50000 [00:22<20:00, 40.80it/s] 2%|▌ | 1003/50000 [00:23<20:09, 40.50it/s]2020-03-06 18:54:45.957950: W...原创 2020-03-06 23:02:58 · 541 阅读 · 0 评论 -
【Tensorflow】ERROR: Could not find a version that satisfies the requirement tqdm (from versions: none
运行Github下来的文件,报错:ImportError: No module named 'tqdm'用pip下载:pip3 install tqdm报错:WARNING: Retrying (Retry(total=4, connect=None, read=None, redirect=None, status=None)) after connection bro...原创 2020-02-27 16:02:13 · 4427 阅读 · 2 评论 -
【强化学习】三种基本的分层强化学习框架
分层的优点时间上的抽象(Temporal abstraction):可以考虑持续一段时间的策略迁移/重用性(Transfer/Reusability):把大问题分解为小问题后,小问题学习到的解决方法可以迁移到别的问题之上有效性/有意义(powerful/meaningful)-状态上的抽象(state abstraction):当前的状态中与所解决问题无关的状态不会被关注不同的最优...原创 2020-02-20 15:10:20 · 3679 阅读 · 0 评论 -
【python】简明Python教程
基础int 类型可以指任何大小的整数字符串是不可变的标识符名称区分大小写Python 鼓励每一行使用一句独立语句(不用分号)从而使得代码更加可读请确保你在缩进中使用数量一致的空格,否则你的程序将不会运行,或引发不期望的行为。help—有关任何函数或语句的快速信息“”" 或 ‘’’ —指定多行字符串format—将每个参数值替换至格式所在的位置print('{name} wrote...翻译 2020-02-19 15:26:21 · 525 阅读 · 0 评论 -
【机器学习】机器学习实战-支持向量机
概述在数据上应用基本形式的SVM分类器就可以得到低错误率的结果,且能够对训练集之外的数据点做出很好的分类决策。优点:泛化错误率低(?),计算开销不大,结果易解释缺点:对参数调节和核函数的选择敏感,原始分类器不加修改仅适用于处理二类问题。适用数据范围:数值型和标称型一些基本概念线性可分分隔超平面:分隔N维数据的那个平面(对象)超平面:分类的决策边界间隔:点到分隔面的距离支持...翻译 2020-02-19 15:24:38 · 163 阅读 · 0 评论 -
【机器学习】机器学习实战-Logistic回归
概述我们在每个特征上都乘以一个回归系数,然后把所有的结果值相加,将这个总和代入Sigmoid函数中,进而得到一个范围在0~1之间的数值。任何大于0.5的数据被分入1类,小于0.5的被归入0类。所以此种回归也可以被看成是一种概率估计。优点:计算代价不高,易于理解和实现缺点:容易欠拟合,分类精度可能不高适用数据范围:数值型和标称型一般过程收集数据:任意准备数据:由于需要进行距离计算...翻译 2020-02-19 15:23:29 · 176 阅读 · 0 评论 -
【机器学习】机器学习实战-决策树
决策树的构造优点:计算复杂度不高,输出结果易于理解(直观),对中间值的缺失不敏感,可以处理不相关特征数据缺点:可能会产生过度匹配问题适用数据类型:数值型和标称型常用算法ID3:无法处理数值型数据,不适用于存在太多特征划分的标称型数据。CARTC4.5一般流程收集数据:可以使用任何方法准备数据:树构造算法只适用于标称型数据,因此数值型数据必须离散化分析数据:可以使用任...翻译 2020-02-19 15:22:26 · 251 阅读 · 0 评论 -
【机器学习】机器学习实战-K近邻算法
概述采用测量不同特征值之间的距离方法进行分类 e.g. 电影分类优点:精度高、对异常值不敏感、无数据输入假定缺点:计算复杂度高(耗时)空间复杂度高(耗存储空间)无法给出任何数据的基础结构信息,既而无法知晓平均实例样本和典型实例样本具有什么特征适用数据范围:数值型和标称型工作原理训练样本集每个数据都有标签,即知道样本集中每一数据与所属分类的对应关系。输入没有标签的新数据后...翻译 2020-02-19 15:21:12 · 303 阅读 · 0 评论 -
【机器学习】机器学习实战-朴素贝叶斯
基于贝叶斯决策理论的分类方法优点:在数据较少的情况下仍然有效,可以处理多类别问题缺点:对输入数据的准备方式较为敏感适用数据类型:标称型贝叶斯决策理论核心思想:选择具有最高概率的决策,引入先验知识和逻辑推理来处理不确定问题。(相对的是频数概率,只从数据本身获得结论,并不考虑逻辑推理及先验知识)条件概率贝叶斯准则【公式】贝叶斯分类准则如果,那么属于类别如果,那么属于类...翻译 2020-02-19 15:20:07 · 190 阅读 · 0 评论 -
【机器学习】机器学习实战-绪论
机器学习把无序的数据转换成有用的信息。e.g. 人脸识别、手写数字识别、垃圾邮件过滤、产品推荐监督学习只需给定输入样本集,机器就可以从中推演出指定目标变量的可能结果。算法必须知道预测什么,即目标变量的分类信息。分类:主要预测标称型数据,即目标变量的结果只在有限目标集中取值。回归:主要预测数值型数据,即目标变量可以从无限的数值集合中取值。关键术语特征(属性)训练集目标变量:机...翻译 2020-02-19 15:18:46 · 164 阅读 · 0 评论 -
AI方向的实验室调研(截至18年,未更新)
目录国内中科院自动化所-智能感知与计算研究中心计算所智能信息重点实验室西电清华大学计算机系-智能技术与系统国家重点实验室自然语言处理与社会人文计算实验室自动化系北大机器感知与智能教育部重点实验室---机器学习研究室深度学习实验室浙江大学计算机院图形与并行系统实验室南京大学机器学习与数据挖掘研究所香港中文大学...原创 2020-02-19 15:15:55 · 6738 阅读 · 0 评论 -
【读书笔记】深入浅出强化学习:原理入门(一)
虽然书名是深入浅出,但是讲得还是挺深入的。书的第一篇是强化学习基础。几页的书我翻了不下十遍,全是干货,很值得一看~读起来像是作者写了很多最多删成了这样,特别精练耐看。我也没办法从里面提炼出什么,只能稍微整理一下这篇的脉络:使用MindManager整理,感兴趣的筒子们可以自行下载,百度网盘:链接:https://pan.baidu.com/s/1Svavcm0Qlik64GGtO3aAWg 密码:...原创 2018-03-22 23:46:59 · 1445 阅读 · 0 评论 -
周志华《机器学习》算法优缺点总览
说明本文档使用MindManager编辑:做这个笔记的初衷是供自己快速复习查找合适的算法,基本以各算法的优缺点与条件为主,省略推导过程和公式,所以分享出来也是供《机器学习》一书的读者复习使用,或仅仅想简单了解或查找机器学习的一些常用算法及数据处理方法的读者使用;每个算法、处理方法及指标的详细说明在便笺中,若要查看需在图标上悬停或点击;此笔记是根据已购买的正版实体书手打整理,如果里面有错误之处,原创 2018-01-02 12:06:42 · 401 阅读 · 0 评论