![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
课堂笔记
Treasureashes
总有一条非走不可的弯路。
展开
-
数据可视化的重要性
平均值(Mean)受例外者(Outlier)和丢失数据(Missing data)的影响太大,通常鲁棒性(Robust)很差。如果使用,需要格外注意这点的影响。与之相比,中位数(Median)的鲁棒性会好很多。在预处理(Pre-processing)的过程中,一定要记得利用数据总结(Numerical summaries)、可视化工具(visualization tools)和鲁棒性评估...原创 2020-02-20 15:12:43 · 1482 阅读 · 0 评论 -
数据挖掘中的Attribute
与特征(Feature)看起来是一个意思,但是实质上意思有些差别:Attribute更侧重于特征对结果的贡献,Feature更是一种客观存在的特征。例如:小明考了一百分,这是Feature,对于妈妈给他糖这是Attribute,但对于邻居家小孩的快乐生活可能就不是Attribute类似的意思还有预测器(Predictor):侧重于与所要预测的结果之间的关系,比如小明考一百分和小明...原创 2020-02-20 15:11:19 · 394 阅读 · 0 评论 -
自然辩证法问题思考范围(开卷可用)
以下整理自网络,侵删自然辩证法问题思考范围1.自然辩证法的学科性质2.自然辩证法的基本观点包括哪些内容?3.自然辩证法与自然哲学、西方科学哲学、科学学、自然科学的关系是什么?4.当前学习自然辩证法的重要意义是什么?5.古代朴素自然观的基本观点及其历史地位?6.机械论形而上学自然观基本观点、核心特征?7.机械论形而上学自然观重...原创 2020-02-20 15:07:02 · 12563 阅读 · 0 评论 -
通信网理论基础-ARQ协议里的几个基本概念
Distributed正是因为我们所使用的计算机网络从集中式变成了分布式,我们才需要各种通信协议来保证在网络中信息的正常流通。所以一切网络通信的问题,都可以从这个词出发考虑其形成的原因。Know How之后再去设计可以从根本避免很多错误。Timeout在Stop-and-wait ARQ中,如果发生有包丢失的错误情况,会使efficiency大大降低。为了提高通信网络的效率,我们引入了...原创 2020-02-20 15:05:09 · 968 阅读 · 0 评论 -
【python】简明Python教程
基础int 类型可以指任何大小的整数字符串是不可变的标识符名称区分大小写Python 鼓励每一行使用一句独立语句(不用分号)从而使得代码更加可读请确保你在缩进中使用数量一致的空格,否则你的程序将不会运行,或引发不期望的行为。help—有关任何函数或语句的快速信息“”" 或 ‘’’ —指定多行字符串format—将每个参数值替换至格式所在的位置print('{name} wrote...翻译 2020-02-19 15:26:21 · 525 阅读 · 0 评论 -
【机器学习】机器学习实战-支持向量机
概述在数据上应用基本形式的SVM分类器就可以得到低错误率的结果,且能够对训练集之外的数据点做出很好的分类决策。优点:泛化错误率低(?),计算开销不大,结果易解释缺点:对参数调节和核函数的选择敏感,原始分类器不加修改仅适用于处理二类问题。适用数据范围:数值型和标称型一些基本概念线性可分分隔超平面:分隔N维数据的那个平面(对象)超平面:分类的决策边界间隔:点到分隔面的距离支持...翻译 2020-02-19 15:24:38 · 163 阅读 · 0 评论 -
【机器学习】机器学习实战-Logistic回归
概述我们在每个特征上都乘以一个回归系数,然后把所有的结果值相加,将这个总和代入Sigmoid函数中,进而得到一个范围在0~1之间的数值。任何大于0.5的数据被分入1类,小于0.5的被归入0类。所以此种回归也可以被看成是一种概率估计。优点:计算代价不高,易于理解和实现缺点:容易欠拟合,分类精度可能不高适用数据范围:数值型和标称型一般过程收集数据:任意准备数据:由于需要进行距离计算...翻译 2020-02-19 15:23:29 · 176 阅读 · 0 评论 -
【机器学习】机器学习实战-决策树
决策树的构造优点:计算复杂度不高,输出结果易于理解(直观),对中间值的缺失不敏感,可以处理不相关特征数据缺点:可能会产生过度匹配问题适用数据类型:数值型和标称型常用算法ID3:无法处理数值型数据,不适用于存在太多特征划分的标称型数据。CARTC4.5一般流程收集数据:可以使用任何方法准备数据:树构造算法只适用于标称型数据,因此数值型数据必须离散化分析数据:可以使用任...翻译 2020-02-19 15:22:26 · 251 阅读 · 0 评论 -
【机器学习】机器学习实战-K近邻算法
概述采用测量不同特征值之间的距离方法进行分类 e.g. 电影分类优点:精度高、对异常值不敏感、无数据输入假定缺点:计算复杂度高(耗时)空间复杂度高(耗存储空间)无法给出任何数据的基础结构信息,既而无法知晓平均实例样本和典型实例样本具有什么特征适用数据范围:数值型和标称型工作原理训练样本集每个数据都有标签,即知道样本集中每一数据与所属分类的对应关系。输入没有标签的新数据后...翻译 2020-02-19 15:21:12 · 303 阅读 · 0 评论 -
【机器学习】机器学习实战-朴素贝叶斯
基于贝叶斯决策理论的分类方法优点:在数据较少的情况下仍然有效,可以处理多类别问题缺点:对输入数据的准备方式较为敏感适用数据类型:标称型贝叶斯决策理论核心思想:选择具有最高概率的决策,引入先验知识和逻辑推理来处理不确定问题。(相对的是频数概率,只从数据本身获得结论,并不考虑逻辑推理及先验知识)条件概率贝叶斯准则【公式】贝叶斯分类准则如果,那么属于类别如果,那么属于类...翻译 2020-02-19 15:20:07 · 190 阅读 · 0 评论 -
【机器学习】机器学习实战-绪论
机器学习把无序的数据转换成有用的信息。e.g. 人脸识别、手写数字识别、垃圾邮件过滤、产品推荐监督学习只需给定输入样本集,机器就可以从中推演出指定目标变量的可能结果。算法必须知道预测什么,即目标变量的分类信息。分类:主要预测标称型数据,即目标变量的结果只在有限目标集中取值。回归:主要预测数值型数据,即目标变量可以从无限的数值集合中取值。关键术语特征(属性)训练集目标变量:机...翻译 2020-02-19 15:18:46 · 164 阅读 · 0 评论 -
【随机优化】李雅普诺夫优化在通信与排队系统中的应用(第四章)-优化时间平均
【参考书目】Stochastic Network Optimization with Application to Communication and Queueing Systems【作者】(美)Michael J.Neely---University of Southern California【出版社】MORGAN&CLAYPOOL PUBLISHERS目录李雅...翻译 2020-02-19 14:39:55 · 6521 阅读 · 0 评论 -
【随机优化】李雅普诺夫优化在通信与排队系统中的应用(第三章)-动态规划示例
【参考书目】Stochastic Network Optimization with Application to Communication and Queueing Systems【作者】(美)Michael J.Neely---University of Southern California【出版社】MORGAN&CLAYPOOL PUBLISHERS目录稳定调度...翻译 2020-02-19 13:47:04 · 10653 阅读 · 0 评论 -
【随机优化】李雅普诺夫优化在通信与排队系统中的应用(第二章)-队列中的引入
【参考书目】Stochastic Network Optimization with Application to Communication and Queueing Systems【作者】(美)Michael J.Neely---University of Southern California【出版社】MORGAN&CLAYPOOL PUBLISHERS目录速率稳定性...翻译 2020-02-19 13:46:29 · 4224 阅读 · 0 评论 -
【随机优化】李雅普诺夫优化在通信与排队系统中的应用(第一章)-绪论
【参考书目】Stochastic Network Optimization with Application to Communication and Queueing Systems【作者】(美)Michael J.Neely---University of Southern California【出版社】MORGAN&CLAYPOOL PUBLISHERS目录相关...翻译 2020-02-19 13:45:35 · 15928 阅读 · 17 评论