自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 收藏
  • 关注

原创 算法分析与设计(第四章 贪心法(局部最优))

1、基本思想:贪心法通过分步决策的方法求解问题。贪心法每一步用作决策依据的选择准则称为最优量度标准(局部最优解)。在根据最优量度标准选择分量的过程中,还需要使用一个可行解判定函数(约束条件)。2、贪心法一般具有2个重要的性质:贪心选择性质、最优子结构性质贪心选择性质:是指所求问题的整体最优解可以通过一系列局部最优的选择,即贪心选择来达到。这是贪心算法可行的第一个基本要素,也是贪心算法与动态规划算法的主要区别(贪心法有贪心选择性质)。最优子结构性质:一个问题的最优解包含其子问题的最优解。问题的

2021-06-26 16:02:40 2104

原创 算法分析与设计(第三章 动态规划法)

1、基本思想:动态规划算法与分治法类似,基本思想是将待求解问题分解成若干个子问题。动态规划算法可以避免大量重复计算。动态规划算法可依据其递归式自底向上的方式进行计算,每个子问题只计算一次。2、基本元素:最优子结构、重叠子问题。3、动态规划的一般步骤: 问题结构分析、 递归关系建立、 自底向上计算、 最优方案追踪。4、0-1背包问题(优化问题)蛮力枚举:重复求解大量子问题。带备忘录:记录子问题解,避免重复计算。(自顶向下+自底向上)...

2021-06-25 16:05:30 334

原创 算法分析与设计(第二章 分治法)

1、分治法:将一个复杂的问题分解成若干个规模较小、相互独立,但类型相同的子问题求解;然后再将各子问题的解组合成原始问题的一个完整答案,这样的问题求解策略就叫分治法。分治法框架:分解原问题,解决子问题,合并问题解。2、一个问题能够用分治法求解的要素是①问题能按某种方式分解成若干个规模较小、相互独立且与原问题类型相同的子问题;②子问题足够小时可以直接求解;③能够将子问题的解组合成原问题的解。3、分治法与递归算法的关系分治法要求分解成同类子问题,并允许不断分解,使逐渐减小;因而,分

2021-06-25 13:39:17 543

原创 算法分析与设计(第一章 算法基础)

掌握衡量算法效率的时间复杂度和空间复杂度概念, 以及算法的最好、平均和最坏情况时间复杂度,渐进表示法。1、算法是指解决问题的一种方法或一个过程。算法是对特定问题求解步骤的一种描述,是指令的有限序列2、算法的5个特征:输入:0个或多个输入。输出:至少产生一个输出。确定性:每一条指令都有确切的定义,无二义性。有穷性:必须执行有限步之后终止。可行性:算法的每一条指令都必须足够基本。正确任、鲁裤性简明性、3、一个好的算法应具有的特性:正确性、鲁棒性、简明性、高效性。可行4

2021-06-18 17:00:09 383

原创 Linux下vi的基本操作

的额外vi编辑器是所有Unix及Linux系统下标准的编辑器,它的强大不逊色于任何最新的文本编辑器,这里只是简单地介绍一下它的用法和一小部分指令。1、vi的基本概念基本上vi可以分为三种状态1) 命令行模式command mode)控制屏幕光标的移动,字符、字或行的删除,移动复制某区段及进入Insert mode下,或者到 last line mode。2) 插入模式(Insert mode)只有在Insert mode下,才可以做文字输入,按[ESC]键可回到命令行模式。3

2021-06-18 15:22:20 1761

原创 计算思维与数据科学④

1、特征:描述物体的属性。分为相关特征、无关特征和冗余特征(其所包含信息能由其他特征推演出来)为什么要做特征选择?①简化模型,便于理解②缩短训练时间③避免维度灾难④提高模型的泛化性能(可通过减少过拟合)2、特征过滤:对各个特征按照发散性或者相关性进行评分,对分数设定阈值或选择靠前的特征。优点:简单,快速缺点:对于排序靠前的特征,若他们相关性较强,则引入了冗余特征,浪费了计算资源。对于排序靠后的特征,独立作用不显著,损失了有价值的特征。代表方法:皮尔逊相关系数、卡方检验。特征选择过

2021-06-18 14:39:18 243

原创 计算思维与数据科学③

神经网络:1943年 第一个神经元模型M-P模型1957年 感知器,首个可学习的神经网络1969年 单层神经网络1986年 反向传播算法,BP算法的实质:函数求导的链式法则2006年 深度信念网络神经网络是由具有适应性的简单单元组成的广泛并行互联网络,它的组织能够模拟生物神经系统对真实世界物体所作出的反应。回归分析:确定两种或两种以上变量相互依赖的定量关系的一种统计分析方法。回归是连续的,分类是离散的。 线性回归:线性回归的损失函数通过梯度下降算法求解会得到全局收敛。 多项式回

2021-06-18 14:05:28 369

原创 计算思维与数据科学②

聚类方法1、K-means(贪心算法的典型代表) (最小化平方误差)E越小,簇内样本相似度越高。优点:速度快、复杂度低、原理简单、易理解、易于实现。缺点:对异常点敏感、获得的是局部最优解而不是全局最优解、聚类结果与初始点选取有关、不能发现非凸形状的聚类。2、子空间聚类(实现高维数据集聚类)思想:谱聚类:一种基于图论的点对聚类方法。通过对样本数据的拉普拉斯矩阵的特征向量进行聚类。将聚...

2021-06-09 16:54:09 378

原创 计算思维与数据科学①

1、数据采集2、什么是数据预处理:将原始数据转换为可以理解的格式或便于我们处理的格式。 数据清洗:由脏数据到干净数据 数据集成 数据变换 数据归约3、对原始数据进行审核:完整性、准确性、适用性、时效性4、脏数据:数据会存在缺失值、重复值、不一致(矛盾、对立、不相容)、含噪声、维度高。5、缺失属性处理: 1、不处理,直接使用含有缺失值的特征; 2、删除含有缺失值的特征; 3、缺失值补全,平均值插补、同类平均值补全、极大似然估计、压...

2021-06-09 14:23:32 884

原创 简单搜索引擎使用技巧

除了直接输入关键词搜索,搜索引擎都是支持一些高级搜索技巧和语法的,下面搜索引擎使用技巧,快速准确地找到所需内容。

2021-06-06 09:15:43 756

原创 python自然语言处理工具包“spaCy”安装教程

spaCy简介1、spaCy简单教程spaCy 是一个Python自然语言处理工具包,诞生于2014年年中,号称“Industrial-Strength Natural Language Processing in Python”,是具有工业级强度的Python NLP工具包。spaCy里大量使用了 Cython 来提高相关模块的性能,这个区别于学术性质更浓的Python NLTK,因此具有了业界应用的实际价值。spaCy是隶属于NLP(自然语言处理)的python组件。官方介绍:spaCy

2021-06-05 11:25:00 7123 1

原创 《大数据技术原理与应用》林子雨 期末复习重点(总结)

一、1数据产生方式大致经历了3个阶段:运营式系统阶段、用户原创内容阶段、感知式系统阶段。2.大数据的4个特点:数据量大、数据类型繁多、处理速度快、价值密度低。3.科学研究方面经历的4种范式:实验、理论、计算、数据。4.大数据四种计算模式:批量计算(针对大规模数据的批量数据)流计算(针对流计算的实时计算)图计算(针对大规模图结构数据的处理)查询分析计算(大规模数据的存储管理和查询分析)二、1.Hadoop的特性:高可靠性、高效性、高扩展性、高容错性、成本低、运行在Linux平台上、支持多种编.

2021-06-05 10:04:54 11179 2

原创 数据结构 2、基本概念

数据结构是一门研究在非数值计算的程序设计问题中,计算机的操作对象及对象间的关系和施加于对象的操作等的学科。数据元素之间的关系在计算机中有四种表示方法:顺序存储方式:存储位置反映数据元素间的逻辑关系,存储密度大,但插入、删除操作的效率较差。 链式存储方式:每个存储结点除包含数据元素信息外还包含一组(至少一个)指针,指针反映数据元素间的逻辑关系,不要求存储空间连续,便于动态操作,但存储空间开销大。 索引存储方式:除数据元素存储在一地址连续的内存空间外,尚需建立一个索引表,索引表中索引指示存储结点的存

2021-06-05 08:43:15 260

原创 数据结构 1、绪论

一、术语数据:是信息的载体,能被计算机识别、存储、加工处理。数据元素:数据的基本单位,即数据集合中的一个个体。也称元素、结点、顶点、记录。数据项:是具有独立含义的最小标识单位。如一条记录信息中每一项(例如姓名、学号)。关键字:唯一能识别一个数据元素的数据项。数据类型:是具有相同性质的计算机数据的集合及在这个集合上的一组操作。(原子数据类型、结构数据类型、抽象数据类型)数据结构:包括数据的逻辑结构、数据的存储结构和数据的运算;存在一种或多种特定关系的数据元素的集合。逻辑结构:可直接

2021-06-05 08:42:01 106

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除