自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Xavier

一切从零开始!

  • 博客(15)
  • 问答 (1)
  • 收藏
  • 关注

原创 统计学 第一章 导论(降低重复率)

一、思考题1.1 什么是统计学?统计学是收集、处理、分析、解释数据并从数据中得出结论的科学。1.2 解释描述统计和推断统计。描述统计研究的是数据收集、处理、汇总、图表描述、概括与分析等统计方法。推断统计是研究如何利用样本数据来推断总体特征的统计方法。1.3 统计数据可分为哪几种类型?不同类型的数据各有什么特点?1、按照所采用的计量尺度的不同,可以将统计数据分为分类数据、顺序数据和数值型数据。分类数据是只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,是用文字来表述的。

2020-09-19 20:25:46 3878

原创 SQL入门经典 第四章

4.5.1 测验1. 判断正误:规格化是把数据划分为逻辑相关组的过程。正确。2. 判断正误:让数据库里没有重复或冗余数据,让数据库里所有内容都规格化,总是最好的方式。错误。规格化会增加I/O和CPU时间,从而降低数据库性能。3. 判断正误:如果数据是第三规格形式,它会自动属于第一和第二规格形式。正确。4. 与规格化数据库相比,去规格化数据库的主要优化是什么?改善数据库性能。5. 去规格化的主要缺点是什么?冗余和重复数据会占据额外的空间,难以编程,需要更多的数据维护工作。6.在对数据库进

2020-08-05 17:23:05 241

原创 SQL入门经典 第三章

3.7.1 测验1. 下面这个CREATE TABLE命令能够正常执行吗?需要做什么修改?在不同的数据库(MySQL、Oracle、SQL Server)中执行,有什么限制吗?Create table EMPLOYEE_TABLE as: (ssn number(9) not null, last_name varchar2(20) not null, first_name varchar2(20

2020-08-05 15:55:21 232

原创 SQL入门经典 第二章

2.5.1测验1.判断对错:个人社会保险号码,输入格式为‘1111111111’,它可以是下面任何一种数据类型:定长自符、变长字符、数值。对。只要有效数字达到必要长度。2.判断对错:数值类型的标度是指数值的总体长度。错。有效数字是总体长度,标度表示小数点右侧保留的位数。3.所有的SQL实现都使用同样的数据类型吗?不是。大多数实现的数据类型都有所不同。虽然他们都遵循ANSI描述的标准,但不同厂商采取了不同的存储方式,可能导致数据类型有所差异。4.下面定义的有效位数和标度分别是多少?DECIMA

2020-08-04 22:07:24 498

原创 SQL入门经典 第一章

1.7.1 测验1.缩写“SQL”的含义是什么?Structured Query Language 结构化查询语言2.SQL命令的6个主要类别是什么?数据定义语言(DDL)数据操作语言(DML)数据查询语言(DQL)数据控制语言(DCL)数据管理命令(DAC)事务控制命令(TCC)3.4个事务控制命令是什么?COMMIT:保存数据库事务ROLLBACK:撤销数据库事务SAVEPOINT:在一组事务里创建标记点以用于回退(ROLLBACK)SET TRANSACTION:设置事务的

2020-08-04 21:01:27 169

原创 python算法练习——解空间的穷举搜索与Google方程式

目录解空间的穷举搜索与Google方程式解空间的穷举搜索解空间的定义解空间的穷举搜索与Google方程式解空间的穷举搜索解空间又称为状态空间,是所有可能是解的候选解的集合。穷举是一种在有限的解空间(解空间至少在理论上是有限的)内按照一定的策略进行查找的思想。数学上也把穷举法称为枚举法,就是在一个由有限个元素构成的集合中,将所有元素一一枚举研究的方法。穷举法的基本思想就是以下两个步骤:(1...

2020-02-16 11:05:34 709

原创 《数据挖掘概念与技术》学习笔记-第三章

3.1数据质量可以从多方面评估,包括准确性、完整性和一致性问题。对于以上每个问题,讨论数据质量的评估如何依赖于数据的应用目的,给出例子。提出数据质量的两个其他尺度。...

2020-02-14 14:21:00 6547

原创 python算法练习——动态规划与字符串的编辑距离

目录动态规划与字符串的编辑距离动态规划基本思想四个步骤三个例子动态规划与字符串的编辑距离动态规划动态规划(dynamic programming)是解决多阶段决策问题常用的最优化理论,该理论由美国数学家Bellman等人在1957年提出,用于研究多阶段决策过程的优化问题。其原理就是把多阶段决策过程转化为一系列的单阶段决策问题,利用各个阶段之间的递推关系,逐个确定每个阶段的最优化决策,最终堆叠...

2020-01-12 19:53:33 2064 1

翻译 文献翻译——基于关联规则挖掘识别的鸡源大肠杆菌共有多重耐药模式(下)

原文来源https://www.frontiersin.org/articles/10.3389/fmicb.2019.00687/full引言尽管细菌具有抗生素耐药性基因比1940年发现和临床使用抗生素还要早,抗生素使用为致病的和非致病的细菌选择了抗生素耐药性。通过在食物生产动物中使用抗生素,会使增加的AMR出现和存留在食物源病原菌中。据推断,由于不断增加的肉产品需求和人口增长,从2010...

2020-01-05 14:20:01 546 3

翻译 文献翻译——基于关联规则挖掘识别的鸡源大肠杆菌共有多重耐药模式(上)

目录原文来源摘要方法数据源关联规则挖掘背景频繁项集和规则生成实现规则集的比较错误发现率结果原文来源https://www.frontiersin.org/articles/10.3389/fmicb.2019.00687/full摘要在食用动物中使用多种抗生素可能在肠道杆菌中引起基因关联的多重耐药,这会造成屠宰肉类的污染。美国国家耐药性监测系统检测了从2004年到2012年的21243个鸡...

2019-12-24 19:27:31 474 6

原创 《数据挖掘概念与技术》学习笔记-第二章

2.1

2019-12-23 16:49:46 10265 2

原创 哈梅白的技术成长日志——编号00001

记哈梅白的一次技术经历当我十分钟前坐在食堂吃着一块一块的土豆时,我满脑子想的都是怎样把这几天主要是今天的技术学习经历写下来,然后发出去,以至于生姜们多次成功地骗过了我双5.0的眼睛(呕)。学的是什么技术呢?简而言之——数据库。怎么开始的呢?当我意识到我要开始着手做一些数据挖掘工作的时候。作为一个技术小白,看着谷歌学术上各个国家的大牛们用各种花里胡哨的算法处理着各种五颜六色的数据,内心充满的是...

2019-12-22 19:47:50 415 5

原创 python算法练习——分治法与大整数Karatsuba乘法算法

目录分治法与大整数Karatsuba乘法算法分治法大整数Karatsuba乘法算法计算原理算法实现分治法与大整数Karatsuba乘法算法分治法是算法设计的常用思想之一,也是Karatsuba乘法算法的基础,笔者练习用python编程语言进行实现。分治法分治法(divide and conquer),其设计思想是将无法着手解决的大问题分解成一系列规模较小的相同问题,然后逐个解决小问题。分治...

2019-12-21 22:55:23 1913 2

原创 《数据挖掘概念与技术》学习笔记-第一章

1.1 什么是数据挖掘?数据挖掘是从大量数据中发现有趣模式和知识的过程,它既不是一种广告宣传,也不是数据库、统计学、机器学习或模式识别发展而来的技术的简单转换或应用。机器学习的不断发展,为数据挖掘提供了很好的数据分析技术基础,而统计学则帮助人们更好的理解数据的全貌,模式识别也在数据挖掘的过程中被广泛应用,因此,数据挖掘实际上是多种数据分析技术共同发展才得以发展壮大的,并且与这些技术相辅相成,互...

2019-12-20 20:50:11 1827 1

原创 python算法练习——贪心算法解决0-1背包问题

目录贪心算法与0-1背包问题贪心算法0-1背包问题解决策略算法实现初始化函数三种策略贪心算法比较函数主函数脚本文件运行结语致谢贪心算法与0-1背包问题用贪心算法解决0-1背包问题是算法界较为经典的一个问题,笔者尝试用一个python脚本,实现对输入的问题数据生成相应的最优结果。贪心算法贪心算法(greedy algorithm),又称贪婪法,是寻找最优解问题的常用方法。这种方法一般将求解过...

2019-12-08 10:47:27 8163 4

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除