自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(35)
  • 收藏
  • 关注

原创 关于决策树算法

决策树属于监督学习算法,是一种树状结构模型,可应用与分类与回归场景。决策树的三要素:特征选择、决策树的生成 和 决策树的剪枝。1、特征选择决策树在划分子树的特征过程中,通常会使用以下三种划分准则:信息增益、信息增益比、基尼系数。1.1 信息增益熵度量随机变量 YYY 的不确定性,熵值越大,随机变量的不确定性就越大。H(Y)=−∑i=1kpilogpiH(Y)=- \sum_{i=...

2020-05-04 21:17:34 996

原创 关于逻辑回归算法

逻辑回归属于监督学习算法中,分类算法的一种,主要应用在二分类场景中,也可应用在多分类场景。概述简单点说,Logistic回归模型就是将线性回归的结果输入一个Sigmoid函数,将回归值映射到0~1区间,表示输出的类别“1”的概率。模型线性回归的表达式如下:yi=wxi+by_i=wx_i+byi​=wxi​+bSigmoid函数:σ(z)=11+e−z\sigma(z)=\frac{...

2020-05-02 15:30:20 756

原创 关于线性回归算法

线性回归属于监督学习算法中,回归算法的一种,主要应用场景是连续数值型变量的预测问题。模型线性回归的模型为:yi^=wxi+b\hat{y_i}=wx_i+byi​^​=wxi​+b其中 w:特征权重w:特征权重w:特征权重,b:偏置值b:偏置值b:偏置值,yi^为自变量的预测值\hat{y_i} 为自变量的预测值yi​^​为自变量的预测值,xi为因变量x_i为因变量xi​为因变量,yi为自...

2020-05-01 17:07:50 719

原创 “T3出行”产品体验分析报告

一、体验环境产品名称T3出行版本信息T3出行1.0.15手机型号iPhone X操作系统iOS11网络环境WiFi体验时间2020/3/15二、产品概况2.1 产品定位T3出行时互联网出行、车辆动态监控、专业司机服务的一体化互联网出行APP,致力于成为乘客提供安全、便捷、专业的出行服务。产品Slogan:T3出行,只为更好。2....

2020-04-17 14:49:21 12551

原创 使用Python合并Excel文件

最近工作中,需要做很多合并excel文件的工作,文件量少的时候,复制粘贴没问题,数据量大的时候,就非常耗时;于是自己用python写了一段合并excel文件的小程序。大家可以直接拿来用。工具环境:Windows10语言:python模块:pandas、os代码import pandas as pdimport osdef get_file_path(path): '''获...

2019-09-25 15:43:05 2384 12

原创 计算机二级MySQL笔记(第十三章 MySQL数据库的应用编程)

首先声明,本章笔记主要介绍使用PHP进行MySQL数据库的应用编程,内容深度仅适用于计算机二级MySQL。因为PHP又是另一门编程语言,其内容不可能在一篇博客里讨论完。关于PHP的语法,请自行查阅,可以参考教程 PHP菜鸟教程。使用PHP进行MySQL数据库编程的基本步骤如下:首先建立与MySQL数据库服务器的连接。然后选择要对其操作的数据库。再执行相应的数据库操作,包括对数据的添加、删...

2019-08-21 16:23:44 704

原创 计算机二级MySQL笔记(第十二章 备份与恢复)

本章我认为重点理解三个概念:备份、恢复、日志。备份不用多说,恢复动作在数据库中,通常只能恢复到备份截止的时间,因为不可能时时刻刻都在备份数据。如果数据丢失的时间点刚好在备份时间点之后,这个时候就需要日志了,日志会实时记录数据库中的修改、插入、删除的SQL语句,因此,日志的主要目的就是在数据恢复时能够最大可能的恢复数据库。备份MySQL提供三种备份的方式:1、使用SQL语句备份语法格式为:...

2019-08-20 15:43:36 317

原创 计算机二级MySQL笔记(第十一章 访问控制与安全管理)

MySQL中的用户账号信息都存储在一个名为mysql的数据库中,数据库里有一个名为user的数据表,包含了所有账号,并且它用一个名为user的列存储用户的登录名。知道以上信息,那么我们根据以前的知识,可以轻松知道如何查看用户账号信息了吧?方法如下:select user from mysql.user; 新安装的系统只有一个名为 root 的用户,拥有对整个服务器的完全控制的权限。在实际操...

2019-08-19 21:57:03 268

原创 计算机二级MySQL笔记(第十章 存储过程)

存储过程概述在数据库的实际操作中,经常一个完整的操作需要多条语句处理多个表才能完成,而SQL语句在执行过程中,需要先编译,再执行,当需要执行的SQL语句很多时,执行效率就成了一个瓶颈问题。存储过程因此而诞生。存储过程是一组为了完成某特定功能的SQL语句集。这组语句集经过编译后,会存储在数据库中,可随时调用执行,而不必重新编译,从而加大执行效率。所以,存储过程有以下几个优点:增强SQL语句的...

2019-08-17 12:15:34 1714

原创 计算机二级MySQL笔记(第九章 事件)

事件调度器需要在指定时刻才被执行的某些特定任务就是事件。事件由一个特定的线程来管理,就是“事件调度器”。事件和触发器相似,都是在某些事情发生时启动,因此事件也可以称为临时触发器。事件是基于特定时间周期来触发执行,而触发器是基于某个表产生的动作来触发。事件取代了原先只能由操作系统的计划任务来执行的工作,而且MySQL的事件调度器可以精确到每秒钟执行一个任务,而操作系统的计划任务只能精确到...

2019-08-13 15:54:05 406

原创 计算机二级MySQL笔记(第八章 触发器)

触发器是一个被指定关联到一个表的数据库对象,当对一个表的特定事件出现时,它将会被激活。触发器可以实现比约束更复杂的数据约束。创建触发器触发器必须引用永久性表,不能是临时表或视图;同一个表不能拥有两个相同触发时刻和事件的触发器;每个表最多支持6个触发器,即INSERT、UPDATE、DELETE的之前和之后;--创建语法create trigger trigger_name ...

2019-08-12 17:39:35 1309 1

原创 计算机二级MySQL笔记(第七章 视图)

视图概述视图是一张虚拟表。视图的存在形式是一组SQL语句,其数据来源于引用的真实表,其自身并不存储数据。并且数据是引用视图时动态生成的。具有和表相同的查询操作方法,以及受限制的更新、删除、修改等。这里可以参考官方文档 视图的限制。没读懂~~集中分散数据。简化查询语句。重用SQL语句。保护数据安全。共享所需数据。更改数据格式。创建视图create view--创建...

2019-08-08 15:57:31 748

原创 计算机二级MySQL笔记(第六章 索引)

MySQL中的索引类型有:普通索引(index或key):可以取空值或重复值。唯一性索引(unique):索引列值不能重复。主键索引(primary key):主键索引时一种唯一性索引,不同在于,其索引列值不能为空。聚簇索引 :索引顺序就是数据存储的物理存储顺序,一个表只能有一个聚簇索引,目前仅支持solidDB和InnoDB存储引擎。非聚簇索引:索引顺序与数据的物理排列顺序无关。全...

2019-08-07 17:36:00 1525

原创 计算机二级MySQL笔记(第五章 数据更新)

插入数据insert into语句-- 最好指定出字段名,增加代码可读性,并防止出错。--插入一条记录insert into tb_student(studentNo, sex, birthday)values('2013110102', '男', '1996-11-30');--插入多条记录inert into tb_student(studentNo, sex, birth...

2019-08-05 17:15:06 633

原创 计算机二级MySQL笔记(第四章 数据查询)

单表查询选择字段--查询所有字段select * from tb_student;--查询指定字段select claccNo, department from tb_class;--查询经过计算的列select sutudentName, sex, 'Age:', year(now())-year(birthday) from tb_student; --select后可以是字...

2019-08-01 17:24:51 3998

原创 计算机二级MySQL笔记(第三章 数据定义)

创建数据库create database if not exists db_school default character set gb2312 default collate gb2312_chinese_ci;-- 创建名为 db_school 的数据库-- mysql默认对大小写不敏感-- character set: 指定数据库字符集,默认字符集为latin1,此处为中文字符...

2019-07-30 11:34:33 1983 1

原创 【每日一练】python中的深拷贝与浅拷贝

拷贝与赋值探讨深拷贝与浅拷贝之前,我们先弄清楚拷贝与赋值的区别:x = [1,2,3] #变量xy = x #赋值z = x.copy() #拷贝#赋值和拷贝显示的结果相同print(x) #[1, 2, 3]print(y) #[1, 2, 3]print(z) #[1, 2, 3]#通过id()函数发现赋值不改变id,就是内存地址,而拷贝会重新分配一个idprint(...

2019-07-23 14:58:46 153

原创 【每日一练】python实现九宫格数独小游戏

题目有1~9个数字,将他们填入一个3*3的九宫格中,使得他们的每行,每列,以及对角线上的和相等,且要求每个格子的数字不可以重复。使用python列出所有可能的组合。示例如下:思路1、每行,列,对角线的和相等,那么和一定为15。2、找出所有三个数和为15的组合。3、再上一步的基础上,找出使每行、每列、对角线和相等的所有组合。代码# 找出所有和为15的三个数的组合from ite...

2019-07-22 21:47:20 6331

原创 【每日一练】:用python打印乘法口诀

考核点使用print()函数正确的分行,分列。函数用法:print(*objects, sep=' ', end='\n')object:打印内容sep:分隔符,默认空格符end:结束符,默认换行符代码for i in range(1,10): for j in range(1, i+1): # 输出格式化字符串,以'\t'结尾,否则默认以换行符结尾,...

2019-07-22 16:37:39 954

原创 python将时分秒转换成秒

处理数据的时候遇到一个问题,从数据库里导出的数据是时分秒的格式:hh:mm:ss ,现在我需要把它转换成秒,方便计算。原数据可能分两种情况,字段有可能是文本字符串类型的,也有可能是时间类型,他们的处理方法不一样,所以我们分开讨论。1、字符串类型转换成秒可以将其用 ‘:’ 分隔开,分别得出时、分、秒,即可计算出秒数。所以我们定义如下函数:def str2sec(x): ''' ...

2019-07-15 22:07:25 22211 4

原创 python将小数转换成百分数

处理数据得时候遇到一个小问题,如何用 pandas 将小数转换成百分数?数据源是这样的,一个名为 “data.xlsx” 的 excel 文件:代码如下:import pandas as pd# 导入pandas库data = pd.read_excel(r"C:\Users\chih-cheng\Desktop\data.xlsx")# 读取数据data['人员利用率'] = ...

2019-07-15 20:49:03 16374 1

原创 插入排序:python实现及优化

原理通过构建有序序列,对于未排序的数据,在已排序的序列中,从后向前扫描,找到相应位置并插入。python实现步骤1、默认把第一个元素看作有序序列。2、从第二个元素开始遍历,依次将元素与上一个元素比较,如果小于,则将上一个元素向后挪一个位置;如果相等,位置想对不变。3、继续与上上一个位置的元素比较,直到找到比它小的元素,将其插入在该元素的后面即可。(注意交换和插入动作在代码实现上的...

2019-06-30 17:34:14 1059 1

原创 选择排序:python实现

原理每一次从待排序的数据元素中选出最小(或最大)的一个元素,存放在序列的起始位置,然后,再从剩余未排序元素中继续寻找最小(大)元素,然后放到已排序序列的末尾。以此类推,直到全部待排序的数据元素排完。python实现def selection_sort(arr): for i in range(len(arr)-1): min_index = i f...

2019-06-26 16:44:49 5464 1

原创 冒泡排序:python实现及优化

冒泡排序原理从第一个元素开始(可以从第一个,也可以从最后一个),相邻两两元素进行比较大小,将较大的那个往后移动,否则,两个元素位置不变;直到将最大的元素排到最后面;接着再次循环上述过程,从头开始,依次两两元素比较,而上依次循环中已经排好的元素(即已经排到最后面的元素)就不用参与比较了。python实现根据冒泡排序的定义,我们可以用python代码实现def bubble_sort(it...

2019-06-25 17:30:52 1039

原创 pandas:数据结构DataFrame

介绍一些pandas常用的属性和方法:创建对象#常通过嵌套列表、字典、numpy方法创建dataframe;index,columns参数设定行列索引。df1 = pd.DataFrame([[0, 2, 3], [0, 4, 1], [10, 20, 30]], index=[4, 5, 6], columns=['A', 'B', 'C'])df2 = pd.DataFrame({'c...

2019-06-21 12:10:13 487

原创 列表与元组,到底用哪个?

在之前的文章《python数据分析(python基础语法)》中介绍过pythond中的六种标准的数据结构,其中列表list,元组tuple长得非常像,你有没有想过,列表和元组到底区别在哪儿呢?本篇文章将回答你的问题。我们先来回顾下他们的基本概念及方法:列表list和元组tuple,都是一个可以放置任意数据类型的有序集合,并且都可以随意嵌套。列表list是动态的,长度大小不固定,可以随意增加...

2019-05-15 14:26:24 1616

原创 Pandas:数据结构Series

本篇文章开始向大家介绍python中另一个数据科学计算必备的库:pandas,我把它理解成python中Excel,源于其便捷强大的数据处理能力。pandas主要有两种数据结构:Series和DataFrame,前者是一维数组,后者是二维数组,类似excel中的表格数据结构。基本概念Series是带有标签的一维数组,可以保存任何数据类型(整数、字符串、浮点数等),轴标签统称为索引。Seri...

2019-05-15 00:08:25 293

原创 Numpy-随机数

这里要介绍一个numpy.random()函数,该函数包含多种概率分布的随机样本,是数据分析辅助的重点工具之一,我们来看下它的强大之处。numpy.random.rand():生成一个[0,1)之间的N维随机浮点数组(均匀分布)import numpy as npa = np.random.rand() # 生成一个随机浮点数b = np.random.rand(4) # 生成形...

2019-05-01 23:53:05 373

原创 Numpy-索引及切片

索引和切片在基础语法那篇文章中介绍过,python内置的数据类型基本都可以使用索引和切片,numpy是一个数组对象,我们来看看它的索引和切片有什么不同的地方。普通索引及切片# 一维数组:和python中的列表一样ar = np.arange(20)print(ar)print(ar[4])print(ar[3:6])# 二维数组ar = np.arange(16).reshape...

2019-05-01 23:13:45 613

原创 Numpy-通用函数

上篇介绍了numpy的基础数据结构:ndarray,本篇介绍它的常用方法与函数。数组形状# .T/.reshape()/.resize()ar1 = np.arange(10)ar2 = np.ones((5,2))print(ar1,'\n',ar1.T)print(ar2,'\n',ar2.T)print('------')# .T方法:转置,例如原shape为(3,4)/...

2019-05-01 22:45:54 263

原创 Numpy-基础数据结构

Numpy是python中一个运行速度非常快的的数学库,主要用于数组计算,包含:一个强大的N维数组对象 ndarray广播功能函数线性代数、傅里叶变换、随机数生成等功能接下来,我会系列介绍Numpy的知识点,包含其基础数据结构,通用函数,索引及切片,随机数生成,数据的读取与输出。本篇先从numpy的基础数据结构开始。事实上,pyhton中一个更常用且强大的工具包pandas就是在nu...

2019-05-01 21:54:29 960

原创 python操作excel(二):自动填充

Excel中有个非常好用且常用的功能就是自动填充,想必常用excel的小伙伴都了解,那么python能否实现这个功能呢?答案是肯定的,pandas模块可以很好的完成这项工作,而且更加灵活。一起来看下如何用代码实现吧。首先,我们需要一个测试文件,路径位于本人的电脑桌面,名为“填充.xlsx”,如下截图,长的就像箭头左边那样;现在我要把它做一个自动填充,填充结果成箭头右边那样。我们的要求是:...

2019-04-28 16:48:06 10363

原创 python操作excel(一):创建/读取文件

创建文件import pandas as pddf=pd.DataFrame()df.to_excel(r'C:\Users\chih-cheng\Desktop\测试\测试.xlsx')print('done!')结果如下:可以看到成功创建一个test.xlsx文件夹。

2019-04-26 16:32:28 2528 1

原创 计算机二级MySQL数据库设计学习笔记(2)

一、MySQL语言组成数据定义语言(DDL):CREATE, ALTER, DROP数据操纵语言(DML):SELECT, INSERT, UPDATE, DELETE数据控制语言(DCL):GRANT, REVOKE二、MySQL常用函数聚合函数count(), sum(), avg(), max(), min()数学函数ABS(), floor(), ...

2019-01-07 22:39:26 1620

原创 计算机二级MySQL数据库设计学习笔记(1)

一、基本概念与方法1. 数据库基础知识数据:描述事物的符号记录成为数据,有多种表现形式。数据库:长期储存在计算机内的,有组织的,可共享的数据集合。数据库管理系统:位于操作系统与用户之间的一层数据管理软件,是数据库系统的核心。数据库管理系统的主要功能:数据定义:定义数据对象数据操纵:增删改查数据库的建立与维护:插入、转换,转储,恢复 等功能提供可供开发的接口和工具数据库系统:引...

2019-01-03 22:13:45 2405 3

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除