自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(35)
  • 收藏
  • 关注

原创 第三章 复杂一点的查询

3.1 创建出满足下述三个条件的视图(视图名称为 ViewPractice5_1)。使用 product(商品)表作为参照表,假设表中包含初始状态的 8 行数据。• 条件 1:销售单价大于等于 1000 日元。• 条件 2:登记日期是 2009 年 9 月 20 日。• 条件 3:包含商品名称、销售单价和登记日期三列。对该视图执行 SELECT 语句的结果如下所示。SELECT * FROM ViewPractice5_1;create view ViewPractice5_1(prod.

2021-11-21 16:15:10 298

原创 第二章:基础查询与排序

1.1 编写一条SQL语句,从 product (商品) 表中选取出“登记日期( regist_date )在2009年4月28日之后”的商品,查询结果要包含 product name 和 regist_date 两列。select regist_date,product namefrom productwhere regist_date > '2009-04-28';1.2 请说出对product 表执行如下3条SELECT语句时的返回结果。①SELECT *FROM .

2021-11-18 01:11:34 566

原创 第一章:初识数据库

1.1 编写一条 CREATE TABLE 语句,用来创建一个包含表 1-A 中所列各项的表 Addressbook (地址簿),并为 regist_no (注册编号)列设置主键约束CREATE TABLE Addressbook(regist_no integer not null,name varchar(128) not null,address varchar(128) not null,tel_no char(10),mail_address char(20),primary .

2021-11-16 20:54:18 360

原创 集成学习(上)——p1——机器学习的分类

无监督学习(Unsupervised Learning)

2021-03-15 22:18:53 122

原创 matplotlib-第二回:艺术画笔见乾坤

2020-12-18 22:26:31 107

原创 matplotlib-第一回:Matplotlib初相识

Figure的组成两种绘图接口显式创建figure和axes,在上面调用绘图方法,也被称为OO模式(object-oriented style)依赖pyplot自动创建figure和axes,并绘图第一种:OO模式x = np.linspace(0, 2, 100)fig, ax = plt.subplots() ax.plot(x, x, label='linear') ax.plot(x, x**2, label='quadratic') ax.plot..

2020-12-14 17:31:02 91

原创 贷款违约预测---Task2 数据分析

使⽤EDA完成数据分析的过程如下:读取并分析数据质量;探索性分析每个变量;变量是什么类型;变量是否有缺失值;变量是否有异常值;变量是否有重复值;变量是否均匀;变量是否需要转换;探索性分析变量与target标签的关系;变量与标签是否存在相关性;变量与标签是否存在业务逻辑;探索性分析变量之间的关系;连续型变量与连续型变量;可视化:散点图、相关性热⼒图;⽪尔逊系数;互信息;离散变量与离散变量;可视化:柱状图、饼图、分组表;卡⽅检验;检查变量之间的

2020-09-18 21:57:08 199

原创 贷款违约预测---Task1

分类算法常见的评估指标一、混淆矩阵混淆矩阵多用于判断分类器(Classifier)的优劣,适用于分类型的数据模型,如分类树(Classification Tree)、逻辑回归(Logistic Regression)、线性判别分析(Linear Discriminant Analysis)等方法。(1)若一个实例是正类,并且被预测为正类,即为真正类TP(True Positive )(2)若一个实例是正类,但是被预测为负类,即为假负类FN(False Negative )(3)若

2020-09-15 23:00:48 200

原创 DataWhale-动手数据分析-Task05:模型建立与评估

模型评估方法一、交叉验证K-折交叉验证(K-fold Cross Validation,记为K-CV),将原始数据分成K组(一般是均分),将每个子集数据分别做一次验证集,其余的K-1组子集数据作为训练集,这样会得到K个模型,用这K个模型最终的验证集的分类准确率的平均数作为此K-CV下分类器的性能指标。K一般大于等于2,实际操作时一般从3开始取,只有在原始数据集合数据量小的时候才会尝试取2。应用最多,K-CV可以有效的避免过拟合与欠拟合的发生,最后得到的结果也比较具有说服性。from sklear

2020-08-27 21:40:00 169

原创 DataWhale-动手数据分析-Task04:数据可视化

**复习:**回顾学习完第一章,我们对泰坦尼克号数据有了基本的了解,也学到了一些基本的统计方法,第二章中我们学习了数据的清理和重构,使得数据更加的易于理解;今天我们要学习的是第二章第三节:数据可视化,主要给大家介绍一下Python数据可视化库Matplotlib,在本章学习中,你也许会觉得数据很有趣。在打比赛的过程中,数据可视化可以让我们更好的看到每一个关键步骤的结果如何,可以用来优化方案,是一个很有用的技巧。第二章:数据可视化%matplotlib inlineimport numpy as np

2020-08-25 21:45:34 215

原创 DataWhale-动手数据分析-Task02:数据清洗及特征处理

#加载所需的库import pandas as pdimport numpy as np#加载数据train.csvtrain = pd.read_csv('train.csv')2 第二章:数据清洗及特征处理我们拿到的数据通常是不干净的,所谓的不干净,就是数据中有缺失值,有一些异常点等,需要经过一定的处理才能继续做后面的分析或建模,所以拿到数据的第一步是进行数据清洗,本章我们将学习缺失值、重复值、字符串和数据转换等操作,将数据清洗成可以分析或建模的亚子。2.1 缺失值观察与处理我们拿到

2020-08-23 22:39:33 209

原创 资金流入流出预测01.数据探索与分析

1 、每日总购买量与赎回量的时序图可以发现,2014年4月之后较其之前的时间时序图比较平稳,没有较大的波动。2、4月份以后的时间序列图每个月大约有4个波峰申购总量与赎回总量每个月都会有4个波峰,而且两者有一定的协同性月末赎回量大于购买量以下图表时间范围位于201404-2014083、周一至周末申购总量与赎回总量中位数4、赎回总量、购买总量与周一至周末的相关性相关系数较小,不存在线性相关关系验证独立性购买总量、赎回总量与周一至周末有1%的可能性不

2020-08-20 22:39:00 250

原创 DataWhale-动手数据分析-Task01:数据加载及探索性数据分析

part1 :数据加载1.1 载入数据1.1.1 任务一:导入numpy和pandas1.1.2 任务二:载入数据【提示1】相对路径载入报错时,尝试使用os.getcwd()查看当前工作目录。【思考2】知道数据加载的方法后,试试pd.read_csv()和pd.read_table()的不同,如果想让他们效果一样,需要怎么做?了解一下'.tsv'和'.csv'的不同,如何加载这两个数据集?1.1.3 任务三:每1000行为一个数据模块,逐块读取【思考】什么是逐块读取?为什么要逐块读取呢?1.1.4 任务四.

2020-08-16 22:53:31 6218

原创 python基础——task9

练习题:1、打开中文字符的文档时,会出现乱码,Python自带的打开文件是否可以指定文字编码?还是只能用相关函数?linux使用’utf-8’编码方式,window使用’GBK’编码方式。linux平台编码(UTF-8)与window平台(GBK)不一样。可以使用open(encoding=xx)进行转码2、编写程序查找最长的单词输入文档: res/test.txt题目说明:"""Input file test.txt Output file ['general-p

2020-08-09 01:23:17 108

原创 python基础——task8打卡

练习题一:1、怎么查出通过 from xx import xx导⼊的可以直接调⽤的⽅法?利用help函数查看function2、了解Collection模块,编写程序以查询给定列表中最常见的元素。题目说明:输入:language = [‘PHP’, ‘PHP’, ‘Python’, ‘PHP’, ‘Python’, ‘JS’, ‘Python’, ‘Python’,‘PHP’, ‘Python’]输出:Python"""Input filelanguage = ['PHP', 'PH

2020-08-07 21:56:29 129

原创 python基础——task7打卡

练习题:1、以下类定义中哪些是类属性,哪些是实例属性?class C: num = 0 def __init__(self): self.x = 4 self.y = 5 C.count = 6num,C.count是类属性self.x,self.y是实例属性2、怎么定义私有⽅法?在 Python 中定义私有变量只需要在变量名或函数名前加上“__”两个下划线,那么这个函数或变量就会为私有的了。3、尝试执行以下代码,并解释

2020-08-05 22:58:47 203

原创 python基础——task6

练习题:1. 怎么给函数编写⽂档?def functionname(parameters): "函数_文档字符串" function_suite return [expression]'''查看函数文档'''print(MyFirstFunction.__doc__) help(MyFirstFunction)2. 怎么给函数参数和返回值注解?参数注解就是,在定义函数的时候,参数列表内部的参数后面,加上冒号和要传入的类型,例:def accumlate(x:i

2020-08-02 13:22:38 193

原创 python基础——task5

练习一1、字典基本操作字典内容如下:dic = { 'python': 95, 'java': 99, 'c': 100 }用程序解答下面的题目字典的长度是多少print('字典长度为:',len(dic))# 字典长度为: 3请修改’java’ 这个key对应的value值为98dic['java'] = 98print(dic)# {'python': 95, 'java': 98, 'c': 100}删除 c 这个keydel

2020-07-30 12:30:35 914

原创 python基础——打卡task4

练习一1、列表操作练习列表lst 内容如下lst = [2, 5, 6, 7, 8, 9, 2, 9, 9]请写程序完成下列操作:在列表的末尾增加元素15在列表的中间位置插入元素20将列表[2, 5, 6]合并到lst中移除列表中索引为3的元素翻转列表里的所有元素对列表里的元素进行排序,从小到大一次,从大到小一次lst = [2, 5, 6, 7, 8, 9, 2, 9, 9]lst.append(15)lst.insert(int(len(lst)/2),20)lst[0]

2020-07-27 21:51:14 370

原创 python基础——打卡task3

异常处理一、格式1 通用格式2 情况一3 情况二:获取Exception的错误原因4 情况三:try...except..(多个except)...else5 情况四:try...except...finally二、异常抛出练习题一、格式1 通用格式try: 可能出现异常的代码except: 如果有异常执行的代码[finally: 无论是否存在异常都会被执行的代码] # 可有可无2 情况一try: 有可能会产生多种异常except 异常的类型1:

2020-07-25 16:54:24 148

原创 python基础——打卡task2

python基础——打卡task21、编写一个Python程序来查找那些既可以被7整除又可以被5整除的数字,介于1500和2700之间。# your code herefor i in range(1500,2701): if (i%5==0) and (i%7==0): print(i)2、龟兔赛跑游戏题目描述:话说这个世界上有各种各样的兔子和乌龟,但是研究发现,所有的兔子和乌龟都有一个共同的特点——喜欢赛跑。于是世界上各个角落都不断在发生着乌龟和兔子的比赛,小华对此很感兴趣,于是决定

2020-07-23 21:19:41 161

原创 python基础——打卡task1

练习一1、怎样对python进行注释?(1)# 井号(2)’’‘注释内容’’’ (单三引号)(3)""“注释内容”"" (双三引号)2、python有哪些运算符,这些运算符的优先级是怎样的?python运算符包括:(1)算数运算符:+、-、*、/、//(整除)、%、**(2)比较运算符:>、>=、<、<=、==、!=(3)逻辑运算符:and、or、not(4)位运算符:– ①按位取反:~– ②按位与:&– ③按位或:|–

2020-07-22 21:10:58 107

原创 第四章-变形

四、问题与练习1. 问题【问题一】 上面提到了许多变形函数,如melt/crosstab/pivot/pivot_table/stack/unstack函数,请总结它们各自的使用特点。pivot函数不能分组,index和columns不能完全相同,否则会报错pivot_table函数(1)有分组功能,可以通过aggfunc参数对组内数据进行聚合统计,可传入各类函数,默认为mean(...

2020-04-28 18:33:35 262

原创 第三章——分组

问题与练习1. 问题【问题一】 什么是fillna的前向/后向填充,如何实现?前向填充df = pd.DataFrame([[np.nan, 2, np.nan, 0], [3, 4, np.nan, 1], [np.nan, np.nan, np.nan, 5], [np...

2020-04-26 23:12:06 404

task2-pandas__索引

【练习一】 现有一份关于UFO的数据集,请解决下列问题:pd.read_csv('data/UFO.csv').head()(a)在所有被观测时间超过60s的时间中,哪个形状最多?import pandas as pddf = pd.read_csv('data/UFO.csv')df.rename(columns={'duration (seconds)':'duration'},...

2020-04-23 22:49:08 421

原创 Day1---pandas基础

问题与练习1. 问题【问题一】 Series和DataFrame有哪些常见属性和方法?对于一个Series,其中最常用的属性为:值(values),索引(index),名字(name),类型(dtype)【问题二】 value_counts会统计缺失值吗?不会统计缺失值【问题三】 与idxmax和nlargest功能相反的是哪两组函数?idxmin和nsmallest【问题四】 ...

2020-04-20 22:14:33 263

原创 函数——返回值

返回值将函数中运算的结果通过 return 关键字 ‘扔’出来print 和 return 的区别print 仅仅是在控制台打印,而 return 则是将 return 后面的部分作为返回值作为函数的输出,可以用变量接走,继续使用该返回值做其它事。1.return后面可以是一个参数def add(a, b): result = a + b print(r...

2020-04-06 13:29:27 237

原创 函数——参数

1.作用:将重复的代码,封装到函数,只要使用直接找函数。函数可以增强代码的模块化和提高代码的重复利用率。2.定义函数:格式:def 函数名([参数,参数...]): 函数体 (重复的代码)注意1:1.必须使用关键字def2.函数体注意缩进3.函数名() 绑定注意2:函数名命名规则同变量名,要满足标识符命名规则不能和系统函数重名,否则系统函数无法使用函数...

2020-04-06 12:50:31 158

原创 数据类型转换

1.字符串转整型s = '8'i = int(s)print(i,type(i)) # 8 <class 'int'>2.字符串转列表、集合,元组s = 'abc'l = list(s)print(l,type(l)) # ['a', 'b', 'c'] <class 'list'>s = 'abc's = set(s)p...

2020-04-04 18:20:02 86

原创 可变数据类型 VS 不可变数据类型

1. 不可变数据类型对象所指向的内存中的值是不可以改变int str float 元组tuplefrozenset()s1 ='abc'print(id(s1))# 1674701789424s1='abcd'print(id(s1))# 1674701880176t1 =(3,5,6)print(id(t1))t1 =(3,5)print(id(t1))...

2020-04-04 17:39:42 150

原创 集合(set)

1. 声明集合特点:不重复s1 = set() # 创建空集合,只能使用set()# 字典: {key:value,key:value,....} # 集合 {元素1,元素2,元素3,...}s2 = {1,3,7} print(type(s1)) # <class 'set'>print(type(s2)) # <class 'set'&...

2020-04-04 17:10:12 415

原创 MySQL的语法规范

MySQL的语法规范1.不区分大小写,但建议关键字大写,表名、列名小写2.每条命令最好用分号结尾3.每条命令根据需要,可以进行缩进 或 换行4.注释单行注释:# 注释文字单行注释:-- 注释文字多行注释:/* 注释文字 */...

2020-04-04 15:07:13 175

原创 MySQL常见命令

查看当前所有的数据库show databases;打开指定的库use 库名;查看当前库的所有表show tables;查看其他库的所有表show tables from 库名;创建一个表create table 表名( 列名 列类型 列名 列类型 .......);查看表结构desc 表名;查看服务器版本方式一:登录到my...

2020-04-03 18:59:38 182

原创 字典

特点:符号:{}关键字: dict保存的元素是:element列表 list [element ]元组 tuple (element )字典 dict {element }1. 定义dict = {} # 空字典dict = dict() # 空字典 # list1 = list() 空列表 tuple1=...

2020-04-03 15:17:24 259

原创 元组

元组:类似列表(当成容器)特点1.定义符号()2.元组中的内容不可以修改3.关键字:tuple1. 与列表的区别t1 = ()print(type(t1)) # 返回 <class 'tuple'>t1 = []print(type(t1)) # 返回 <class 'list'>t1 = [1]print(type(t...

2020-04-02 18:25:56 141

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除