自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(15)
  • 资源 (1)
  • 收藏
  • 关注

原创 数据分析task05(2021-06-24)

数据建模及模型评估任务一:切割训练集和测试集这里使用留出法划分数据集将数据集分为自变量和因变量按比例切割训练集和测试集(一般测试集的比例有30%、25%、20%、15%和10%)使用分层抽样设置随机种子以便结果能复现【思考】划分数据集的方法有哪些?为什么使用分层抽样,这样的好处有什么?任务提示1切割数据集是为了后续能评估模型泛化能力sklearn中切割数据集的方法为train_test_split查看函数文档可以在jupyter noteboo里面使用train_test_spli

2021-06-24 01:36:23 114

原创 数据分析task04(2021-06-21)

第二章:数据可视化matplotlib可视化图案的适用场景:展示趋势变化:1.线图也叫折线图,常用来呈现时间趋势的变化2.面积图和折线图从形式上看非常相似,区别只是面积图在折线图的基础上,填充了折线下面的区域,可以让人更直观的看出数据的变化趋势。3.堆积面积图:堆积面积图是基础面积图的延伸,它将多个类别的数据变化都显示在一个图形中。它具有以下特点:1.不会出现不同分类的数据点被遮盖,被隐蔽的状况2.堆积面积图与标准面积图不同。某一分类的值并非与纵坐标完全对应,而是通过折线之间的相对高度来表达

2021-06-21 23:57:50 176

原创 2019.05.13tesk2-python基础

列表1)标志列表的标志符号是[],并用逗号来分隔其中的元素。eg:menber=[a,b,c,1,2,3,"哈哈”]2)基本操作(创建,append(),pop(),del(),拷贝)(1)append():在列表末尾,追加新的对象      eg:        >> list2 = [1, 2, 3]>> list2.append(4)>&g...

2021-06-21 22:21:58 83

原创 数据分析task03(2021.06.19)

1 第一章:数据载入及初步观察1.4 知道你的数据叫什么1.4.1 任务一:pandas中有两个数据类型DateFrame和Seriesimport numpy as npimport pandas as pdsdata = {'Ohio': 35000, 'Texas': 71000, 'Oregon': 16000, 'Utah': 5000}example_1 = pd.Series(sdata)example_1data = {'state': ['Ohio', 'Ohio',

2021-06-18 00:33:47 123

原创 数据分析task01(2021.06.15)

1 第一章:数据载入及初步观察1.1 载入数据1.1.1 任务一:导入numpy和pandasimport numpy as npimport pandas as pd1.1.2 任务二:载入数据(1) 使用相对路径载入数据df = pd.read_csv("train.csv")(2) 使用绝对路径载入数据df = pd.read_csv(r"C:\Users\Administrator\Desktop\数据分析/train.csv")【提示】相对路径载入报错时,尝试使用os.

2021-06-15 23:44:00 222

原创 Task06:综合练习

作业一:各部门工资最高的员工SELECT Department.Name Department,Employee.Name Employee,SalaryFROM Employee inner join DepartmentON Employee.DepartmentId = Department.IdWHERE Employee.Salary in(SELECT MAX(Salary) FROM Employee GROUP BY Employee.DepartmentId);结果如下:

2020-12-28 23:06:58 72

原创 Task05:SQL高级处理 组队学习

练习题1.请说出针对本章中使用的 product(商品)表执行如下 SELECT 语句所能得到的结果。SELECT product_id,product_name,sale_price,MAX(sale_price) OVER (ORDER BY product_id) AS Current_max_priceFROM product5.2继续使用product表,计算出按照登记日期(regist_date)升序进行排列的各日期的销售单价(sale_price)的总额。排序是需要将登记日

2020-12-24 18:34:21 94

原创 Task04:集合运算

笔记:一.集合运算1表的加减法1.1什么是集合运算在标准 SQL 中, 分别对检索结果使用 UNION, INTERSECT, EXCEPT 来将检索结果进行并,交和差运算, 像UNION,INTERSECT, EXCEPT这种用来进行集合运算的运算符称为集合运算符在数据库中,所有的表以及查询结果都可以视为集合,因此也可以把表视为集合进行进行上述集合运算。1.2表的加法-UNION1.2.1UNIONUNION等集合运算符通常都会除去重复的记录SELECT product_id, prod

2020-12-22 23:29:39 175

原创 Task03:复杂一点的查询

作业一:3.1创建出满足下述三个条件的视图(视图名称为 ViewPractice5_1)。使用 product(商品)表作为参照表,假设表中包含初始状态的 8 行数据。条件 1:销售单价大于等于 1000 日元。条件 2:登记日期是 2009 年 9 月 20 日。条件 3:包含商品名称、销售单价和登记日期三列。对该视图执行 SELECT 语句的结果如下所示。SELECT * FROM ViewPractice5_1;执行结果product_name | sale_price | regi

2020-12-20 22:12:48 202 2

原创 Task02:基础查询与排序

2.1 SELECT语句SELECT<列名> ,FROM <表名>;SELECT子句中列举了希望从表中查询出的列的名称,而FROM子句则指定了选取出数据的表的名称2.1.2 WHERE语句选取某些条件的数据时,使用WHERE语句SELECT <列名>,……FROM<表名>WHERE <条件表达式>;2.1.3相关法则1.星号()代表全部列的意思2.SQL中可以随意使用换行符,不影响语句执行(但是不可插入空行)。3.设定汉语别名

2020-12-17 22:23:03 218

原创 sql组队学习——Task01:初识数据库

笔记:一、初始数据库1.数据库定义:数据库是将大量数据保存起来,通过计算机加工而成的可以进行高效访问的数据集合。(DB Database)2.数据库管理系统(Database Management Sysytem DBMS):用来管理数据库的计算机系统。3.DBMS的种类:DBMS主要通过数据的保存方式(数据库种类)来进行分类。主要分为5类:层次数据库(HDB)关系数据库(RDB):1.Oracle Database:甲骨文公司的RSBMS 2.SQL Server: 微软公司的RDBMS

2020-12-15 22:00:37 206

原创 2019.05.19_test5_python

Task5(2day). 类和对象I. 面向对象类(Class): 用来描述具有相同的属性和方法的对象的集合。它定义了该集合中每个对象所共有的属性和方法。对象是类的实例。方法:类中定义的函数。类变量:类变量在整个实例化的对象中是公用的。类变量定义在类中且在函数体之外。类变量通常不作为实例变量使用。数据成员:类变量或者实例变量用于处理类及其实例对象的相关的数据。方法重写:如果从父类继承...

2019-05-19 21:26:21 139

原创 2019.05.17_test4_python

Task4(2day)1.函数关键字python中一共含有32个关键字:‘false’, ‘none’, ‘true’, ‘and’, ‘as’, ‘assert’, ‘break’, ‘class’, ‘continue’, ‘def’, ‘del’, ‘elif’, ‘else’, ‘except’, ‘finally’, ‘for’, ‘from’, ‘global’, ‘if’, ‘i...

2019-05-17 21:40:42 119

原创 2019.0515——tesk3_python

Task3(2day)Dict字典1) 定义字典是另一种可变容器模型,且可存储任意类型对象。字典的每个键值对用:分割,每个键值对之间用逗号,分割。整个字典包括在花括号中{}格式如下d = {key1 : value1, key2:value2 }2) 创建1.创建一个空字典enpty_dict = dict()print (empty_dict)2.用**kwargs可变参数...

2019-05-15 14:22:32 131

原创 2019.05.11——task1_Python基础学习

Python基础学习Task1(2day)1.环境搭建1)Anaconda环境配置学习任何语言的第一步都是选择搭建编程环境,最简单的办法就是使用Python自带的编程环境,也就是说idle的shell和编辑器,稍微讲究点的可以选择Pycharm,在讲究点就是Anconda+Pycharm了,Anaconda是一个开源的Python发行版本包含了180多个科学包及其依赖项,但是anacond...

2019-05-11 20:23:39 274

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除