自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(27)
  • 收藏
  • 关注

原创 part4-排序与分页

ORDER BY 子句在SELECT语句的结尾。DESC(descend):降序。ASC(ascend): 升序。

2023-12-03 23:57:44 392

原创 part2-基本的SELECT语句

SQL 可以写在一行或者多行。为了提高可读性,各子句分行写,必要时使用缩进每条命令以;或 \g 或 \G 结束关键字不能被缩写也不能分行关于标点符号:必须保证所有的()、单引号、双引号是成对结束的必须使用英文状态下的半角输入方式字符串型和日期时间类型的数据可以使用单引号(’ ')表示列的别名,尽量使用双引号(" "),而且不建议省略as。

2023-11-30 17:32:08 421

原创 part1-了解SQL

某种特定类型数据的结构化清单:存储在表中的数据是一种类型的数据或一个清单。决不应该将顾客的清单与订单的清单存储在同一个数据库表中。例如,在顾客表中,一个列存储着顾客编号,另。一个列存储着顾客名,而地址、城市、州以及邮政编码全都存储在各自。理解列的最好办法是将数据库表想象为一个网格。⭐主键的最好习惯 除MySQL强制实施的规则外,应该坚持的。利用特定的列对数据进行排序和过滤(如,找出特定州或特定。库设计人员都应保证他们创建的每个表具有一个主键,以便于。保存有组织的数据的容器(通常是一个文。

2023-11-21 15:01:46 67

原创 数据分析1-1、1-2、1-3

【代码】数据分析1-1、1-2、1-3。

2023-01-17 21:15:10 138

原创 决策树:分类树与回归树

决策树

2022-06-07 16:14:03 277

原创 9、回归分析

变量之间的关系有函数关系与相关关系.相关关系刻画是否相关 函数关系刻画因果关系1、相关分析2、一元线性回归3、多元线性回归4、回归诊断5、logistic回归#***回归分析***##一元线性回归************************************************************#拟合线性模型最基本的函数就是lm()lm(formula, data, subset, weights, na.action, method = "qr", model =

2022-05-29 14:23:07 267

原创 2、抽样与分布

#抽样与分布##常用的统计函数#library(stats)length(x)#长度sum(x)#求和prod(x)#给出 x 中所有元素的乘积min(x)max(x)#最大值which.min(x)which.max(x)#x中元素最大值所在位置mean(x)#均值median(x)#中位数mad(x)#中位数绝对偏差var(x)#方差sd(x)#标准差range(x) #极差quantile(x)#分位数quantile(x,prob) #求任意概率的分位数 自己设定的

2022-05-24 16:40:28 121

原创 1.5、R语言快速入门

#数据框(data frame)的建立#一个数据框就是将许多向量组合起来的一个对象,它是二维的,通常其列表示变量, 其行表示观测. 显示数据框时左侧会显示观测值的序号.read.table()read.csv()read.delim()x <- c(42, 7, 64, 9)y <- 1:4z <- data.frame(INDEX=y, VALUE=x)z#数据框中向量必须有相同的长度或长度有倍数关系weight <- c(70.6, 56.4, 80, 59.

2022-05-18 17:16:06 409

原创 1、R语言快速入门

###R的快速入门#####1 R的基本语法##***************************************************************#求助*help.start()#启动R的web帮助?rnormhelp(rnorm)#显示“rnorm”函数的帮助页面,包括它所在的程序包(package), 详细的描述, 用法以及例子等apropos(“norm”) #获得名字中带字符“norm”的所有函数args(rnorm) #得到rnorm函数的自变量列表#注

2022-05-14 16:30:47 1214

原创 主成分分析与因子分析

用比较少数的指标来对所有的变量进行描述主成分分析是因子分析的一个特例。核心思想是“变量降维”例如数据点是四维的;也就是说,每个观测值是4维空间中的一个点。我们希望把4维空间用低维空间表示。先假定只有两维,即只有两个变量,它们由横坐标和纵坐标所代表;因此每个观测值都有相应于这两个坐标轴的两个坐标值。如果这些数据形成一个椭圆形状的点阵(这在变量的二维正态的假定下是可能的),那么这个椭圆有一个长轴和一个短轴。在短轴方向上,数据变化很少;在极端的情况,短轴如果退化成一点,那只有在长轴的方向才能够解释这些点

2022-04-08 16:41:18 1105

原创 第3章 趋势

趋势(时序中确定性的信息)确定性趋势与随机趋势

2022-03-28 22:54:51 1941

原创 第2章 基本概念

时间序列与随机过程时间序列:随机性、有序性因此我们用随机变量序列来描述,将随机变量序列称为一个随机过程。对于随机过程的精确描述——多元分布(很难完成)对于随机过程的大致描述——均值、方差和协方差(退而求其次)时间序列不是精准模型,只是相对可接受的模型。注:我们只关注一阶矩、二阶矩及协方差均值、方差和协方差重要公式均值函数自相关函数ps:只能分析线性关系随机游动均值函数协方差函数方差自相关函数滑动平均平稳性可分析的时间序列是平稳时间序列严平稳的随机过程:均值函数是常数

2022-03-27 16:58:11 406

原创 第1章 引论

判断数据是否适合用来做时间序列分析定性分析时序图(必须作出来):在某些阶段呈现一定的规律性、重复性(可以是绕着某个值上下波动,也可以是类似于季节性的那种)类似锯齿一样的(艾奥瓦州迪比克月平均气温时序图)信息较多2个时刻配对(前后年:例如洛杉矶当年与去年的降水的散点图)的散点图:必须是近似线性,可以在某个带状区域...

2022-03-27 15:29:15 684

原创 python基础:7、函数

定义函数#定义函数def greet_user(): """显示简单的问候语""" print("Hello!") greet_user()#向函数传递信息def greet_user(username): """显示简单的问候语""" print("Hello,"+username.title()+"!") greet_user("jesse")#实参和形参#username是形参 jesse是实参#414def display_mess

2022-03-25 22:52:39 785

原创 python基础:6、用户输入和while循环

input()#input()message=input("Tell me something,and I will repeat it back to you:")print(message)name=input("Please enter your name:")print("Hello,"+name+"!")prompt="If you tell us who you are,we can personalize the messages you see."prompt += "\nWh

2022-03-24 23:47:35 1051

原创 python基础:5、字典

#字典#一个简单的字典alien_0={"color":"green","points":5}print(alien_0["color"])print(alien_0["points"])#字典是一系列键—值对#添加键值对alien_0={"color":"green","points":5}print(alien_0)alien_0["x_position"]=0alien_0["y_position"]=25print(alien_0)#创建一个空字典alien_0={}

2022-03-23 23:33:30 858

原创 1、R入门

R入门1、基本语法2、主要数据结构3、图形功能4、编程基础R的基本语法1、求助代码作用help.start()启动R的Web帮助?rnorm/help(rnorm)显示"rnorm“函数的帮助apropos(“norm”)获得名字中带字符”norm“的所有函数args(rnorm)得到rnorm函数的自变量列表2、注意!R命令提示符 >R名称和命令大小写敏感!R命令中不可以使用全角的标点3、语法符号&g

2022-03-20 21:35:08 362

原创 python基础:4、if语句

#if语句cars=["audi","bmw","subaru","toyota"]for car in cars: if car == "bmw": print(car.upper()) else: print(car.title())AudiBMWSubaruToyota#5.2条件测试:每条if语句的核心都是一个值为True或False的表达式,这种表达式被称为 条件测试。#5.2.1检查是否相等car="www"car=="www"

2022-01-18 17:29:56 232

原创 2、模型选择与评估

错误率E=a/m精度=1-错误率将学习器的实际预测输出与样本的真实输出之间的差异称为“误差”在训练集上的称为“训练误差”/“经验误差”在新样本上的误差称为“泛化误差”1、“过拟合”:把训练样本自身的特点当作所有潜在样本都会有的一般性质。常见原因:学习能力过于强大2、“欠拟合”:对训练样本的一般性质没有学好。常见原因:学习能力不行过拟合是无法彻底避免的 我们只能缓解,减小其风险。理想的选择方案是对候选模型的泛化误差进行评估,选择泛化误差最小的模型.但是我们无法直接获得泛化误差,而训练误差

2022-01-12 00:43:20 254

原创 1、基础概念

机器学习:关于学习算法的研究从数据中学得模型,而后不断评估优化。模型:泛指从数据中学到的结果数据集(data set):例:多条记录 (示例/样本/特征向量), 一条记录对应一个西瓜 (色泽=青绿,根蒂=蜷缩,敲声=浊响) (色泽=乌黑,根蒂=稍蜷,敲声=沉闷)(色泽=浅白,根蒂=硬挺,敲声=清脆)…色泽、根蒂、敲声:属性/特征 青绿、乌黑…:属性值属性张成的空间即为属性空间/样本空间/输入空间例如一个由西瓜三个属性张成的三维空间,里面每个点对应一个西瓜。1、输入:从数据中

2022-01-11 00:55:47 601

原创 Python基础知识:3、操作列表

遍历、循环。#for循环magicians=["alice","david","carolina"]for magician in magicians: print(magician)

2021-10-27 00:30:00 82

原创 Python基础知识:2、列表简介

列表[]:一系列按特定顺序排列的元素。#索引从0开始 最后一个索引是-1 0,1,.......,-1 -1的位置在最后一个逗号后面 #访问列表bicycles=["trek","cannondale","redline","specialized"]print(bicycles[0].title())#使用列表的值message="Hi"+bicycle[0].title+"!"print(message)#动手414#修改列表元素bicycles[0]="du

2021-10-23 23:25:06 58

原创 Python基础知识:1、变量和简单数据类型

1、变量只包含字母数字下划线:例如mess_age 不可数字开头不包含空格不将python关键字和函数名作为变量名2、简单数据类型字符串:用引号(无论单双)引起的都是字符串修改字符串大小写:#1 .title()name="my cat"print(name.title())>>>My Cat#2 .upper() .lower()name="my cat"print(name.upper())print(name.lower())>>>

2021-10-21 16:01:34 62

原创 Datawhale-task04-数据可视化-2021/7/19

2021-07-19 14:44:02 53

原创 Datawhale-task03-数据重构-2021/7/17

2021-07-17 20:04:53 78

原创 Datawhale-task02-数据清洗及特征处理-2021/7/15

总结:将缺失值、重复值进行处理,将一些特征进一步处理以便于后续的分析。

2021-07-15 16:59:44 80

原创 Datawhale-task01-数据加载及探索性数据分析-2021/7/13

1、数据载入及初步观察(1)载入数据数据导入numpy和pandas载入数据(绝对路径/相对路径 ps:注意数据格式)每1000行为一个数据模块,逐块读取表头改中文,索引改成乘客ID(2)初步观察数据基本信息观察前10行和后15行数据判断数据是否为空,空值返回True,其余为False(3)保存数据总结:把一堆数据进行整理呈现出来,方便后续分析。2、pandas基础3、`...

2021-07-13 20:27:15 107

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除