自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(31)
  • 收藏
  • 关注

原创 task2 基础查询

SELECT语句从表中取数据时需要使用到SELECT语句,基于SELECT语句包含了SELECT和FROM两个子句。SELECT name FROM table1SELECT子句列举了从表中查询出的列的名称即name,而FROM子句则指定了选取出数据的表的名称.如果要从表中取出我们想要的数据,即按条件取数的话需要使用到WHERE语句。WHERE子句SELECT语句通过WHERE子句来指定查询数据的条件。在WHERE子句中可以指定“某一列的值和这个字符串相等”或者“某一列的值大于这个数字”等条件

2021-09-17 01:36:29 172

原创 task06 Boosting

sklearn实现单一决策树和Adaboost算法1、导入相关的库# 引入数据科学相关工具包:import numpy as npimport pandas as pd import matplotlib.pyplot as pltplt.style.use("ggplot")%matplotlib inlineimport seaborn as sns2、加载UCI的机器学习库里的开源数据集,葡萄酒数据集,该数据集包含了178个样本和13个特征,从不同的角度对不同的化学特性进行描述,我

2021-08-29 22:10:30 194

原创 task05 集成学习之Bagging

目录投票法原理Bagging原理投票法原理投票法是一种遵循少数服从多数原则的集成学习模型,通过多个模型的集成降低方差,从而提高模型的鲁棒性。在理想情况下,投票法的预测效果应当优于任何一个基模型的预测效果。投票法在回归模型与分类模型上均可使用:回归投票法:预测结果是所有模型预测结果的平均值。分类投票法:预测结果是所有模型种出现最多的预测结果。分类投票法又可以被划分为硬投票与软投票:硬投票:预测结果是所有投票结果最多出现的类。软投票:预测结果是所有投票结果中概率加和最大的类。Bagg

2021-08-27 00:49:13 162

原创 task04 集成学习之关于分类问题指标

度量模型性能的指标度量分类模型的指标和回归的指标有很大的差异,首先是因为分类问题本身的因变量是离散变量,因此像定义回归的指标那样,单单衡量预测值和因变量的相似度可能行不通。评价指标真阳性TP:预测值和真实值都为正例;真阴性TN:预测值与真实值都为正例;假阳性FP:预测值为正,实际值为负;假阴性FN:预测值为负,实际值为正;分类模型的指标:准确率:分类正确的样本数占总样本的比例,即:ACC=TP+TNFP+FN+TP+TNACC = \frac{TP+TN}{FP+FN+TP+TN}ACC

2021-08-25 00:06:36 176

原创 task03 集成学习之优化基础模型

目录优化基础模型训练均方误差与测试均方误差偏差-方差的权衡特征提取以下理论内容均参考DataWhale集成学习教程内容,整理为笔记。优化基础模型在回归中,我们使用数据集去估计模型的参数,比如线性回归模型中的参数,这个数据集称为训练集。使用训练集估计回归的参数的原则一般都是使得损失函数在训练集达到最小值。我们建立机器学习模型的目的不是为了在已有的训练集上得出的效果优良,虽然这也是挺重要的,但是我们希望所建立的机器学习模型在未知且情况复杂的测试数据上表现优异,测试数据即称为测试集。假设我们根据顾客对产品

2021-08-23 00:33:13 123

原创 Task02 聊聊机器学习中回归分类问题

目录简单理解回归机器学习中的回归问题处理实战不使用sklearn构建回归模型回归模型的最小二乘线性回归中,极大似然估计与最小二乘联系与区别多项式回归在实际问题中表现经常不是很好决策树模型与线性模型之间的联系和区别简单理解回归回归有线性回归和非线性回归,线性回归字面意思就是散点呈现出一条类似于直线,非线性则为光滑曲线。回归有一个因变量和一个或多个自变量组成,一个自变量则是单变量回归,多个自变量则是多变量回归。回归可以用来预测价格或者某种东西的趋势,总之来说是连续型的。逻辑回归感觉其实不像是我们所理解

2021-08-20 00:36:15 421

原创 组队学习Task01:数学基础

前言终于抢到八月份Datawhale的组队学习内容,这一月的项目都很吸引人,挑来挑去选择了集成学习这一模块,希望可以与一群小伙伴们一起学到知识,以下是task1的学习笔记,参考内容为Datawhale集成学习开源教程。目录前言梯度向量雅克比矩阵海森矩阵函数的极值与最值最优性条件一元函数多元函数梯度向量表示某一函数在该点处的方向导数沿着该方向取得最大值,即函数在该点处沿着该方向变化最快,变化率最大。定义:设二元函数 z=f(x,y)z=f(x, y)z=f(x,y) 在平面区域D上具有一阶连续偏导数

2021-08-18 00:12:25 143

原创 python基础---异常处理

说说废话最近一直忙着一些事情好久没有更新了,加上最近电脑在跑一些大数据,也就九百万条数据,还是没有加上一些复杂模型的,结果我的jupyter notebook就崩掉了,最后迫不得已重装软件,还在苦苦配置环境中,等以后学习pytorch和tensorflow都不敢在本地上跑了。程序的异常处理今天霖小白心血来潮想来分享一下python基础中的如何异常处理,使程序有更好的用户体验。前言python程序对用户的输入有一定的要求,所以当实际输入不满足程序要求时,可能在程序运行过程中会直接报错无法进行下一步的

2021-02-27 01:31:19 179

原创 task2打卡:天池时间序列baseline学习

前言上一个task我捋顺了提交天池竞赛代码的全过程,此处跳转上一个task,过后通过baseline学习前辈的baseline,参考学习的链接跳转,以及开源学习task2优化baseline学习中是使用tensorflow的框架搭建的,也可以换为pytorch。遇到的问题一直上传不了。。。加上我的jupyter它崩了,尝试一切办法无法解决,最后不得不卸载重装,所以先打卡吧,后面继续改错。。。并且还是需要不断跟着前辈们学习。...

2021-02-26 00:29:07 155

原创 task2:2021DCIC的baseline学习

目录说在前面:上一次的思路赛题任务二自己的一点小小思路说在前面:因为突发情况,我的jupyter notebook说它服务器似乎挂掉了,尝试了很多种情况都无法解决,连换在pycharm上也不行。百度了说是GPC占内存多,但我查看了却不会。六一前辈说配置一个新的编译环境,也尝试了许多次,在配置过程中一直出错,打卡还是要打的,问题也是还要解决的,再一次次跌倒再一次次爬起,所以下面我只能根据我前一次的运行结果,然后把自己优化的一点思路说一说而已。上一次的思路传送带上一次是运用geohash库进行编

2021-02-25 01:20:56 157

原创 Task01:天池“AI Earth”人工智能创新挑战赛--比赛全流程体验

体验目录说在前面用Docker提交代码安装docker第一步开启hyper-V第二步第三步开通阿里云容器镜像服务上交代码说在前面跟着datawhale体验了一把天池竞赛的提交结果的过程,第一次接触到还是挑战挺大的,比如提交结果使用docker提交的,配置阿里云的镜像仓库花费了不少时间,不过也是成功完成了这一个流程。下面记录一下这一个过程用Docker提交代码这一次只是单纯的走了一个用docker提交代码的流程,所以代码是使用了这一次datawhale提供的开源内容开源内容网址安装docker

2021-02-22 01:42:04 770

原创 task01: 早高峰共享单车潮汐点分析感想

目录题目背景数据集分析思路安装库按学习笔记运行代码结果上交说在前面:这一次的datawhale组队学习内容是DCIC的早高峰共享单车潮汐点的群智优化以及跟着两位前辈的的开源学习笔记进行学习。题目背景为更好地掌握早高峰潮汐现象的变化规律与趋势,我们根据所给数据进行数据分析,识别出工作日早高峰07:00-09:00潮汐现象最突出的40个区域。所谓潮汐现象就是当我们要骑共享单车时发现没有了或者是我们要停放共享单车时发现这个区域没地方可停。所以我们将发生在早晚高峰时段共享单车“借不到、还不进”的问题称之

2021-02-20 01:30:23 461

原创 Task05:排序搜索计算及集合操作(学习笔记)

学习笔记目录排序sortargsort搜索numpy.argmax()numpy.argmin()numpy.nonzero()numpy.where()计数numpy.count_nonzero(a, axis = None)集合操作uniqueintersect1dunion1dsetdiff1din1d排序sort表达:numpy.sort()里面有两个参数:当axis=0时,sort方法会对对象中的元素以列为单位进行排序,默认是升序排序。当axis=1时,sort方法会对对象中的元素以行

2020-10-31 21:40:47 252

原创 Task04:数学函数及逻辑函数(学习笔记)

笔记目录算数运算numpy.addnumpy.subtractnumpy.multiplynumpy.dividenumpy.sqrt三角函数指数和对数逻辑函数numpy.allnumpy.any算数运算numpy.addadd这个单词对于我们来说都很熟悉,就是求和的意思,那么在numpy中的.add,它的功能就是两个数组对应位置的元素求和。import numpy as npa = np.arange(2, 14).reshape((3,4))np.add(a, 1)括号里面第一个参数就

2020-10-28 23:48:36 695

原创 Task:03 numpy中数组的操作(学习笔记)

学习记录目录数组的操作xxx.shape()xxx.flatxxx.flatten()数组转置数组拼接数组拆分数组的操作xxx.shape()可以通过xxx.shape()来改变数组的维数import numpy as npx = np.array([1, 2, 9, 4, 5, 6, 7, 8])x.shape = [2, 4]print(x)# [[1 2 9 4]# [5 6 7 8]]xxx.flat可以将数组转换为一维import numpy as npx = np.

2020-10-25 23:22:01 101

原创 Task02:Numpy的索引、切片和迭代

学习目录索引与切片索引获取数组的单个元素切片索引一维数组的切片二维数组的切片布尔索引数组迭代索引与切片索引数组索引是用方括号([])加序号的形式引用单个数组元素,作用就是可以选取元素或者是赋予新值获取数组的单个元素import numpy as npx = np.array([1, 2, 3, 4, 5, 6, 7, 8])print(x[2]) # 3x = np.array([[11, 12, 13, 14, 15], [16, 17, 18, 19, 20

2020-10-23 20:20:15 170 2

原创 Task01: Numpy的数据类型及数组创建(学习笔记)

学习笔记目录常量numpy.nannumpy.infnumpy.pinumpy.e数据类型时间日期和时间增量datetime64 基础datetime64 和 timedelta64 运算timedelta64 的运算数组的创建创建一个有序数组简单的运算常量numpy中的常量表达,在这里有较为常用的有四个。numpy.nan表示空值,两个np.nan是不一样的import numpy as npnp.nan # 两个np.nan是不相等的print(np.nan == np.nan) #

2020-10-20 23:30:55 116

原创 task 09 Python中的一丢丢文件的小知识

一我们在读取一个文件的内容时,需要打开这个文件。在Python程序中,可以通过内置函数open()来打开一个文件,并用相关的方法读或写文件中的内容以供程序处理和使用,同时可以将文件看作Python中的一种数据类型。打开模式执行操作‘r’以只读方式打开文件。文件的指针将会放在文件的开头。这是默认模式。‘w’打开一个文件只用于写入。如果该文件已存在则打开文件,并从开头开始编辑。即原有内容会被删除。如果该文件不存在,创建新文件。‘x’写模式,新建一个文件,如果该文件已存在

2020-08-09 20:14:27 97

原创 task 08datetime模块

datetime模块datatime模块是在Python中处理日期的标准模块在datetime模块中,提供了如下四个常用的类:date:属性:year, month和day 。time:属性:hour, minute, second, microsecond和tzinfo。datetime:日期和时间的组合。 属性:year ,month, day, hour, minute,second,microsecond和tzinfo 。timedelta:表示两个date, time或datetim

2020-08-07 22:34:51 120

原创 task7,Python中一丢丢面向对象的类的内容

定义类把具有相同属性和方法的对象归为一个类,例如可以将人类、动物和植物看成是不同的“类”。在使用类之前必须先创建类。定义并使用类class MyClass: "这是一个类"myclass = MyClass()print('输出类的说明:')print(myclass._doc_)print("显示文本信息:")help(myclass)首先定义了一个自定义类MyClass,在类体中只有一行类的说明信息“这是一个类”。然后实例化该类,并调用类的属性来显示属性.类对象使用类对象cl

2020-08-05 22:42:12 117

原创 Python函数

1.函数基础在编写python程序的过程中,可以将完成某个指定功能的语句提取出来,将其编写为函数,这样在程序中可以方便地调用函数来完成这个功能,并且可以多次调用多次完成这个功能,而不必重复的复制粘贴代码。另外,使用后也可以使得程序结构更加清晰,更容易维护。1.1定义函数在python程序中,在使用函数之前必须先定义声明函数,然后才能调用它,在使用函数时,只要按照函数定义的形式向函数传递必须的参数,就可以调用函数完成相应的功能,或者获得函数返回的结果。在python程序中使用关键字def可以定义一个函数

2020-08-02 23:47:07 315

原创 Task05:Python中的字典(详细内容)、集合(概括性)

一.字典1.使用字典字典是一种比较特别的数据类型,字典中每个成员以“键:值”对的形式成对存在。字典是以大括号“{ }”包围并且以“键:值”对的方式声明和存在的数据集合。字典与列表相比,最大的不同在于字典是无序的,其成员位置只是象征性的,在字典中通过键来访问成员,而不能通过其位置来访问该成员。1.1创建并访问字典在Python中,字典可以存储任意类型对象。字典的每一个键值“key:value”对之间必须用冒号“:”分隔,每对之间用逗号“,”分隔,整个字典包括在大括号“{ }”中。字典是由一系列“

2020-07-31 17:30:45 287

原创 Task 4 Python中的列表、元组、字符串

1.列表类型基础在Python中,用中括号"[ ]"来表示列表,并用逗号来分隔其中的元素。列表由一系列按特定顺序排序的元素组成,可以创建包含字母,数字(0~9)的列表,也可以将任何东西加入列表中,其中的元素之间可以没有任何关系。1.1创建数字列表在Python中,可以使用方法range()创建数字列表。例如使用range()创建一个包含3个数字。numbers = list(range(1,4))print(numbers)[1, 2, 3]在上面这两行代码中要注意range()的结尾参数

2020-07-28 22:05:49 368

原创 Task3 python的异常处理

1.语法错误1.1代码拼写错误在编写Python程序过程中,可能将关键字,变量名或函数名书写错误。当关键字书写错误时会提示SyntaxError(语法错误);当变量名,函数名书写错误时会在运行时给出NameError的错误提示。1.2程序不符合Python语法规范在编写程序时,经常会发生程序不符合Python语法规范的情形,例如少写了括号或冒号,以及写错表达式等。1.3缩进错误Python语言对代码缩进的要求非常严格,如果又不采用合理的代码缩进,将会抛出SyntaxError异常2.异常处理

2020-07-25 22:39:54 128

原创 Task2 python的条件循环结构

1.条件语句在Python语言中,条件语句是一种选择结构,因为是通过关键字if实现的,所以也称为if语句。if语句有“如果……则……”之意,能够根据关键字if后面的布尔表达式的结果值来选择将要执行的代码语句。Python语言中的if语句有3种,分别是if语句、if…else语句和if…elif…else语句。if语句由保留字符if、条件语句和位于后面的语句组成,条件语句通常是一个布尔表达式,结果为true和false。如果条件为true,则执行语句并继续处理其后的下一条语句;如果条件为false,则跳过该

2020-07-23 15:39:10 247

原创 Task 1 :python 的变量,运算符,数据类型以及位运算

一、注释注释一般可以帮忙阅读,理解程序的内容含义,编辑器在运行代码时会忽略这些注释,在Pytho程序中有两种类型的注释,分别是单行注册和多行注释。单行注释在Python中注释是用 # 开头。多行注释是有两种表达,第一种是用3个英文标点的单引号’’‘xxxx’’'将注释括起来,第二种是用3个英文标点的双引号""“xxxx”""将注释括起来。# 这是一个注释太多的注释混入程序代码可能可能会使代码难以理解,通常最好将一个注释块放在所解释代码的上方。当改变代码时,注释应与代码保持一致。注意错误的注释比没有注

2020-07-22 16:35:29 321

原创 Python的基本语法元素

大家好,我是霖小白,经济统计学专业,这个主要是自己学习分享,希望对大家有所帮助。先跟大家说说为啥我叫霖小白呢,因为我是作为一个小白来学习知识,而接下来我的学习分享都是一个小白一步一步学起来后所整理的知识再分享给大家。再来说说我的公众号主要有什么内容呢,我比较喜欢Python,我会跟大家一起学习Python,分享我对学习Python过程中的总结分享,这部分内容比较适合的对象是跟我一样的初学者,如果读者是已经掌握并且有一定深入了解的,那么霖小白所分享的内容或许会比较枯燥无味,也不仅仅只有这个内容,我会结合我的专

2020-07-09 20:50:00 329

原创 方差分析的小小知识

参考教材:《概率论与数理统计》峁诗松,程依明,濮晓龙

2020-06-30 18:31:35 2304

原创 假设检验一小些知识(单个正态总体均值的假设检验)

参考教材《概率论与数理统计》(主编 阳平华 吴丽镐)学习整理分享1.1假设检验的基础知识1.1.1假设检验的理解假设检验是指先对总体分布函数的类型或分布的某些参数作出某种可能的假设,然后再根据所得的样本数据对假设的正确性作出判断的过程。在统计学上,把总体X分布的各种论断的统计假设称为原假设,把假设的对立面称为对立假设。用来对假设作出判断的规则称为检验假设,简称为检验。1.1.2判断假设的依据原假设被拒绝的样本观测值所在区域称为拒绝域,也称临界域,是样本空间的一个子集,用W表示,而它的补集称为

2020-06-27 20:16:26 4826

原创 数理统计的一些概念公式

近期还是在准备考试中,所以还是手写整理了一点点内容,等考试结束一定学习latex的内容以及概率论与数理统计与python实操结合。

2020-06-24 17:07:08 362 1

原创 概率论整理

至于为什么是用手写的呢,很简单,作为小白,latex还不会用。还有就是近期要考试了,对比用mathtype写,我还是手写速度快,不过缺点就是可能有一小些人看不太懂,我已经尽量把字写好看了。参考《概率论与数理统计》(主编:阳平华 吴丽镐) 书整理。...

2020-06-22 19:59:00 662

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除