自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 【无标题】天池机器学习task4

集合运算-表的加减法和join等1、表的加减法集合在数学领域表示“各种各样的事物的总和”, 在数据库领域表示记录的集合。具体来说,表、视图和查询的执行结果都是记录的集合, 其中的元素为表或者查询结果中的每一行。在标准 SQL 中, 分别对检索结果使用 UNION, INTERSECT, EXCEPT 来将检索结果进行并,交和差运算, 像UNION,INTERSECT, EXCEPT这种用来进行集合运算的运算符称为集合运算符。一:加法:union1、表的加法:union,并集,但是会去重,就是.

2022-03-31 09:50:51 65

原创 【无标题】天池机器学习task3

一、介绍LightGBM是2017年由微软推出的可扩展机器学习系统,是微软旗下DMKT的一个开源项目,由2014年首届阿里巴巴大数据竞赛获胜者之一柯国霖老师带领开发。它是一款基于GBDT(梯度提升决策树)算法的分布式梯度提升框架,为了满足缩短模型计算时间的需求,LightGBM的设计思路主要集中在减小数据对内存与计算性能的使用,以及减少多机器并行计算时的通讯代价。LightGBM的主要优点:简单易用。提供了主流的Python\C++\R语言接口,用户可以轻松使用LightGBM建模并获得相当不错的效果

2022-03-31 09:32:15 90

原创 【无标题】天池机器学习task2

GridSearchCV,它存在的意义就是自动调参,只要把参数输进去,就能给出最优化的结果和参数。但是这个方法适合于小数据集,一旦数据的量级上去了,很难得出结果。这个时候就是需要动脑筋了。数据量比较大的时候可以使用一个快速调优的方法——坐标下降。它其实是一种贪心算法:拿当前对模型影响最大的参数调优,直到最优化;再拿下一个影响最大的参数调优,如此下去,直到所有的参数调整完毕。这个方法的缺点就是可能会调到局部最优而不是全局最优,但是省时间省力,巨大的优势面前,还是试一试吧,后续可以再拿bagging再优化。

2022-03-31 09:24:17 588

原创 【无标题】天池机器学习训练营task1

学习目标:了解 逻辑回归 的理论掌握 逻辑回归 的 sklearn 函数调用使用并将其运用到鸢尾花数据集预测Demo实践:准备软件包:我们需要现在准备一些软件包numpy:是用Python进行科学计算的基本软件包。sklearn:为数据挖掘和数据分析提供的简单高效的工具。matplotlib :是一个用于在Python中绘制图表的库。Seaborn:是在matplotlib的基础上进行了更高级的API封装,从而使得作图更加容易#调入库import numpy as npim.

2022-03-31 09:08:19 66

原创 阿里云天池task4学习笔记

一、具体的学习内容0、研究背景数据时代的到来刷新了人们探索未知的方式,从基础能源建设到航天航空工程。在关都地区真新镇大木研究所一直孜孜不倦对精灵宝可梦进行研究的大木博士也不例外,在剧中我们就常常可以看到大木博士制作的精灵图鉴一直在给探险家们提供宝可梦的简单分析,包括宝可梦的身高,体重,特性等等。但是作为从小就向往前往大木博士研究所成为宝可梦联盟最强训练师/宝可梦研究大师的我,仅仅是分析单个宝可梦的数据远远满足不了我的需求。与其他探险家旅游挑战道馆的方式不同,我决定通过使用数据分析的方式来帮助我更好的

2022-03-22 14:24:19 93

原创 【无标题】阿里云天池task3学习笔记

1、NN神经网络包含输入层、隐藏层、输出层,其中涉及的一些过程如图。两车以下内容来自Datawhale的讲义2、CNN介绍卷积神经网络(简称CNN)是一类特殊的人工神经网络,是深度学习中重要的一个分支。CNN在很多领域都表现优异,精度和速度比传统计算学习算法高很多。特别是在计算机视觉领域,CNN是解决图像分类、图像检索、物体检测和语义分割的主流模型。CNN每一层由众多的卷积核组成,每个卷积核对输入的像素进行卷积操作,得到下一次的输入。随着网络层的增加卷积核会逐渐扩大感受野,并缩减

2022-03-22 14:13:02 100

原创 阿里云天池task2学习笔记

数据结构数据结构一直以来就是我学编程的一个问题,因为我是主修硬件对编程的一些概念不是很清楚所以很多理解只能靠记和背很难说出自己的理解。列表列表的定义:列表是有序集合,没有固定大小,能够保存任意数量任意类型的 Python 对象,语法为 [元素1, 元素2, …, 元素n]。列表添加的公式:list.extend(seq) 在列表末尾一次性追加另一个序列中的多个值(用新列表扩展原来的列表)list.append(obj) 在列表末尾添加新的对象,只接受一个参数,参数可以是任何数据类型,被追加

2022-03-22 14:04:03 1075

原创 【无标题】

1 数据库简介据库是将大量数据保存起来,通过计算机加工而成的可以 进行高效访问的数据集合。该数据集合称为数据库(Database,DB)。用来管理数据库的计算机系统称为数据库管理系统(Database Management System,DBMS)。1.1 DBMS的种类DBMS 主要通过数据的保存格式(数据库的种类)来进行分类,现阶段主要有以下 5 种类型.层次数据库(Hierarchical Database,HDB)关系数据库(Relational Database,RDB)这种类型的

2022-03-22 13:48:14 76

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除