自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 中国移动“梧桐杯”大数据应用创新大赛智慧金融初赛TOP1开源

大家好,我是小泽。刚结束金融赛道的复赛,回来修整了一会。就把初赛的代码整理一下开源给大家。比赛链接初赛要求选手依照主办方已给数据找出“羊毛党”,具体包含:利用用户通信、流量、app使用等行为数据。由于之前主要是在生活赛道,来金融的时候大家已经发现数据中奇数月和偶数月分布差异很大,并且采用1、3月份建模效果最好。所以我这一块主要还是怼的业务特征。数据处理首先是对数据做了一些转型以及填充编码处理data.replace('\\N', np.NaN, inplace=True)#所有从网络侧到用户

2021-05-02 11:55:53 3331 4

原创 leecode 2.两数相加

这题一开始进死胡同去了,其实不用考虑太多。按照平时的加法算就行,不断地更新位值和进位数即可。唯独要考虑的是最后一步可能首位会产生进位,单独判断一下即可。class Solution: def addTwoNumbers(self, l1: ListNode, l2: ListNode) -> ListNode: re = ListNode(0) r=re carry = 0 while(l1 or l2): ..

2022-02-12 10:40:25 425

原创 leecode 1.两数之和

leecode 1.两数之和解题关键主要是想找到 data = target - n。利用字典将目标值作为字典的key,而目标值的下标(即所需要返回的值)则作为对应的valueclass Solution(object): def twoSum(self, nums, target): dict = {} for i,n in enumerate(nums): data = target-n if data in

2022-02-09 16:05:58 351 1

原创 DCIC2021车辆碰撞检测Top6方案

赛题任务本赛题基于上汽通用五菱提供的新能源汽车运行数据、碰撞标注和碰撞时间,希望参赛者综合运用机器学习/深度学习等技术,实现根据车辆运行数据即可识别车辆发生碰撞的可能,及时发现用户碰撞情况赛题链接字段描述数据特征1.几乎所有都存在一个电池包主负继电器状态由连接到断开的过程,该变化时刻通常与所给碰撞标签时刻相同,也存在个别样本时刻早于碰撞时刻;2.几乎所有都存在整车电流突变为0的过程。3.发现19和94为异常样本,所给的标签时刻并不在所给的预测时间段中解题思路在发现以上两个规则后,可得出解

2021-05-02 18:00:32 1339

原创 预测分析·民宿价格预测baseline

大家好,我是小泽预测分析·民宿价格预测比赛是和鲸社区与ChallengeHub联合举办的一场新手赛,本文旨在多角度构建特征工程来帮助选手快速比赛上手。比赛链接话不多说,直接开!导入相关库import timeimport lightgbm as lgbimport matplotlib.pyplot as pltimport numpy as npimport pandas as pdimport seaborn as snsfrom sklearn import metricsfr

2021-04-10 16:31:29 7224 20

原创 Python数据科学竞赛模型融合

模型融合模型融合采用的的思想,即多个模型的组合可以改善整体的表现。集成模型是一种能在各种的机器学习任务上提高准确率的强有力技术。模型融合是kaggle竞赛后期一个重要的环节,大体来说有如下的类型方式:1. 简单加权融合:回归(分类概率):算术平均融合(Arithmetic mean),几何平均融合(Geometric mean)分类:投票(Voting)综合:排序融合(Rank averaging),log融合2. stacking/blending:构建多层模型,并利用预测结果再拟合预测3

2020-12-07 17:05:20 2410 5

原创 Hive HQL操作

实验思路首先检查Hadoop相关进程,是否已经启动。若未启动,切换到/apps/hadoop/sbin目录下,启动Hadoop。然后开启Mysql,用于存放Hive的元数据。(密码:zhangyu在终端命令行界面,直接输入Hive命令,启动Hive命令行在hive中创建一个表student在hive中创建一个表course创建本地目录/data/ans17,下载...

2019-11-29 14:06:00 743 3

原创 Hive DDL DML基本操作

任务目标1.了解Hive的基本操作2.了解Hive的外部表与普通表的区别相关知识Hive定义了一套自己的SQL,简称HQL,它与关系型数据库的SQL略有不同,但支持了绝大多数的语句如DDL、DML以及常见的聚合函数、连接查询、条件查询。DDL操作(数据定义语言)包括:Create、Alter、Show、Drop等。(1)create database- 创建新数据库(2)alter...

2019-11-29 13:44:25 279

原创 pyecharts绘制各种图像总结(小白专用)

pyecharts绘制各种图像总结(小白专用)一. 柱状图#导入柱状图-Barfrom pyecharts import Bar#设置行名columns = ["Jan", "Feb", "Mar", "Apr", "May", "Jun", "Jul", "Aug", "Sep", "Oct", "Nov", "Dec"]#设置数据data1 = [2.0, 4.9, 7.0, 2...

2019-11-29 11:44:41 2271 1

原创 下载数据存到数据库,并且查看表相关内容,python读取(简要流程)

下载数据存到数据库,并且查看表相关内容,python读取(简要流程)1.创建目录并且进入:mkdir –p /data/anscd /data/ans2.下载数据3.开启mysql:sudo service mysql start4.启动mysql服务:mysql –u root –p5.创建一个数据库并使用:create database mydatabase;us...

2019-11-29 11:44:13 584

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除