自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 共享单车潮汐点分析——Task02

文章目录前言一、经纬度的匹配停车点处理Geohash经纬度匹配二、区域流量与潮汐统计提取时间数据使用透视表统计每个区域不同时间的流入流出量进行数据可视化三、Geohash匹配计算潮汐四、按照最近邻经纬度的距离匹配计算改进方向前言几日前运行了大佬的baseline以后,便只是简单的提交了结果,没有进行代码解读,在后面的baseline改进任务中,由于才疏学浅所以打算先学习好baseline的详细思路,而后观摩大佬们的改进思路进行学习。PS:以下多得于鱼佬和水哥的分享而记的学习笔记。一、经纬度的..

2021-02-24 21:55:29 928

原创 早高峰共享单车潮汐点的群智优化-Task01

早高峰共享单车潮汐点的群智优化DCIC2021算法分析题赛题介绍赛题任务功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入DCIC2021算法分析题赛题介绍共享单车,延伸了城市公共交通脉络,解决了市民出行“最后一公里”问题。然而,

2021-02-20 00:04:20 563 2

原创 Go入门day02——理解数据类型、关键字、标识符

学习内容:1、 数据类型2、 关键字3、 标识符数据类型:数据类型让编程语言、编译器、数据库和代码执行环境知道如何操作和处理数据。编程语言和数据库常常根据数据类型赋予程序不同的功能和性能。大多数编程语言害提供了用于处理常见数据的标准库,而数据库提供了查询语言,让程序员能够根据底层数据类型来查询数据以及与之交互。1.按类别分:布尔型:只可以是常量 true 或者 false。若无赋值,默认为false。eg:var b bool = true数字类型:整型和浮点型。位的运

2020-12-15 21:09:16 148

原创 Go语言学习——day01

学习目标:go语言初探学习目录:1、 Go语言特性2、 语言结构3、Go环境配置学习内容:一、Go语言特性自动垃圾回收更丰富的内置类型函数多返回值错误处理匿名函数和闭包类型和接口并发编程反射语言交互性二、语言结构包声明引入包函数变量语句 & 表达式注释package mainimport "fmt"func main() { /* Always Hello, World! */ fmt.Println("Hello, W

2020-12-14 23:31:41 113

原创 Task05 【排序模型+模型融合】学习路线

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录前言一、排序问题1.导入包2.读取排序特征3.返回排序后的结果4.LGB排序模型5.LGB分类模型6.DIN模型(Deep Interest Network)用户的历史点击行为列表二、融合模型1.加权融合2.Staking总结前言经过上期的工作,我们基于召回结果做了特征分析,选取了重要特征并构造了新的特征集。接下来我们就要学习如何使用机器学习的方法对这些特征进行学习而后对测试集中的用户进行预测,将预测概率最大的top5文章作为

2020-12-06 23:37:02 267

原创 Task04 【特征工程】学习路线

文章目录前言 一、pandas是什么? 二、使用步骤 1.引入库 2.读入数据 总结前言前期我们做了多路召回的工作,今天来到了特征工程的构建。有这么一句话在业界广泛流传:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。其本质是一项工程活动,目的是最大限度地从原始数据中提取特征以供算法和模型使用。下面的文章将介绍在本次赛题种如何选择有效特征以及制作特征和标签。一、构建思路1.前提:题目中给的原始数据中有些特征是可以直接使用的,比如...

2020-12-03 20:57:57 144 1

原创 天池新人赛之Task03-多路召回扫盲记

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录前言一、多路召回是什么?二、步骤1.引入库2.读入数据3.自定义工具函数获取用户-文章-时间函数获取文章-用户-时间函数获取历史和最后一次点击获取文章属性特征获取用户历史点击的文章信息获取点击次数最多的Top-k个文章定义多路召回字典召回效果评估计算相似性矩阵itemCF i2i_simuserCF u2u_simitem embedding sim召回YoutubeDNN召回总结前言天池新人推荐系统入门赛持续跟进!继赛题理解

2020-11-30 23:59:45 230

原创 小白推荐系统扫盲记——数据分析

小白推荐系统扫盲记——数据分析这里可以添加系列文章的所有文章的目录,目录需要自己手动添加第一章 天池新闻推荐入门赛持续跟进——First one(https://blog.csdn.net/qq_45068574/article/details/110088943)]第二章 小白推荐系统扫盲记——数据分析文章目录小白推荐系统扫盲记——数据分析前言一、数据分析是什么?二、使用python进行分析1.导入库2.读入数据3.数据预处理4.查看数据查看用户点击日志信息查看各个字段的基本信息训练集中的用户

2020-11-27 22:58:12 457 4

原创 天池新闻推荐入门赛持续跟进——First one!

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录前言一、赛题二、使用步骤1.引入库2.读入数据总结前言DataWhale组队学习 Task01 欢迎各方小伙伴一起交流讨论本文主要内容为针对阿里云天池大赛—— “零基础入门推荐系统之新闻推荐场景下的用户行为预测挑战赛”所做的赛题分析及baseline的初步探究。一、赛题示例:pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。二、使用步骤1.引入库代码如下(示例):imp

2020-11-24 23:53:51 525

原创 电商用户行为预测数据初探

电商用户行为预测数据初步探究电商用户行为预测数据分析导入相关包自定义采样函数读取数据数据预处理数据浏览用户的交互行为_训练集trn_click.csv文件数据中每个字段的含义用户点击日志信息直方图查看基本属性分布数据分析数据分析导入相关包%matplotlib inlineimport pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as snsplt.rc('font', famil

2020-11-22 17:27:22 2551

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除