自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Blank_Space

Sometimes perseverance does win out

  • 博客(9)
  • 问答 (2)
  • 收藏
  • 关注

原创 2018阿里广告点击率预估模型---DIN,Tensorflow2.0代码实践,并附上github

前言最近看了2018年阿里在KDD上发表的论文《Deep Interest Network for Click-Through Rate Prediction》,想复现下,看了文章给出的github开源代码,发现环境是TF1.4的,并且注释太少,有些没大理解【还是太菜了】,因此准备参考原有代码使用TF2.0来对模型进行简单的复现。如果有些地方有些出入或者错误,请大佬们给我指出,感谢【因为现在没服务器,所以没像开源中跑完50个epoch】数据分析1、数据集为论文中的Amazon Dataset,下载并解

2020-05-28 10:22:22 3366 1

原创 Python序列化---Pickle模块【大量数据的情况下,如何提高Python读写数据的速度?】...

点击上方“潜心的Python小屋”关注我们,第一时间推送优质文章。前言大家好,我是潜心。最近在复现2018年阿里提出的CTR预估模型---DIN,关于原生数据的处理以及数据集的构建,因为...

2020-05-27 15:48:34 4927 1

原创 第一次参赛---2020腾讯广告算法大赛Baseline思考与分析

点击上方“潜心的Python小屋”关注我们,第一时间推送优质文章。前言大家好,我是潜心。2020腾讯广告算法大赛是我参加的第一个正式比赛,在此记录下目前做的一个Baseline思路【用于...

2020-05-18 17:50:27 3363 14

原创 通过比赛整理出的8条Numpy实用技巧【你知道如何频数统计和按某列进行排序么?】...

点击上方“潜心的Python小屋”关注我们,第一时间推送优质文章。前言大家好,我是潜心。最近被比赛折磨得不行,能不能苟进复赛,混件文化衫也两说。在此我把用到的一些Numpy方法进行下总结...

2020-05-16 22:16:08 1188

原创 竞赛知识积累---TF-IDF方法可以作为特征工程【sklearn实现】

点击上方“潜心的Python小屋”关注我们,第一时间推送优质文章。前言大家好,我是潜心。最近看到2018年易观竞赛题---对用户性别年龄进行预测,Top1队伍的特征工程使用了TF-IDF...

2020-05-13 18:00:00 940

原创 Pandas笔记---深入Groupby,它的功能没有你想的这么简单

点击上方“潜心的Python小屋”关注我们,第一时间推送优质文章。前言大家好,我是潜心。上篇文章提到了Groupby,但其中举例的代码有点问题,在提取序列时用到了for循环,效率很慢,后...

2020-05-11 14:29:06 745

原创 Pandas笔记---通过比赛整理出的10条Pandas实用技巧

点击上方“潜心的Python小屋”关注我们,第一时间推送优质文章。前言大家好,我是潜心。最近还在参加某比赛,将pandas对数据预处理的方法进行了总结,以下列出的10条是我觉得比较常用、...

2020-05-09 19:15:31 336

原创 【Python爬虫实战】2020最新无错误,头条爬取图片实战,Ajax异步加载,附有源码

头条搜索关键词,爬取相关图片头条的爬取设计Ajax数据的爬取。导入包:import requestsimport timeimport osimport refrom hashlib import md5from urllib.parse import urlencodefrom multiprocessing.pool import Pool分析打开Chrome/Safr...

2020-05-08 12:53:32 625

原创 Pandas笔记---概述与数据结构

Pandas概览Pandas 是 Python的核心数据分析支持库,提供了快速、灵活、明确的数据结构,旨在简单、直观地处理关系型、标记型数据。Pandas 的目标是成为 Python 数据分析实践与实战的必备高级工具,其长远目标是成为最强大、最灵活、可以支持任何语言的开源数据分析工具。数据结构Pandas 的主要数据结构是 Series(一维数据)与 DataFrame(二维数据),这两种数...

2020-05-07 21:53:31 333

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除