自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 资源 (6)
  • 收藏
  • 关注

原创 CTR预估算法(浅层模型)

1. 发展在CTR预估中,Logistic Regression应该是最早被应用而且应用最广泛的模型了。输入是one-hot之后的特征,输出是点击广告的概率。对于类别型特征,one-hot之后,每一个取值都变成了一维新的特征。线性模型有一个致命的缺点:对于每一个维度特征权重的学习是独立的,很难有效的学习到组合特征的权重。为了解决这个问题,相继提出了改进模型Poly2和FM。Poly2又...

2019-04-30 13:29:14 5412

原创 L1、L2正则化总结

为什么不用L0范数而用L1范数?L0范数是向量中非0元素的个数,若使用L0范数来规则化一个参数矩阵,就是希望其稀疏,大部分元素都是0。但L0范数难以优化求解,L1范数是L0范数的最优凸近似,且比L0范数更易优化求解。L1和L2为什么能防止过拟合,它们有什么区别?通过添加正则项,可以使模型的部分参数值都较小甚至趋于0,对应的特征对模型的影响就比较小,相当于对无关特征做了一个惩罚,即使它们...

2019-04-29 20:47:59 5032

原创 工作笔记

在两个服务器间进行文件传输:发送端运行命令:python -m http.server 20001在接收端运行命令:wget 10.135.9.2:20001/file服务器使用规范。文件均存放在/opt/workspace目录下,不可大量占用/home空间(1) 创建目录mkdir /opt/workspace/yangweixin(2) 在默认路径下,建立软连接...

2019-04-24 18:14:37 272

原创 Mercari Price Suggestion Challenge-基于文本特征的价格模型

1. 数值/连续特性商品的价格:二手商品的成交价格。我们的label 运费2. 类别特征:商品是否包邮:1是包邮,0是不包邮 商品的新旧程度 商品的标题 品牌名称:该产品的生产商品牌名称 商品的类目:由“\”分隔的项目的单个或多个类别F 商品的描述:可能包括删除的单词,由(rm)标记对label商品的价格进行可视化,发现出现严重的数据倾斜,长尾现象严重,我们对价格进行cox...

2019-04-23 17:22:31 1249

原创 C++面试常考知识点总结

const作用修饰变量,说明该变量不可以被改变; 修饰指针,分为指向常量的指针和指针常量; 常量引用,经常用于形参类型,即避免了拷贝,又避免了函数对值的修改; 修饰成员函数,说明该成员函数内不能修改成员变量。使用const 使用// 类class A{private: const int a; // 常对象成员,只能在初始化列表...

2019-04-16 23:02:57 477

原创 C++提高编程

C++提高编程本阶段主要针对C++泛型编程和STL技术做详细讲解,探讨C++更深层的使用1 模板1.1 模板的概念模板就是建立通用的模具,大大提高复用性例如生活中的模板模板的特点:模板不可以直接使用,它只是一个框架 模板的通用并不是万能的1.2 函数模板 C++另一种编程思想称为 泛型编程,主要利用的技术就是模板 C++提供两种模板机制:函数模板和...

2019-04-16 22:48:19 1269

原创 C++核心编程

C++核心编程本阶段主要针对C++==面向对象==编程技术做详细讲解,探讨C++中的核心和精髓。1 内存分区模型C++程序在执行时,将内存大方向划分为4个区域代码区:存放函数体的二进制代码,由操作系统进行管理的 全局区:存放全局变量和静态变量以及常量 栈区:由编译器自动分配释放, 存放函数的参数值,局部变量等 堆区:由程序员分配和释放,若程序员不释放,程序结束时由操作系统回收...

2019-04-16 22:45:58 1522

原创 个性化推荐算法总结

读书笔记 |《推荐系统实践》- 个性化推荐系统总结对于推荐系统,本文总结内容,如下图所示:一、什么是推荐系统1. 为什么需要推荐系统为了解决互联网时代下的信息超载问题。2. 搜索引擎与推荐系统分类目录,是将著名网站分门别类,从而方便用户根据类别查找公司。 搜索引擎,用户通过输入关键字,查找自己需要的信息。 推荐系统,和搜索引擎一样,是一种帮助用户快速发展有用信...

2019-04-11 23:24:58 60031 3

原创 C++基础入门

C++基础入门1 C++初识1.1 第一个C++程序编写一个C++程序总共分为4个步骤创建项目 创建文件 编写代码 运行程序1.1.1 创建项目​ Visual Studio是我们用来编写C++程序的主要工具,我们先将它打开1.1.2 创建文件右键源文件,选择添加->新建项给C++文件起个名称,然后点击添加即可。1.1.3 编写代码...

2019-04-09 15:49:55 1905

OfficeRegClean.zip

OfficeRegClean清理小工具,可以完美解决安装office2019/2013/2010/2007 64位版本时出现”无法安装64位版本的Office,因为在您的PC上找到了以下32位程序“的问题。

2019-06-15

美团机器学习实践

人工智能技术正以一种超快的速度深刻地改变着我们的生活,引导了第四次工业革命。美团作为国内O2O领域领 先的服务平台,结合自身的业务场景和数据,积极进行了人工智能领域的应用探索。在美团的搜索、推荐、计算广告、风控、图像处理等领域,相关的人工智能技术得到广泛的应用。本书包括通用流程、数据挖掘、搜索和推荐、计算广告、深度学习以及算法工程6大部分内容,全面介绍了美团在多个重要方面对机器学习的应用。 本书非常适合有一定机器学习基础的工程技术人员和在校大学生学习和阅读。通过本书,有经验的算法工程师可以了解美团在这方面的做法,在校大学生可以学习机器学习算法如何在具体的业务场景中落地。

2018-12-21

机器学习实战_基于Scikit-Learn和TensorFlow_王静源

本书主要分为两个部分。第一部分为第1~8章,涵盖机器学习的基础理论知识和基本算法——从线性回归到随机森林等,帮助读者掌握Scikit-Learn的常用方法;第二部分为第9~16章,探讨深度学习和常用框架TensorFlow,一步一个脚印地带领读者使用TensorFlow搭建和训练深度神经网络,以及卷积神经网络。书中涉及不少数学公式,作者对抽象的公式背后的含义也都一一做出了阐释,因此即便是对数学不敏感的初学者,也同样能够理解机 器学习任务的实质。

2018-12-06

C语言从入门到精通

C语言从入门到精通:本书从初学者的角度出发,以通俗易懂的语言,丰富多彩的实例,详细介绍了使用C语言进行程序开发应该掌握的各方面知识。全书共分17章,包括C语言概述,算法,数据类型,运算符与表达式,常用的数据输入、输出函数,选择结构程序设计,循环控制,数组,函数,指针,结构体和共用体,位运算,预处理,文件,存储管理,网络套接字编程和学生成绩管理系统等。所有知识都结合具体实例进行介绍,涉及的程序代码给出了详细的注释,可以使读者轻松领会C语言程序开发的精髓,快速提高开发技能。

2018-11-17

Keras中文文档

本文档是Keras文档的中文版,包括keras.io的全部内容,以及更多的例子、解释和建议

2018-10-30

统计学习方法

统计学习方法扫描版,机器学习 深度学习领域书籍,入门必备

2018-08-22

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除