机器学习
文章平均质量分 76
zx8167107
这个作者很懒,什么都没留下…
展开
-
天池o2o消费券比赛速记
比赛地址https://tianchi.aliyun.com/competition/entrance/231593/introduction包括了比赛的各种细节、数据等等我是参考了第一名的方法特征+xgboost第一名的代码和思路参考https://github.com/wepe/O2O-Coupon-Usage-Forecast第一名给出了思路和代码但是不够详细,有些细节也...原创 2019-11-20 15:59:27 · 562 阅读 · 0 评论 -
PCA
github上有个人工智能的开放库、我先从机器学习开始学习内容与《机器学习实战》这本书相关学习地址: https://github.com/apachecn/AiLearningPCA:https://github.com/apachecn/AiLearning/blob/dev/blog/ml/13.%E5%88%A9%E7%94%A8PCA%E6%9D%A5%E7%AE%80%...原创 2018-11-13 16:11:08 · 217 阅读 · 1 评论 -
SVD
《机器学习实战》一书中的svd部分可以用来辅助阅读有位网友的《机器学习实战》算法理解,还不错https://github.com/haidawyl/MLinAction github文字介绍地址:https://github.com/apachecn/AiLearning/blob/dev/blog/ml/14.%E5%88%A9%E7%94%A8SVD%E7%AE%80%E5...原创 2018-11-16 16:40:17 · 181 阅读 · 0 评论 -
K-means
kmeans背景原理以及工作流程介绍:https://github.com/apachecn/AiLearning/blob/dev/blog/ml/10.k-means%E8%81%9A%E7%B1%BB.md#k-means-%E5%B7%A5%E4%BD%9C%E6%B5%81%E7%A8%8B源代码:https://github.com/apachecn/AiLearning/...原创 2018-12-04 16:51:30 · 301 阅读 · 0 评论 -
决策树
决策树是一种基于概率分布的分类回归模型,在我们平时写if else这种类似代码时其实也是一种决策树,只不过是一种基于规则的决策树,所以该算法具有很好的可解释性。决策树的一个主要核心就是基于什么算法来建立这棵树,主要算法有ID3、C4.5和CART等,算法的核心就是基于什么准则来选取建树的特征,对应的就是信息增益、信息增益比、基尼指数。关于剪枝,涉及到损失函数,但是在实际使用中一般不会让树生...原创 2019-05-20 15:44:32 · 161 阅读 · 0 评论 -
线性模型
主要是先看了西瓜书上的线性模型的内容参考:求解系数的常见方法:最小二乘法:https://www.cnblogs.com/pinard/p/5976811.html梯度下降法:http://www.cnblogs.com/pinard/p/5970503.html过拟合需要正则化系数来优化,涉及到范数知识:https://zhuanlan.zhihu.com/p/28...原创 2019-05-22 16:11:51 · 158 阅读 · 0 评论 -
TF-IDF
特征工程中用到了tf-idf,数据是游戏内行为数据、event_name为用户行为、select A.advertising_id, CONCAT(A.event_name,'_tfidf'), tf*idf as tf_idf from ( select t...原创 2019-07-02 16:52:50 · 194 阅读 · 0 评论 -
pyspark实现随机森林与交叉验证
主要分为两大部分:第一部分是训练模型、交叉验证调参以及保存模型;第二部分是load模型并且测试模型以及获得特征重要性排序# -*- coding:utf-8 -*-### 获取数据以及特征列from pyspark.sql import SparkSessionspark = SparkSession.builder.appName("RF").enableHiveSupp...原创 2019-09-29 19:00:38 · 3956 阅读 · 1 评论