机器学习项目
文章平均质量分 66
Rocket,Qian
硕士毕业于同济大学,主要方向是机器学习、深度学习、推荐算法研究以及量化。精通python、MATLAB,熟悉java、C++等编程语言,熟练掌握数据结构与算法、计算机网络,sklearn、XGboost、Tensorflow、pytorch、Keras等框架,分布式系统等。
展开
-
基于用户画像的商品推荐挑战赛baseline0
基于用户画像的商品推荐挑战赛baseline一、赛事背景比赛地址一、赛事背景讯飞AI营销云基于深耕多年的人工智能和大数据技术,赋予营销智慧创新的大脑,以健全的产品矩阵和全方位的服务,帮助广告主用AI+大数据实现营销效能的全面提升,打造数字营销新生态。最简单的baseline:import pandas as pd%matplotlib inlineimport numpy as npimport matplotlib.pyplot as pltfrom pylab import *原创 2021-07-06 18:39:42 · 1179 阅读 · 6 评论 -
沪牌数据集
2002-2021沪牌成交数据集最近搜集了上海国拍上的历年沪牌成交数据。链接:https://pan.baidu.com/s/1fDvLWqMWoNB_FDnujzjvug 密码:bv6s大家可以充分发挥聪明才智,对接下来的成交价、参拍人数啥的进行预测!一个字就是玩、干呗!...原创 2021-05-07 15:00:48 · 367 阅读 · 0 评论 -
天猫用户重复购买预测——特征工程
天猫用户重复购买预测——特征工程1.特征工程1.1 概念1.2 特征归一化1.3 类别型特征转换1.4 高维组合特征的处理1.5 组合特征1.6 文本表示模型2. 赛题特征工程思路3. 特征工程构造这两天在整理做的一些比赛的内容,再结合书籍汇总一下每一个完整的ML项目!1.特征工程1.1 概念要选取具有实际物理意义的特征(深度学习除外),要能够从多方面表达或阐述一个事情(从不同角度去描述一个事情)。1.2 特征归一化特征归一化目的是消除数据特征之间的量纲影响,使不同指标之间具有可比性。简单方原创 2021-03-04 10:17:52 · 4814 阅读 · 0 评论 -
天猫用户重复购买预测——数据探索
天猫用户重复购买预测——数据探索1. 理论1.1 缺失数据处理1.2 不均衡样本1.2.1 随机欠采样1.2.2 随机过采样1.2.3 基于聚类的过采样方法1.2.4 SMOTE算法1.2.5 基于数据清洗的SMOTE1.3 数据分布2. 实战数据探索2.1 环境Google colab2.2 导入工具包2.3 读取数据2.4 数据集样例查看2.5 查看数据类型和数据大小2.6 查看缺失值2.7 观察数据分布2.7.1 查看整体数据统计2.7.2 查看正负样本的分布,并可视化2.8 探查影响复购的各种影响因原创 2021-03-02 23:24:15 · 5543 阅读 · 1 评论 -
工业蒸汽预测
工业蒸汽预测1.导入包和数据2.数据探索EDA2.1画箱型图探索数据2.1 查看数据分布图2.3 合并训练集和测试集数据,并可视化训练集和测试集数据特征分布图2.3.1 可视化线性回归关系2.4 查看特征变量的相关性2.4.1 查找出特征变量和target变量相关系数大于0.5的特征变量3.特征工程4.模型训练5.模型验证6.特征优化7.模型融合最近在看阿里天池的这个工业蒸汽预测比赛项目,顺便把看到的整理下来,以备不时之需啊!1.导入包和数据import numpy as npimport pand原创 2020-11-10 21:19:51 · 1546 阅读 · 1 评论 -
基于TensorFlow的油耗预测(全连接神经网络)
基于TensorFlow的油耗预测1.数据集2.创建网格3.训练与测试利用全连接网络完成汽车的效能指标 MPG 的回归问题预测。1.数据集Auto MPG 数据集,它记录了各种汽车效能指标与气缸数、重量、马力等其 他因子的真实数据,查看数据集的前 5 项,如表所示,其中每个字段的含义列在表中。除了产地的数字字段表示类别外,其他字段都是数值型。对于产地地段,1 表 示美国,2 表示欧洲,3 表示日本。import pandas as pd# 获取数据dataset_path = '框架学习/ten原创 2020-10-14 14:20:35 · 1363 阅读 · 0 评论