自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(32)
  • 收藏
  • 关注

原创 xgboos-hperopt

xgboos-hperopt一、数据介绍二、特征工程1.查看相关数据2.处理数据二、开始跑模型了1.先使用XGboost2.这里使用下xgboos-hperopt一、数据介绍最近正好了解到AUTO-ML相关的信息,了解到两个框架。就从kaggle上找了个数据集进行尝试,(为什么在kaggle上尝试,因为kaggle给每个人分配的资源实在是太香了)虽然已经放了链接在这里,我想还是有很多人不会去看,所以我还是把数据的相关信息放在下面了。data1.数据来源:格陵兰省的一家医院一直在努力通过观察患者的历史

2022-05-04 20:47:23 615

原创 如何选择合适的模型

选择模型这个问题的答案取决于许多的因素,其中包括:1.了解基本知识监督学习无监督学习增强学习(Reinforcement learning)2.对问题进行分类一些技术术语:一些值得关注的算法:分类( Classification) :回归( Regression) :聚合( Clustering) :异常检测( Anomaly detection) :那么如何选择这些类别的算法呢?选择算法时的注意...

2019-07-27 00:34:14 6678

原创 Linux设置定时任务

Linux设置定时任务

2022-09-04 00:25:46 6451 1

原创 python代码反编译

python反编译

2022-07-27 22:30:27 10108 1

原创 Docker和Pycharm

docker的使用,及pycharm中配置docker环境

2022-07-15 10:01:41 2048 2

原创 面部关键点检测-CNN

CNN实战

2022-05-25 21:53:27 657

原创 预测销售XGBoost

预测销售XGBoost

2022-05-18 13:09:29 1640

原创 理解LSTM和GRU

LSTM GRU

2022-05-11 08:50:55 2855 2

原创 RNN卷积神经网络

RNN卷积神经网络

2022-05-10 21:30:23 212

原创 pytorch随记(5)

GoogleNet and ResidualBlock

2022-05-10 12:06:21 353

原创 卷积神经网络CNN

卷积神经网络CNN

2022-05-09 22:06:37 410

原创 Pytorch随记(3)

多分类问题

2022-05-09 16:12:25 513

原创 Pytorch随记(2)

Pytorch实现回归线性回归逻辑回归介绍损失函数在刘老师第五节课和第六节课中讲解了线性回归和逻辑斯蒂回归,有兴趣的道友可以去B站搜刘二大人。线性回归其中y^\hat{y}y^​,可以理解为观测值,线性方程的作用就是构建函数求出观测值,之后根据所选择的损失函数,对观测值和实际值求出误差。四步走1.准备数据集2.设计模型3.构造损失函数和优化器4.循环训练(forward backward update)# SGD AND LinearModel import torch#

2022-05-07 18:04:30 334

原创 Pytorch随记(1)

PytorchOverview目标和要求发展Pytorch安装经朋友推荐,看了B站上刘二老师的课( 视频链接),确实很好。这边专栏是在听课后的自己的一些随记。虽然XXXXX,但是不会。Overview首先刘老师解释了一下,为什么很多大学课程为什么远远落后企业的实际需求,为什么不用最新的?那是因为这些东西更新迭代太快了,很有可能你大一的时候学习的框架的套路,等到大二大三的时候这些东西已经不能用了,所以选择处在应用期的框架,这个时候已经是成熟状态了。(其实也就是所谓的师傅领进门,修行在个人,老师带你

2022-05-06 16:02:51 493

原创 利用PCA来简化数据

主成分分析1.什么是主成分分析2.PCA 原理为什么正交?PCA 优缺点3.PCA的思想4.sklearn API5、案例:探究用户对物品类别的喜好细分降维6.PCA算法总结PCA优点:PCA缺点:1.什么是主成分分析概述主成分分析(Principal Component Analysis, PCA):通俗理解:就是找出一个最主要的特征,然后进行分析。定义高维数据转化为低维数据的过...

2019-08-21 09:57:40 1332 1

原创 机器学习面试题(转载)

机器学习笔试题

2019-08-19 11:52:02 857

原创 京东购买意向预测(四)

Xgboost模型模型设计#!/usr/bin/env python# -*- coding: UTF-8 -*-import sysimport pandas as pdimport numpy as npimport xgboost as xgbfrom sklearn.model_selection import train_test_splitimport operato...

2019-08-19 11:30:39 3532 1

原创 京东购买意向预测(三)

特征工程特征用户基本特征:获取基本的用户特征,基于用户本身属性多为类别特征的特点,对age,sex,usr_lv_cd进行独热编码操作,对于用户注册时间暂时不处理商品基本特征:根据商品文件获取基本的特征针对属性a1,a2,a3进行独热编码商品类别和品牌直接作为特征评论特征:分时间段,对评论数进行独热编码行为特征:分时间段对行为类别进行独热编码分别按照用户-...

2019-08-19 11:30:10 4056 2

原创 泰坦尼克号乘客获救预测(进阶)

泰坦尼克号乘客生存预测详细流程1. 数据总览看看数据2、缺失值的处理方法3. 分析数据关系3.1 判断性别和生存是否有关系3.2 船舱等级和生存与否的关系 Pclass3.3 年龄与存活与否的关系 Age3.4 票价分布和存活与否的关系 Fare4. 变量转换原文:https://tianchi.aliyun.com/notebook-ai/detail?spm=5176.12282042.0....

2019-07-30 17:15:32 1345

原创 机器学习之支持向量机算法

支持向量机算法

2019-07-30 16:30:05 2304 1

原创 机器学习之K-Means聚类算法

K-Means(K-均值)聚类算法

2019-07-26 18:21:57 606

原创 机器学习之随机森林

集成方法-随机森林

2019-07-25 13:13:26 689 1

原创 机器算法之决策树

决策树决策树概述决策树 开发流程决策树Demo决策树 算法特点决策树概述决策树是机器学习中常用的一种算法,它即可用于解决分类问题,也可用于解决回归问题。在开始介绍决策树的构建之前,首先介绍几个相关概念,信息熵、条件熵以及信息增益:首先介绍熵的概念:熵: 指的是体系的混乱的程度,在不同的学科中也有引申出的更为具体的定义,是各领域十分重要的参量。信息熵:在物理界中熵是描述事物无序性的参数...

2019-07-24 16:28:17 155

原创 机器学习之梯度下降

线性回归算法

2019-07-24 16:16:05 343 1

原创 机器学习之Logistic回归算法

Logistic回归算法

2019-07-24 16:15:51 3279 1

原创 机器学习之贝叶斯

贝叶斯

2019-07-23 17:32:09 124

原创 特征工程笔记

特征工程

2019-07-23 11:10:08 1267

原创 机器学习算法之K近邻

K近邻算法KNN算法要素Scikit Learn 中的 k-近邻算法Scikit Learn 中 k-近邻算法使用实现 Scikit Learn 中的 KNeighborsClassifier 分类器Kd树KNN算法小结K近邻法(k-nearest neighbors,KNN)是一种很基本的机器学习方法了,通过测量不同特征值之间的距离的方法进行分类。(换句话说就是在一个坐标系中,你要根据你获得数...

2019-07-22 23:06:14 512 1

原创 泰坦尼克号乘客生存预测

泰坦尼克号乘客获救预测原网址:https://tianchi.aliyun.com/notebook-ai/detail?spm=5176.12282042.0.0.3fa02042COPRZr&postId=64711. 案例背景泰坦尼克号沉船事故是世界上最著名的沉船事故之一。1912年4月15日,在她的处女航期间,泰坦尼克号撞上冰山后沉没,造成2224名乘客和机组人员中超过150...

2019-07-22 16:14:27 5363 2

原创 京东购买意向预测(二)

(2)- 数据探索周一到周日各天购买情况分析:周六,周日购买量较少一个月中各天购买量2016年2月分析: 2月份5,6,7,8,9,10 这几天购买量非常少,原因可能是中国农历春节,快递不营业2016年3月分析:3月份14,15,16不知名节日,造成购物大井喷,总体来看,购物记录多于2月份2016年4月分析:一脸懵逼中…可能又有啥节日? 还是...

2019-07-21 23:52:53 4491 5

原创 京东用户购买意向预测(一)

数据清洗故事背景:数据集:数据挖掘流程:数据集验证首先检查JData_User中的用户和JData_Action中的用户是否一致检查是否有重复记录检查是否存在注册时间在2016年-4月-15号之后的用户行为数据中的user_id为浮点型,进行INT类型转换年龄区间的处理user_tableitem_table特征包括:构建User_table构建Item_table数据清洗用户清洗故事背景:京...

2019-07-21 22:55:25 13212 3

原创 kaggle数据调查

(一)数据领域朋友的自身情况性别比例调查问卷国家分布年龄分布收入情况所学专业从事领域工作满意度最常使用工具常用算法计算平台选择面临挑战(二)Python和R哪家强使用人数常用工具不同工种偏好各大领域使用趋势薪资待遇用了多少年重要程度(三)数据科学家都在用什么国家分布使用Python or R工资与学历如何证明自己呢遇到的问题对可视化的...

2019-07-21 11:44:12 769 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除