自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 资源 (1)
  • 收藏
  • 关注

原创 机器学习python之CART、GB、GBDT、XGBoost

根据个体学习器的生成方式,集成学习方法大致可分为两大类:1.个体学习器之间存在强依赖关系,必须串行生成的序列化方法(代表是Boosting);2.个体学习器之间不存在强依赖关系,可同时生成的并行化方法(代表是Bagging和随机森林Random Forest)。

2020-09-12 10:22:46 449

原创 机器学习python入门之特征工程

机器学习python入门之特征工程Baseline model加载数据Load the data准备目标列Prepare the target column转换时间戳Convert timestampsPrep categorical variablesCreate training, validation, and test splitsTrain a modelMake predictions & evaluate the model分类编码Categorical EncodingsCount

2020-07-15 10:05:07 552

原创 机器学习python入门(二)

机器学习python入门(二)Missing valuesThree Approaches1) 一个简单的选项: 删除缺少值的列2) 一个更好的选择: 填充Imputation3) 对填充的延伸Example方法1(删除缺少值的列)的得分方法2 (填充)的得分方法3(填充的延申)的得分为什么填充法比直接删除这些列的效果更好呢?总结接下来我们将加速您的机器学习专业知识,学习如何:处理经常在真实数据集中发现的数据类型(缺失值missing values,分类变量categorical variables)

2020-07-09 15:25:06 730

原创 机器学习python入门(一)

kaggle 机器学习入门Selecting Data for ModelingSelecting The Prediction TargetChoosing "Features"Building Your ModelSelecting Data for Modeling变量的选择,这里先不进行讲解,先用直觉选择几个变量。import pandas as pdmelbourne_file_path = '../input/melbourne-housing-snapshot/melb_data.cs

2020-06-23 15:39:59 199

原创 周志华《机器学习》——第一章绪论笔记

机器学习——第一章绪论笔记一、引言二、基本术语三、假设空间四、归纳偏好一、引言机器学习研究的主要内容是关于在计算机上从数据中产生“模型”的算法,即学习算法(learning algorithm)。有了学习算法,我们把经验数据提供给它,就能基于这些数据产生模型;在面对新的情况时,模型可以给出预测。机器学习是研究关于“学习算法”的学问。本书用“模型”泛指从数据中学得的结果。有文献用“模型”指全局性结果(例如一棵决策树),而用“模式”指局部性结果(例如一条规则)。二、基本术语数据集(data set

2020-06-05 23:35:23 686

原创 “东方国信杯”大赛python数据分析-笔记

“东方国信杯”大赛python数据分析-笔记一、综述二、Numpy基础1.numpy创建数组(矩阵)2.numpy中常见的数据类型3.数据类型的操作4.数组的形状5.数组和数的计算6.数组和数组的计算7.广播原则与轴8.numpy读取数据9.numpy索引、切片和数值的修改10.numpy中的NAN和Inf11.numpy中常用统计函数12.numpy中数组缺失值填充均值13.numpy中数组的拼接14.numpy生成随机数15. numpy的注意点copy和view三、Pandas数据处理1.pandas

2020-05-25 09:31:05 352

原创 “东方国信杯”大赛Python基础-笔记

“东方国信杯”大赛Python基础-笔记变量的基本数据类型:例子:条件语句:循环语句:while循环:for循环:嵌套循环:跳出循环:python数据结构:成员资格是区分大小写的。函数:变量作用域:类和对象:包和模块:异常处理:...

2020-05-21 17:25:59 280

原创 大话数据结构——第九章排序笔记

大话数据结构——第九章排序笔记一、排序的基本概念与分类一、排序的基本概念与分类排序:假设含有n个记录的序列为{r1,r2, … ,rn},其相应的关键字分别为{k1,k2, … ,kn},需确定1,2,…,n的一种排列p1,p2, … ,pn,使其相应的关键字满足...

2020-05-20 21:55:48 350

原创 大话数据结构——第一章数据结构绪论笔记

大话数据结构——第一章数据结构绪论笔记一、数据结构绪论1.数据结构起源2.基本概念和术语1.2.1 数据1.2.2 数据元素1.2.3 数据项1.2.4 数据对象1.2.5 数据结构3.逻辑结构与物理结构1.3.1 逻辑结构1.3.2 物理结构or存储结构4.抽象数据类型1.数据类型2.抽象数据类型一、数据结构绪论1.数据结构起源数据结构是一门研究非数值计算的程序设计问题中的操作对象,以及它们之间的关系和操作等相关问题的学科。1968年,美国的高德纳教授在起所写的《计算机程序艺术》第一卷《基本算法》中

2020-05-15 17:03:11 217

原创 “东方国信杯”大赛自然语言处理入门-笔记

“东方国信杯”大赛自然语言处理入门-笔记一、自然语言处理概念1.什么是自然语言2.自然语言处理3.自然语言的特点4.技术上的挑战5.表示学习6.典型应用-精准广告投放、搜索引擎、推荐系统、语音助手、机器翻译、关键词抽取、观点挖掘与情感分析7.深度学习的突破、挑战二、Embedding1.基本的语言模型一、自然语言处理概念1.什么是自然语言自然语言是人类之间交流传播的工具,具有创新性和歧义性。2.自然语言处理自然语言处理的目的:理解人类语言的语义信息。本质:从无结构序列中预测由结构语义。自然

2020-05-14 22:16:40 217

原创 “东方国信杯”大赛Tensorflow入门及应用-笔记

“东方国信杯”大赛Tensorflow入门及应用-笔记一、Tensorflow入门1. Tensorflow2.TF的系统结构3.TF的技术构架4. TF基础5.TF的安装6.TF入门二、Tensorflow应用1.卷积神经网络(处理图像)2.循环神经网络(处理自然语言)一、Tensorflow入门1. Tensorflow深度学习(Deep Learning)是机器学习中一种基于对数据进行表征学习的方法,深度学习的好处是用非监督式或半监督式的特征学习、分层特征提取高效算法来替代手工获取特征(feat

2020-05-14 09:57:54 267

原创 “东方国信杯”大赛人工智能数学基础-笔记

“东方国信杯”大赛人工智能数学基础-笔记一、什么是人工智能1.智能的概念2.相关概念二、深度学习1.人工神经网络2.人工神经网络的发展历程三、数学基础1.线性代数2.概率论与数理统计3.最优化理论4.信息论5.形式逻辑四、数学在人工智能里的应用1.机器学习算法的基本分类2.例子-决策树3.例子-卷积神经网络一、什么是人工智能1.智能的概念智能本质:主体对外界环境变化的响应能力。主体是什么,就是什么智能。2.相关概念人工智能是计算机科学的一大分支,一大方向。机器学习是实现人工智能的一个技术,一

2020-05-13 19:38:32 434

原创 “东方国信杯”大赛常用数据分析方法及图表-笔记

“东方国信杯”大赛常用数据分析方法及图表-笔记运营商业务介绍1.电信行业的三户模型2.运营商常用的分析维度及指标3.用户信息实例数据分析一般流程1.为什么做数据分析2.数据分析一般流程分析方法及图表建议数据可视化实例插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公...

2020-05-12 16:30:29 758

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除