![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
datawhale
仅用于个人纪录
这个作者很懒,什么都没留下…
展开
-
Day-3(未完待续)
特征工程team-learning 数据竞赛(房租预测)任务3 特征工程&特征选择(3天)特征工程#核心代码举例# 统计特征 #计算均值 gp = train.groupby(by)[fea].mean() #计算中位数 gp = train.groupby(by)[fea].median() #计算方差 gp = trai...原创 2020-01-09 16:59:33 · 88 阅读 · 0 评论 -
Day-2
缺失值分析#coding:utf-8#导入warnings包,利用过滤器来实现忽略警告语句。import warningswarnings.filterwarnings('ignore')# GBDTfrom sklearn.ensemble import GradientBoostingRegressor# XGBoostimport xgboost as xgb# Ligh...原创 2020-01-09 15:32:48 · 97 阅读 · 0 评论 -
Day-1:
1、认识数据根据一系列的指标来对房租进行合理预测,属于回归问题。数据集中的数据类别包括租赁房源、小区信息、配套设施、二手房、新房等。这个太难了,真不适合我这个渣渣,只能硬着头皮走下去!2、数据EDA(主要是参考他人)2.1读入数据和总体概览import pandas as pdimport matplotlib.pyplot as plt#先导入包train = pd.rea...原创 2020-01-07 16:47:40 · 115 阅读 · 0 评论 -
统计学-task2
中心极限定理1.定义中心极限定理是指,样本的平均值约等于总体的平均值。不管是什么分布,任意一个总体的样本平均值都会围绕在总体的整体平均值周围,并且呈正态分布。注意:取样本的时候,一般认为,每组大于等于30个,即可让中心极限定理发挥作用。2.举例假设有一个群体,如清华毕业的人,想知道这群人的收入。会进行一下四步:第一步:抽取1个样本,包括100个人,然后对这些人的收入求平均值。第二步:...原创 2019-05-13 21:34:23 · 315 阅读 · 0 评论 -
python基础task5-2019.5.19
类和对象https://blog.csdn.net/qq_41666763/article/details/80508608https://blog.csdn.net/guoxinjie17/article/details/77850385什么是对象:从同一个类中具体化描述的一个事物被称之为对象什么是类:具有相同特性和方法的抽象概念称之为类类和对象之间的关系:类是对象的抽象概念,对象是类...原创 2019-05-19 20:40:30 · 100 阅读 · 0 评论 -
Python基础学习-Task3-2019.5.14
字典1.定义在Python中。字典是一系列键——值对。每一个键都与一个值相关联,可以使用键来访问与之相关联的值。2.创建字典用放在花括号{ }中的一系列键——值对表示,如下所示:alien_0={'color':'green','points':5}可以储存任意数量的值,事例如下:print(alien_0['color'])print(alien_0['points'])输...原创 2019-05-14 20:15:18 · 133 阅读 · 0 评论 -
python基础任务task4-2019.5.16
定义函数关键字import keywordprint(keyword。kwlist)函数的定义def greet_user(): """显示简单的问候语""" print('Hello!')greet_user()(打的时候少了个冒号也是可以了)def告诉python我要定义一个函数了,后面是函数名加括号,必须以冒号结尾,下面一行是缩进的,这些缩进就是它的内容啦...原创 2019-05-16 21:58:51 · 210 阅读 · 0 评论