自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 sklearn.preprocessing.LabelEncoder将文本标签转化为数字

官方文档示例from sklearn.preprocessing import LabelEncoderencoder=LabelEncoder()housing_cat=housing["ocean_proximity"]housing_cat_encoded=encoder.fit_transform(housing_cat)housing_cat_encoded=pd.Da...

2019-03-13 09:31:19 6943

原创 sklearn.preprocessing.Imputer

参考博客使用案例from sklearn.preprocessing import Imputerimp=Imputer(strategy="median")imp.fit(housing_num)x=imp.transform(housing_num)#得到的结果是数组housing_tr=pd.DataFrame(x,columns=housing_num.columns)#...

2019-03-13 09:17:56 374

原创 pandas.DataFrame.corr &scatter_matrix计算各个属性之间相关系数

官方文档参考博客corr_matrix=housing.corr()print(corr_matrix)print(corr_matrix["median_house_value"].sort_values(ascending=False))pandas.plotting.scatter_matrix官方文档from pandas.tools.plotting ...

2019-03-06 11:12:24 1620

原创 pandas.DataFrame.plot绘制散点图

官方文档参考博客图1:按坐标绘制散点图图2:设置透明度,可以看清楚高密度数据点的位置。alpha=1为不透图3:用点的大小代表人口数量(参数s),用颜色代表价格(参数c),jet预定义颜色表(参数cmap)housing.plot(kind="scatter",x="longitude",y="latitude")housing.plot(kind="scatter",x=...

2019-03-06 10:54:53 25209 1

原创 sklearn.model_selection.train_test_split

https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.train_test_split.html实例:train_set,test_set=train_test_split(housing,test_size=0.2,random_state=42)编写函数实现数据集划分:参考《机器学习实...

2019-02-28 17:33:11 204

原创 python导入csv数据并绘制各个属性的直方图

参考:《机器学习实战:基于Scikit-Learn和TensorFlow》import pandas as pdimport osHOUSING_PATH="数据存储路径"#导入数据def load_housing_data(housing_path=HOUSING_PATH): csv_path=os.path.join(housing_path,"文件名称.csv")...

2019-02-28 17:22:16 6405

原创 sklearn.model_selection.StratifiedShuffleSplit

分层抽样https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.StratifiedShuffleSplit.html#sklearn.model_selection.StratifiedShuffleSplit.split实例:根据Income_cat进行分层抽样,前提:Income_ca...

2019-02-28 17:06:21 1112

翻译 pandas.DataFrame.where

http://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.where.html实例:将连续的median_income数据进行分类。首先除以1.5限制类别数量,然后用ceil取整获得离散的类别,最后将>5的类别合并为类别5#创建收入类别属性housing["income_cat"]...

2019-02-28 16:17:40 585

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除