自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 数据处理的一些基础导包

1. sklearn.manifold1.1 TSNE降维算法from sklearn.manifold import TSNETSNE(random_state=0).fit_transform(data)2. sklearn.metrics2.1 计算轮廓系数 silhouette_scorefrom sklearn.metrics import silhouette_scorelabels = KMeans(n_clusters=2,random_state=0).fit_predi

2020-05-08 17:41:12 515

原创 K-means、K-means++、ISODATA

一、K-meansK-means算法最开始随机选取数据集中K个点作为聚类中心,即使相同的K值,分类结果会也受到初始点的选取而有所区别。人工指定比较合理的K值,通过多次随机初始化聚类中心选取比较满意的结果。二、K-means++K-means++按照如下的思想选取K个聚类中心:假设已经选取了n个初始聚类中心(0<n<K),则在选取第n+1个聚类中心时:距离当前n个聚类中心越远的...

2020-05-08 17:28:17 690

原创 时间轴处理的一些想法

第一种,转换时间戳,然后加减的# datetime对象转换成时间字符串datetime_str = datetime.strftime(datetime.now(), '%Y-%m-%d %H:%M:%S')print(datetime_str) # datetime对象转换成时间戳datetime_stamp = datetime.timestamp(datetime.now())...

2020-05-06 20:28:15 370

原创 使用sklearn进行数据挖掘

1 使用sklearn进行数据挖掘1.1 数据挖掘的步骤数据挖掘通常包括数据采集,数据分析,特征工程,训练模型,模型评估等步骤。使用sklearn工具可以方便地进行特征工程和模型训练工作,在《使用sklearn做单机特征工程》中,我们最后留下了一些疑问:特征处理类都有三个方法fit、transform和fit_transform,fit方法居然和模型训练方法fit同名(不光同名,参数列表都一样...

2020-05-05 22:42:35 300

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除