机器学习
每天记笔记
记到脑子里叫知识,存到硬盘里叫.doc、.pdf、.ppt
展开
-
聚类 k-cost折线图+tsne可视化
# coding=utf-8 from sklearn.manifold import TSNE from pandas.core.frame import DataFrameimport pandas as pd import numpy as np import km as k #用TSNE进行数据降维并展示聚类结果 tsne = TSNE()tsne.fit_tr...原创 2019-03-20 11:57:41 · 2054 阅读 · 3 评论 -
pandas常用操作记录
1、读取csv文件并制定id列,即行索引data = pd.read_csv('./case_info.csv', index_col='id')data = pd.read_csv('f:/ceshi.csv',header=None,names=range(2,5))header表明原数据是否有列索引,names指定列名是2,3,4header=0,表示文件第0行(...原创 2019-02-26 13:53:05 · 295 阅读 · 0 评论 -
数据挖掘 日期转换表
时间变量无法直接进入建模数据集,因为时间是无限增长的,在历史数据中出现的时间肯定不同于将来模型所需应用的数据集中出现的时间,所以直接使用历 史数据的时间建立的模型就无法应用于将来的数据集。如果要在建模过程中考虑时间变量,就必须对其进行转换。常用的转换有如下几种:1.转换为距某一基准时间的时间长短,例如,“距离××年××月××日的天数”、“距离下一次春节的周数”等。2.转换为季节性信息,例如,一年中转载 2017-09-13 21:39:41 · 459 阅读 · 0 评论