![](https://img-blog.csdnimg.cn/20201014180756922.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
2021_机器学习代码
学习,是为了看的更多,望得更远
Captain_Data
有问题可以私信交流呀~csdn当笔记用~
展开
-
2.27聚类
存储tab+shift 查询函数解释os.path.abspath(“相对入境名”)转集合去重法数据groupby与统计函数并用.loc['test']['id'].loc['test'.pd.IndexSlice['id',:]] 多重索引聚类框架:模型X算法X策略1、lasso L1数值类型研究哪个模型更合适采用误差度量(平方和),因为误差越小越...原创 2020-02-27 18:50:35 · 461 阅读 · 0 评论 -
2.28 k-means
聚类算法:无监督,给数据分簇 用距离刻画计算的相似程度1 划分法 k-means k-meadian2层次法 分裂 合并k-means1.随机抽取k条记录作为簇的中心点案例1 0-1标准化k-means原理1 随机取k个中心点2计算其他记录与各个中心点的距离,并归簇,求每个簇各种的均值...原创 2020-02-28 12:02:42 · 244 阅读 · 0 评论 -
3.机器学习模型代码——逻辑回归代码案例工作实操
import numpy as npimport pandas as pdimport mathdf=pd.read_excel("data.xlsx",dtype=str)df.describe() 随机值 公司Id 时间内注册公司数量(月) 注册地址重合 关联公司涉案 法人有涉案记录(总次数) 社保人数 纳税金额 法人过境记录 预测结果原创 2021-08-23 23:41:06 · 918 阅读 · 4 评论 -
2.聚类模型优化与训练
1.数据 2.代码import sklearn.metrics as skm #评估包from sklearn import cluster #聚类分析import numpy as npimport matplotlib.pyplot as plt# from sklearn.externals import joblib #保存数据 pkl 已更新包import joblibd=pd.read_excel("数据\\03.聚类si数据.xlsx")d.index=d.企业d原创 2021-06-27 19:18:02 · 772 阅读 · 0 评论 -
1.机器学习模型代码——聚类与评估参数
import sklearn.metrics as skmfrom sklearn import clusterimport numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport joblibdata=pd.read_excel("数据\\01.聚类数据1.xlsx")data <tr style="text-align: right;"> <th></th&原创 2021-06-27 02:39:19 · 436 阅读 · 0 评论