![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
文章平均质量分 64
Dragon Wu
创造是信仰!因为热爱所以从事。
展开
-
Pandas 学习总结
一、数据结构1、创建series data = pd.Series([5, 4, 3, 2, 1]) data = pd.Series(np.arange(1, 6),index=['a','b','c','d','e']) dict = {"name": "Jack", "age": 12, "sex": "male"} data = pd.Series(dict, index=['name', "age", "sex"])2、获取series以及切片获..原创 2022-02-06 20:44:10 · 1255 阅读 · 0 评论 -
Seaborn 学习总结
依赖:import seaborn as snsimport numpy as npimport matplotlib.pyplot as pltimport pandas as pd样式sns.set_style(param,rc={}) 设置背景主题共有如下参数: param:white,dark,whitegrid,darkgrid,ticks 设置样式 rc={'font.family':"KaiTi"}设置为楷体,rc只能设置外形...原创 2022-02-05 19:33:40 · 952 阅读 · 0 评论 -
Numpy 学习总结
一、数组import numpy as np1、特殊数组 array_zeros = np.zeros((3, 3)) array_ones = np.ones((4, 4)) array_full = np.full((2, 3), 9) array_eye = np.eye(4)zero全零矩阵,ones全1矩阵,full(元组,数字)传入元组代表几行几列、数字代表都按该数字填充,eye行列数为某值的单位矩阵,斜角对称2、创建数组..原创 2022-02-03 20:50:51 · 1086 阅读 · 0 评论 -
Matplotlib 绘图总结
使用的依赖:import matplotlib.pyplot as pltimport numpy as npimport pandas as pdfrom matplotlib import font_manager # 引入字体if __name__ == '__main__': # 绘图函数 plt.show()1、折线图# 折线图1def line_chart_one(): y = [np.random.randint(0, 10) for..原创 2022-01-24 19:11:17 · 3654 阅读 · 0 评论 -
机器学习 线性回归 以及评估训练结果 (二)
模型训练是一个耗时的过程,一个优秀的机器学习是非常宝贵的。可以将模型保存到磁盘中,也可以在需要使用的时候从磁盘中重新加载模型。线性回归模型训练完毕后,可以利用测试集评估训练结果误差。原创 2022-09-26 16:25:56 · 892 阅读 · 0 评论 -
机器学习 业务逻辑 一般步骤 以及数据预处理的方法 (一)
有些业务并不需要分析矩阵的详细完整数据(比如图像边缘识别只需要分析出图像边缘即可),可以根据一个事先给定的阈值,用0和1表示特征值不高于或高于阈值。将样本矩阵中的每一列的最小值和最大值设定为相同的区间,统一各列特征值的范围。根据字符串形式的特征值在特征序列中的位置,为其指定一个数字标签,用于提供给基于数值算法的学习模型。为样本特征的每个值建立一个由一个1和若干个0组成的序列,用该序列对所有的特征值进行编码。1、数据收集(数据检索、数据挖掘、爬虫)3、评估模型(工具、框架、算法知识)1、选择模型(算法)原创 2022-09-24 14:48:37 · 679 阅读 · 0 评论 -
pyod库 检测异常值的不同方法案例
目录一、ABOD类使用案例二、feature_bagging、LOF、KNN、IForest使用案例三、HBOS使用案例四、CBLOF使用案例一、ABOD类使用案例参考使用:All Models — pyod 0.9.8 documentationimport numpy as npfrom scipy import statsimport matplotlib.pyplot as pltimport matplotlib.font_manager# 导入想要用来检原创 2022-03-14 16:15:50 · 1767 阅读 · 0 评论 -
pyod库实现异常值检测 案例
目录一、KNN检测案例二、组合案例三、相关api链接一、KNN检测案例# coding=utf-8# 1、导入模型from pyod.models.knn import KNNfrom pyod.utils.data import generate_data, evaluate_printfrom pyod.utils.example import visualizeif __name__ == '__main__': # 2、生成样本数据pyod.utils.原创 2022-03-14 10:43:55 · 801 阅读 · 0 评论 -
机器学习 聚类算法总结
一、聚类算法简述二、K-Means算法实现案例一——简单实现# 一、导入库import numpy as npimport matplotlib.pyplot as pltfrom sklearn.cluster import MiniBatchKMeans, KMeansfrom sklearn import metricsfrom sklearn.datasets._samples_generator import make_blobsdef handler(): ...原创 2022-02-23 19:25:02 · 1972 阅读 · 0 评论 -
机器学习Sklearn学习总结3——回归与聚类算法
一、线性回归线性回归与梯度下降对比的代码:from sklearn.datasets import load_bostonfrom sklearn.model_selection import train_test_splitfrom sklearn.preprocessing import StandardScalerfrom sklearn.linear_model import LinearRegression, SGDRegressorfrom sklearn.metric..原创 2022-02-22 10:23:40 · 978 阅读 · 0 评论 -
机器学习Sklearn总结2——分类算法
一、转换器与估计器二、分类算法1、K-近邻算法KNN算法总结:优点:简单、易于理解、易于实现、无需训练缺点: 1)必须指定K值,K值选定不当则分类精度不能保证。 2)懒惰算法,对测试样本分类时的计算量大,内存开销大使用场景: 小数据场景,几千~几万条样本,具体使用看业务场景。案例代码:from sklearn.datasets import load_irisfrom sklearn.model_s...原创 2022-02-21 16:10:23 · 3505 阅读 · 0 评论 -
机器学习Sklearn 学习总结1——特征工程
一、数据集的划分训练数据:用于训练,构建模型测试数据:在模型检验时使用,用于评估模型是否有效from sklearn.model_selection import train_test_split测试集:20%~30%二、特征工程pandas 数据清理、数据处理特征抽取/特征提取机器学习算法 - 统计方法 - 数学公式文本类型 ——>数值类型——>数值...原创 2022-02-17 12:40:23 · 1065 阅读 · 0 评论 -
sklearn 混淆矩阵分析pima 印第安人糖尿病数据
数据链接:FE_pima-indians-diabetes.csv · biabianm/pima-indians-diabetes - Gitee.comimport pandas as pdfrom sklearn.model_selection import train_test_split # 数据分离from sklearn.linear_model import LogisticRegression # 逻辑回归模型from sklearn import metrics # 准原创 2022-01-15 11:29:06 · 848 阅读 · 1 评论 -
sklearn iris的k近邻实现预测案例
代码如下:# iris数据加载from sklearn import datasetsfrom sklearn.neighbors import KNeighborsClassifier # 模型调用from sklearn.metrics import accuracy_score # 查看准确度from sklearn.model_selection import train_test_split # 数据分离调用import matplotlib.pyplot as plti原创 2022-01-14 20:36:41 · 418 阅读 · 0 评论