![](https://img-blog.csdnimg.cn/20201014180756918.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
封狼居士
此人不懒,什么都写了。
展开
-
机器学习实战-文本模型
文本挖掘有时又被称为文本数据挖掘,一般是指在文本处理过程中发现并提取其中的高质量信息。高质量的信息通常通过分类和预测来产生,如模式识别。文本数据是非结构化的数据,常用的文本挖掘分析技术有文本结构分析、文本摘要、文本分类、文本聚类、文本关联分析、分布分析和趋势预测。文本挖掘方法有 :信息检索(IR)、自然语言处理(NLP)、文本信息提取(IE)、文本摘要、无监督学习方法(文本)、监督学习方法(文本)、文本挖掘的概率方法、文本流和社交媒体挖掘、观点挖掘与情感分析、生物医学文本挖掘等。文本分析是指对文本的表原创 2020-11-13 20:21:42 · 642 阅读 · 0 评论 -
无监督学习-实战
在无监督学习中聚类分析占据很大的比例,所以本章主要介绍几种聚类分析的算法和字典学习。聚类分许是统计、分析数据的一门技术。应用领域有:机器学习、数据挖掘、模式识别、图像分析以及生物信息等领域。常见的聚类分析算法有系聚类、K-均值聚类、基于密度的聚类、MeanShift聚类。字典学习既可以用来进行有监督问题的解决(如图像分类),也能用于无监督问题的解决(如使用字典学习对图像去噪等)1、系统聚类系统聚类又叫层次聚类,根据层次分解为自底向上(合并)和自顶向下(分裂)两种方式,即凝聚与分裂。凝聚的层次聚原创 2020-11-13 20:04:14 · 1042 阅读 · 0 评论 -
关联可视化
规则较多,仍然使用数据表查看,这无疑是一种糟糕的策略。这时关联规则可视化就显得非常重要。在得到关联规则后,如何更加高效地查看关联规则之间的内容和关系?散点图和网络图等可视化方法无疑是分析规则的利器。#找到关联规则,通过置信阈值发现新规则rule2=association_rules(df_fre,metric="confidence",min_threshold=0.7)rule2["antelen"]=rule2.antecedents.apply(lambda x:len(x))rule2=ru原创 2020-11-13 19:54:35 · 1989 阅读 · 0 评论 -
机器学习实战-关联规则
``数据挖掘就是对数据进行处理,并以某种方式分析源数据,从中发现一些潜在的有用的信息,所以数据挖掘又称作知识发现。这里的“某种方式”就是机器学习算法。关联规则作为经典机器学习算法之一,搞懂关联规则自然有着很重要的意义。顾名思义,关联规则就是发现数据背后存在的某种规则或者联系。import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as sns%matplotlib inline%c原创 2020-11-13 19:51:13 · 827 阅读 · 0 评论