自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 收藏
  • 关注

原创 CART决策树(Classifiaction and Regression Tree)

D是数据集,(x,y)是元数据,其中x是p维向量,p代表x的各个特征输出的值为。

2024-05-01 21:37:14 68 1

原创 关联分析算法-Apriori算法

这是一种关联分析算法,用于发现数据中的频繁项集和关联规则,常用于购物篮分析等场景。

2024-04-29 19:37:04 1294 1

原创 决策树(Decision Tree)-ID3算法

决策树(Decision Tree)-ID3算法

2024-04-28 23:23:24 916

原创 你好,程序员

希望你之后,不仅仅是程序员,更应该是那个17、8岁,能够为这一个目标,不断认错,试错,改错的那位少年。

2024-04-21 23:42:14 323

原创 浅谈数据挖掘(1)-BOW算法

BoW适用于大规模文本数据的特征提取和文本分类任务,是一种文本特征提取方法。

2024-04-18 22:51:39 170

原创 系统自带字体的路径查找问题(基于红楼梦词云图)

系统自带字体的路径查找问题

2024-04-18 14:18:10 195

原创 浅谈矩阵分解(2)-QR分解

矩阵QR分解的讨论

2024-04-18 00:10:03 363

原创 浅谈矩阵分解(1)-三角分解

矩阵的三角分解(LU分解)

2024-04-17 00:12:24 657

原创 审查元素与查看网页源代码不一致问题的解决(基于《三国演义》网络爬虫 含:with关键字,re库常用方法的解析)

审查元素与查看网页源代码不一致问题的解决,with关键字,re库常用方法的解析

2024-04-15 19:50:27 1377 2

原创 作为测试你必须知道的Pycharm常用快捷键

Pycharm常用快捷键

2024-04-14 23:04:33 212

原创 聚类分析 层次聚类

总的来说,不同的距离度量方法会导致聚类结果的形成和簇之间的关系不同,选择合适的距离度量方法需要根据数据的特征、分布情况以及对异常值的处理要求进行考虑。不同的距离度量方式可能会导致不同的聚类结果,因此需要根据具体情况选择最适合的距离度量方式,以获得更准确和有意义的聚类结果。例如,欧式距离会受到异常值的影响,因为它计算了样本在每个维度上的差异的平方和,而曼哈顿距离则相对不太受到异常值的影响。最大距离也称为切比雪夫距离,它计算两个点之间的最大距离,即它们之间任意一维特征的差的绝对值的最大值。

2024-04-14 22:49:12 546

原创 百度贴吧 评论用户 评论时间 爬取(bs4+regex)

百度贴吧bs4爬虫

2024-04-14 22:37:52 1414

原创 小王子词云图的生成

基于python和停用词,实现小王子词云图的绘制(含exe可执行文件)

2024-04-14 22:26:05 242

原创 Json格式的文件与CSV文件格式的转换(含编码的知识)

将数据转换为json格式可以方便在不同系统、不同平台之间进行数据交换和传输。json作为一种通用的数据格式,被广泛支持和应用,可以确保数据在传输过程中的可靠性和一致性。

2024-04-14 22:04:50 1349

<<小王子>>基于pyinstaller生成的直接运行的文件

<<小王子>>基于pyinstaller生成的直接运行的文件

2024-04-14

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除