- 博客(14)
- 收藏
- 关注
原创 CART决策树(Classifiaction and Regression Tree)
D是数据集,(x,y)是元数据,其中x是p维向量,p代表x的各个特征输出的值为。
2024-05-01 21:37:14
68
1
原创 审查元素与查看网页源代码不一致问题的解决(基于《三国演义》网络爬虫 含:with关键字,re库常用方法的解析)
审查元素与查看网页源代码不一致问题的解决,with关键字,re库常用方法的解析
2024-04-15 19:50:27
1377
2
原创 聚类分析 层次聚类
总的来说,不同的距离度量方法会导致聚类结果的形成和簇之间的关系不同,选择合适的距离度量方法需要根据数据的特征、分布情况以及对异常值的处理要求进行考虑。不同的距离度量方式可能会导致不同的聚类结果,因此需要根据具体情况选择最适合的距离度量方式,以获得更准确和有意义的聚类结果。例如,欧式距离会受到异常值的影响,因为它计算了样本在每个维度上的差异的平方和,而曼哈顿距离则相对不太受到异常值的影响。最大距离也称为切比雪夫距离,它计算两个点之间的最大距离,即它们之间任意一维特征的差的绝对值的最大值。
2024-04-14 22:49:12
546
原创 Json格式的文件与CSV文件格式的转换(含编码的知识)
将数据转换为json格式可以方便在不同系统、不同平台之间进行数据交换和传输。json作为一种通用的数据格式,被广泛支持和应用,可以确保数据在传输过程中的可靠性和一致性。
2024-04-14 22:04:50
1349
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人