数据挖掘选修
文章平均质量分 92
鱼树C
心有所向,日复一日,必有精进
展开
-
【数据挖掘】特征化分析(信息增益)
这是一个数据挖掘选修课的作业,要求是类概念描述和特征化分析,两个词连搜都搜不到,如果你不知道我写的是什么,说实话我也不知道…使用的语言为python,是直接在Jupyter中写的,中间会有一些输出方便随时进行验证。原创 2022-10-27 16:55:42 · 1398 阅读 · 0 评论 -
【数据挖掘】决策树ID3算法Python实现
文章内容为对数据挖掘实验作业的记录,如果您是为了作业而来看的这篇文章,还请不要无脑拷贝,本人编程能力较弱,代码写的并不优雅,注释尽可能写的详细了。这学期真是挺忙的 >_原创 2022-11-24 23:09:02 · 2711 阅读 · 3 评论 -
【数据挖掘】决策树C4.5算法Python实现
文章内容为对数据挖掘实验作业的记录,如果您是为了作业而来看的这篇文章,还请不要无脑拷贝,本人编程能力较弱,代码写的并不优雅,注释尽可能写的详细了。和上一篇文章ID3算法实现的过程基本一致,不同之处在于C4.5使用信息增益率作为选择标准,为了区别于上一种方式,这里对连续值的处理使用遍历来查找一个使信息增益率最优的值。这学期真是挺忙的 >_原创 2022-11-24 23:16:43 · 5886 阅读 · 6 评论 -
【数据挖掘】期末
SL描述了两个基因对之间的致死性关系,但是两个基因之间的致死性关系实际上是很多因素的影响的,这些因素可能包括细胞成分、分子功能、化合物等等,而知识图谱就是描述某些数据之间的数据库,我们可以将上述的这些影响因素使用知识图谱存储起来,通过有监督方式的学习过程,通过这些信息构建一个基因相似性关系,通过多轮的学习过程,不断更新这个基因相似性关系,之后通过相似性预测基因之间的致死性信息。原创 2022-12-23 06:00:00 · 678 阅读 · 0 评论 -
【数据挖掘】主成分分析Python实现
是对一个数据挖掘作业的记录,数据集是老师提供的几种癌症的数据,我是直接在Jupyter中写的,中间会输出一些内容验证之类的参考的大佬文章仅作记录,至于原理还有很多不懂的地方,结果我也不知道该是什么样的,把用这么多维特征来区分的事物降到两维来进行区分,我自己感觉已经很神奇了哈哈!原创 2022-10-23 19:38:55 · 2240 阅读 · 2 评论