<数据挖掘--概念与技术>读后感

本文是对《数据挖掘--概念与技术》一书的读后感,涵盖了数据挖掘的基础概念、处理流程,包括数据清理、集成、选择、变换等预处理阶段,以及数据挖掘的核心技术,如模式评估、分类和聚类算法的详细介绍。文章强调了数据的相似性、相异性度量、预处理的重要性,并列举了各种数据属性的处理方法,如标称属性、二元属性、数值属性的度量。此外,还讨论了决策树、贝叶斯分类、K均值等经典算法,以及数据挖掘过程中需要注意的错误和修正。
摘要由CSDN通过智能技术生成

//2017-05-20 13:30

这篇文章我已经欠了至少一年了,周五写记录时,本想写开始认真搞黑客,但突然发现之前的总结少了这一篇,心里实在过不去,遂补上,顺便梳理一下之前学习的总结,也了却一心愿。

 

数据挖掘的目标是从数据集中识别出一种或多种模式,并用所发现的模式进行分析或预测。

 

处理数据的过程分以下几个步骤:
1.数据清理->2.数据集成->3.数据选择->4.数据变换(前4个阶段都是预处理阶段)->5.数据挖掘->6.模式评估->7.知识表示

 

一切的万物都是从基石开始打好基础:

 

1.明白数据和它所属的属性,因为不同属性的数据,用的方案不一样。
属性有如下类型: 标称(nominal)属性,二元(binary)属性,序数(numeric)属性,离散属性,连续属性。

 

2.然后要明白一些对数据基本属性量度的方案:
各种均值(算数平均,加权平均),中位数,众数,方差,标准差。

 

3.度量数据的相似性和相异性
数据相似性和相异性又称邻近性(proximity),是一个非常非常重要的指标,数据的差异和距离都是通过这个来衡量的,以后的算法中,很多都是基于此去判断。
由于数据本身有不同的属性,所以度量它们的临近性根据数据属性不同使用不同的方法:
a.标称属性: d(i,j) = (p-m)/p
b.二元属性: Jaccard系数
c.数值属性: Minkowski distanc

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
在 Java Web 应用程序中,`web.xml` 文件用于配置 Web 应用程序的部署描述符。`<context-param>` 标签是 `web.xml` 文件中的一种配置元素,用于声明应用程序的初始化参数。 `<context-param>` 标签中包含了应用程序需要的一些全局参数,这些参数可以在整个应用程序中使用。例如,数据库连接字符串、日志输出路径等。通过在 `web.xml` 文件中定义这些参数,我们可以在应用程序的任何位置使用它们,而不必硬编码到应用程序的代码中。这样,当这些参数需要修改时,我们只需要修改 `web.xml` 文件中的值,而不必修改代码。 下面是一个使用 `<context-param>` 标签定义应用程序初始化参数的示例: ```xml <web-app> <context-param> <param-name>databaseUrl</param-name> <param-value>jdbc:mysql://localhost:3306/mydatabase</param-value> </context-param> <context-param> <param-name>logFilePath</param-name> <param-value>/var/log/myapp.log</param-value> </context-param> </web-app> ``` 在上面的示例中,应用程序定义了两个初始化参数 `databaseUrl` 和 `logFilePath`。这些参数可以在应用程序中通过 ServletContext 或者 JSP 中的 `getInitParameter()` 方法来获取。例如,在一个 Servlet 中获取 `databaseUrl` 参数的方式如下: ```java public class MyServlet extends HttpServlet { protected void doGet(HttpServletRequest request, HttpServletResponse response) throws ServletException, IOException { String databaseUrl = getServletContext().getInitParameter("databaseUrl"); // ... } } ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值