数据挖掘
文章平均质量分 64
xiaohang20103
这个作者很懒,什么都没留下…
展开
-
数据预处理
1.噪声处理办法:1、分箱法:平均值平滑,中值平滑,边界值平滑2、聚类法识别孤立点:outlier,在分类中可以使用SVDD方法求取孤立点3、回归的方法,这种方法需要求到模型4、基于概率方面可以求取孤立点5、用到的去噪声的方法有S-G滤波法2.数据变换:使用数据归一化处理,把不同的属性的数据,把数据变换到同一个量纲上。数据压缩:数据压缩分为有损压缩和无损压缩,比原创 2013-04-26 17:15:45 · 769 阅读 · 0 评论 -
面试技巧:26个面试经典问题回答
1、请你自我介绍一下自己好吗? 回答提示:一般人回答这个问题过于平常,只说姓名、年龄、爱好、工作经验,这些在简历上都有。其实,企业最希望知道的是求职者能否胜任工作,包括:最强的技能、最深入研究的知识领域、个性中最积极的部分、做过的最成功的事,主要的成就等,这些都可以和学习无关,也可以和学习有关,但要突出积极的个性和做事的能力,说得合情合理企业才会相信。企业很重视一个人的礼貌,求职者要转载 2013-07-10 09:16:38 · 1100 阅读 · 0 评论 -
数据分析那些事
了解数据、总体、样本的含义及随机抽样的一般方法;掌握排列图、因果分析图的作图方法和应用;掌握分层法、统计图表法的应用;了解直方图的原理、作用、作图方法及应用;数据表现形式:数据列表(即图表)趋势图述性分析:数据分时段走势、差距变化情况以及相应的时间背景比例的图形按数据的性质一般可归纳为: 定性数据。往往用于频数或频率分析。 定量型数据。可以用数字量化转载 2013-06-26 15:02:58 · 773 阅读 · 0 评论 -
Hadoop操作HDFS命令
Hadoop操作HDFS命令如下所示:hadoop fs查看Hadoop HDFS支持的所有命令hadoop fs –ls列出目录及文件信息hadoop fs –lsr循环列出目录、子目录及文件信息hadoop fs –put test.txt /user/sunlightcs将本地文件系统的test.txt复制到HDFS文件系统的/user/sun转载 2013-07-29 09:21:20 · 808 阅读 · 0 评论 -
Core-site.xml配置
Core-site.xml配置http://hi.baidu.com/bjwyl66/item/83c5acf58d44fa25743c4c89http://www.juziku.com/sunlightcs/wiki/5989.htm配置hadoopHadoop的配置文件在早期版本中都放在同一个文件里hadoop-site.xml,在新版本中hadoop把配置文件做了区分转载 2013-07-30 10:43:40 · 13551 阅读 · 0 评论