![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
个人
文章平均质量分 79
炫炫有牛腩
这个作者很懒,什么都没留下…
展开
-
Linux-基本操作-查找文件
Linux查找文件内容的常用命令方法。 从文件内容查找匹配指定字符串的行: $ grep “被查找的字符串” 文件名 例子:在当前目录里第一级文件夹中寻找包含指定字符串的.in文件 grep "thermcontact" */*.in从文件内容查找与正则表达式匹配的行: $ grep –e “正则表达式” 文件名查找时不区分大小写: $ grep –i "被查找的字符串" 文件名查找匹配转载 2016-12-14 17:05:43 · 311 阅读 · 0 评论 -
Hadoop学习路线
Hadoop基础 Hadoop是一个能够对大量数据进行分布式处理的软件框架,它是一种技术的实现,是云计算技术中重要的组成部分,云计算的概念更广泛且偏向业务而不是必须拘泥于某项具体技术,云计算的存在只是一种新的商业计算模型和服务模式。因此,云计算才会出现“横看成岭侧成峰,远近高低各不同”,各种各样层出不穷的理解。 对于初学hadoop的朋友来说可能基于迫切寻找一本入门的书,我个人觉得不用于急于寻找书,转载 2016-12-14 19:26:39 · 418 阅读 · 0 评论 -
2016年
都到了17年的2月底才开始对2016年的一些人和事开始记录。2016年16年初我依旧欢快的沉醉在大三的生活里,每周五周日晚7点到9点都固定的去舞队的常规看着他们刻苦训练,纯粹的想看看他们认真的样子。大学到底是一个怎样的过程?大学四年估计我也没过个明白,但是我大概知道有那么几件事我可以不眠不休的做而且还很高兴,有那么几个人可以畅谈各种各样的事情,常见但是从不觉得油腻,有那么个集体,让你感到温馨舒服,像原创 2017-02-21 22:42:51 · 614 阅读 · 0 评论 -
数据挖掘鄙视题-数据库(查询)
1、如何写sql查询语句查找11位手机号码所有后四位尾数符合AABB或者ABAB或者AAAA形式的电话号码? 设表PhoneNumselect phone from PhoneNum where (SUBSTRING(phone, 11)=SUBSTRING(phone, 10, 1) and SUBSTRING(phone, 9, 1)=SUBSTRING(pho原创 2016-10-15 10:42:11 · 1466 阅读 · 2 评论 -
数据挖掘鄙视题-整理(单选)
1、某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?(A) A. 关联规则发现 B. 聚类 C. 分类 D. 自然语言处理2、以下两种描述分别对应哪两种对分类算法的评价标准? (A) (a)警察抓小偷,描述警察抓的人中有多少个是小偷的标准。 (b)描述有多少比例的小偷给警察抓了的标准。 A. Precision, Recall B. Reca原创 2016-10-14 00:04:31 · 9301 阅读 · 2 评论 -
数据挖掘鄙视题-整理(多选)
通过数据挖掘过程所推倒出的关系和摘要经常被称为:(A B) A. 模型 B. 模式 C. 模范 D. 模具寻找数据集中的关系是为了寻找精确、方便并且有价值地总结了数据的某一特征的表示,这个过程包括了以下哪些步骤? (A B C D) A. 决定要使用的表示的特征和结构 B. 决定如何量化和比较不同表示拟合数据的好坏 C. 选择一个算法过程使评分函数最优 D. 决定用什么样的数据管理转载 2016-10-14 00:53:41 · 9168 阅读 · 0 评论 -
数据挖掘鄙视题-判断题
数据挖掘的主要任务是从数据中发现潜在的规则,从而能更好的完成描述数据、预测数据等任务。 (对)数据挖掘的目标不在于数据采集策略,而在于对于已经存在的数据进行模式的发掘。(对)3. 图挖掘技术在社会网络分析中扮演了重要的角色。(对)模式为对数据集的全局性总结,它对整个测量空间的每一点做出描述;模型则对变量变化空间的一个有限区域做出描述。(错)寻找模式和规则主要是对数据进行干扰,使其符合某种规则以转载 2016-10-14 00:08:08 · 12146 阅读 · 0 评论 -
数据挖掘-鄙视问答题、面试题(整理)
基础概念异常值是指什么?请列举1种识别连续型变量异常值的方法? 异常值(Outlier) 是指样本中的个别值,其数值明显偏离所属样本的其余观测值。在数理统计里一般是指一组观测值中与平均值的偏差超过两倍标准差的测定值。 Grubbs’ test 是一种用于单变量数据集异常值识别的统计检测,它假定数据集来自正态分布的总体。 未知总体标准差σ,在五种检验法中,优劣次序为:t检验法、格拉原创 2016-10-22 23:37:46 · 1843 阅读 · 0 评论 -
阿里音乐-比赛记录(1)
第一次从数模比赛走向数据挖掘比赛,感觉很不一样,很多书本上的知识点,自己能够调用的实在太少。熟悉业务才能谈挖掘这句话,望自己在比赛中多多总结感悟,学习到更多知识,更好的借鉴前人的经验,来完善自身经验上的不足。 在6490分数卡死10天+,看着排名由两位数到3位数,各种措施和小技巧都不起作用。莫名心塞,总结一下前段时间看资金流比赛PPT,常看看,看看自身能否有所感悟,突破。资金流比赛,时间序列方法1原创 2016-06-02 00:45:12 · 887 阅读 · 0 评论 -
SVN安装配置
一,安装svn服务器在Linux中安装了服务端, $ apt-get install subversion二、创建svn版本库2.1 根目录cd / mkdir svn svnadmin create /svn/code 创建代码版本库2.2 svnadmin create /svn/code创建文档版本库2.2.1 修改代码版本库配置文件vim /svn/...转载 2018-05-25 21:48:31 · 469 阅读 · 0 评论