大数据
Future-Miracle
悠长岁月平静,无事亦是蹉跎
展开
-
各种领域匹配数据汇总
ATEC:是金融领域客服场景的数据. BQ:银行领域的问题匹配,BQ数据链接。 LCQMC:覆盖多个领域的问题匹配,LCQMC数据链接。 PAWSX:谷歌发布的数据集,包含多种释义对和非释义对。 STS-B:计算两句话的相关性,是通过翻译和人工修正后的数据集。 ...原创 2021-10-27 10:43:50 · 555 阅读 · 0 评论 -
Hadoop学习
云计算的源起:通过把众多的计算机通过集群的方式并行同时运行,以此来提高运行的速度。 Hadoop是由: HDFS(分布式文件系统)和分布式并行编程框架(MapReduce)还有子项目Hive、HBase、Mahout、 Pig、ZooKeeper等构成 字节单位的大小:B-KB-MB-GB-TB-PB-EB-ZB原创 2015-07-02 10:17:00 · 522 阅读 · 0 评论 -
DataMining(1)
一:数据挖掘的基本知识 数据挖掘(Data Mining,简称DM)简单的讲就是从大量数据中挖掘或抽取出知识,数据挖掘,又称为数据库中知识的发现(Knowledge Discovery from DataBase,简称KDD),它是一个从大量数据中抽取挖掘未知的,有价值的模式或规律等知识的复杂过程。 KDD就是利用机器学习的方法从数据库中提取有价值知识的过程,他是数据库技术和机器学习两个学科的交原创 2015-08-20 16:02:10 · 751 阅读 · 1 评论