- 博客(15)
- 资源 (11)
- 收藏
- 关注
转载 解析TF-IDF算法原理:关键词提取,自动摘要,文本相似度计算
Abstract:TF-IDF算法是一种常用的词频统计方法,常被用于关键词提取、文本摘要、文章相似度计算等。TF-IDF的算法思路TF词频(Text Frequency):统计出现次数最多的词 IDF逆文档频率(Inverse Document Frequency):大小与一个词的常见程度成反比;即给某些词分配“重要性”权重(平时比较少见而在这篇文章里多次出现的词应给予较高权重,而...
2018-12-28 17:25:04 1552
转载 Apriori算法详解
1、数据挖掘与机器学习有时候,人们会对机器学习与数据挖掘这两个名词感到困惑。如果你翻开一本冠以机器学习之名的教科书,再同时翻开一本名叫数据挖掘的教材,你会发现二者之间有相当多重合的内容。比如机器学习中也会讲到决策树和支持向量机,而数据挖掘的书里也必然要在决策树和支持向量机上花费相当的篇幅。可见二者确有相当大的重合面,但如果细研究起来,二者也的确是各自不同的领域。大体上看,数据挖掘可以视为数据...
2018-12-28 16:00:54 2374
转载 Spark SQL 教程
一、什么是Spark SQLSpark SQL是Spark用来处理结构化数据的一个模块,它提供了两个编程抽象分别叫做DataFrame和DataSet,它们用于作为分布式SQL查询引擎。从下图可以查看RDD、DataFrames与DataSet的关系。 image.png二、为什么要学习Spark SQL?我们已经学习了Hive,它是将Hive SQL转换成MapReduc...
2018-12-25 17:56:21 4509
转载 一分钟搞懂列式与行式数据库
本文对行式数据库与列式数据库进行比较,并且讲解如何根据业务场景需要选择对应的数据库系统。定义列式存储(Column-based)是相对于传统关系型数据库的行式存储(Row-based)来说的。简单来说两者的区别就是如何组织表。将表放入存储系统中有两种方法,而我们绝大部分是采用行存储的。行存储法是将各行放入连续的物理位置,这很像传统的记录和文件系统。列存储法是将数据按照列存储到数据库中,...
2018-12-25 17:32:16 11667
转载 mysql大小写敏感与校对规则
大家在使用mysql过程中,可能会遇到类似一下的问题:root@chuck 07:42:00>select * from test where c1 like 'ab%'; +-----+ | c1 | +-----+ | abc | | ABD | +-----+模糊匹配 ab%,结果以AB开头的字符串也出现在结果集中,大家很自然的认为是大小写敏感的问题。那么mysql...
2018-12-20 11:54:20 350
转载 mysql 查询正在执行的事务以及等待锁 常用的sql语句
转载自:https://blog.csdn.net/u011375296/article/details/51427985使用navicat测试学习:首先使用set autocommit = 0;(取消自动提交,则当执行语句commit或者rollback执行提交事务或者回滚)在打开一个执行update查询 正在执行的事务:SELECT * FROM information_...
2018-12-19 18:10:15 1117
转载 mysql主键大小写不敏感的解决办法
如果你在mysql有唯一约束的列上插入两行值'A'和'a',Mysql会认为它是相同的,而在oracle中就不会。就是mysql默认的字段值不区分大小写?这点是比较令人头痛的事。请看下面的测试:mysql> create table test4(nick varchar(20) primary key);Query OK, 0 rows affected (0.01 sec)mys...
2018-12-19 15:33:08 927
转载 Mysql coalesce()函数认识和用法
Mysql coalesce()函数认识和用法 coalesce()解释:返回参数中的第一个非空表达式(从左向右); 鉴于在mysql中没有nvl()函数, 我们用coalesce()来代替。 coalesce相比nvl优点是,coalesce中参数可以有多个,而nvl()中参数就只有两个。 当然,在oracle中也可以使用 case when....then.......
2018-12-17 18:44:21 2701
转载 设置nginx进程可打开最大的文件数
涉及到的nginx配置参数: worker_processes: 表示操作系统启动多少个工作进程在运行,一般这个参数设置成CPU核数的倍数 worker_connections:表示nginx的工作进程(worker process)可以允许建立的外部连接数。 注意: 一个工作进程(worker process)建立一个连接后,进程将会打开一个文件副本...
2018-12-17 14:11:52 1659
转载 vue -- 非父子组件传值,事件总线(eventbus)的使用方式
转自:https://blog.csdn.net/wxl1555/article/details/84646832 一、 前言先说一下什么是事件总线,其实就是订阅发布者模式;比如有一个bus对象,这个对象上有两个方法,一个是on(监听,也就是订阅),一个是emit(触发,也就是发布),我们通过on方法去监听某个事件,再用emit去触发这个事件,同时调用on中的回调函数,这样就完成了一次事...
2018-12-10 22:32:59 219
转载 TCP 协议(滑动窗口——基础)
相信大家都遇到过这样的场景:同学 Luffy 给你打电话,让你记下一串手机号码,可是你记忆力不太好,你跟 Luffy 约定,一次只最多只能报 4 个数字,Luffy 念一遍,如果你听到了就把他说的话重复一遍。接下来:你:你一次最多报 4 个数字,多了我记不住啊! Luffy:139 你:139 (Luffy 知道你听到了) Luffy:7548 你:7538 (很明显你听错了)...
2018-12-08 09:43:27 161
转载 vue 切换页面setInterval问题
转载自:https://blog.csdn.net/zhengyinling/article/details/84565379参考:https://www.cnblogs.com/woniubushinide/p/9282560.htmlvue 是单页面应用,路由切换后,定时器并不会自动关闭,需要手动清除,当页面被销毁时,清除定时器即可。注:如果页面用到了keep-alive技术(即加...
2018-12-07 11:23:44 1611
转载 清除浮动的四种方式及其原理理解
清除浮动的四种方式及其原理理解本文介绍了四种清除浮动的方法,并尝试解释其原理。在理解了各种清除浮动的原理之后,你会发现,很多清除浮动的方法本质上其实是一样的。掌握这些原理,相信你可以根据场景和需求,灵活运用原则发展出不同的清除浮动的方法,而不再死记或拘泥于文中提到的方法。一、为什么要清除浮动在讲清除浮动的方法之前,我们先来了解一下为什么要清除浮动,清除浮动的目的是什么,即,要解决什么样...
2018-12-07 09:59:55 257
转载 在vue中怎么使用echarts
现在很多的项目,对数据可视化看的越来越重要,数据可视化可以多维度的分析数据,一目了然;对项目的美观和简洁度都有不少的提升,比原来那种表格化的数据格式要好很多了!对这种问题,echarts解决了这样的问题,这里介绍一下 在vue怎么使用echarts!同样,使用的vue-cli环境!首先,通过npm安装ECharts和zrender,命令行:npm install echarts --s...
2018-12-06 18:14:44 1013 1
转载 vue-router使用next()跳转到指定路径时会无限循环
我在路由为 /path 的页面这样写beforeRouteLeave (to, from, next) { console.log('离开路路由') if(to.fullPath==='/home'){ next(); }else{ next('/home') }这个是组件路由,我想实现...
2018-12-04 12:52:13 6193
Python.Cookbook(第2版).pdf
2018-02-01
计算机网络(第7版)-谢希仁 pdf下载 高清完整版
2017-12-05
编译原理(龙书-中文第二版).pdf
2017-12-05
精通Python设计模式.pdf高清完整版下载
2017-12-04
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人