- 博客(6)
- 资源 (1)
- 收藏
- 关注
原创 mySQL和Hive的区别
整体1、存储位置:Hive在Hadoop上;Mysql将数据存储在设备或本地系统中;2、数据更新:Hive不支持数据的改写和添加,是在加载的时候就已经确定好了;数据库可以CRUD;3、索引:Hive无索引,每次扫描所有数据,底层是MR,并行计算,适用于大数据量;MySQL有索引,适合在线查询数据;4、执行:Hive底层是MarReduce;MySQL底层是执行引擎;5、可扩展性:Hive:大数据量;MySQL:相对就很少了。语法内容SQLHive非等值连接支持不支持
2022-04-29 23:16:17 13301 1
原创 机器学习相关库的用法
机器学习相关库和函数来自:https://zhuanlan.zhihu.com/p/3429416761、数据预处理相关库和函数作用from sklearn.preprocessing import StandardScaler数据标准化from sklearn.preprocessing import MinMaxScaler数据缩放到[0,1]间from sklearn.preprocessing import Normalizer数据归一化:单位化向量
2021-11-13 20:09:48 1480
原创 presto正则表达式
基础知识便于记忆:\小写字母和\大写字母的含义是相反的。^如果没有在[]里面,则表示以某符号开头,如果在[]里面,则表示是里面内容的反内容。捕获组总结:从按照开括号从左到右,依次是1、2、3…匹配模式贪婪与非贪婪匹配如:String str=“abcaxc”;Patter p=“ab.*c”;贪婪匹配:正则表达式一般趋向于最大长度匹配,也就是所谓的贪婪匹配。如上面使用模式p匹配字符串str,结果就是匹配到:abcaxc(ab.*c)。非贪婪匹配:就是匹配到结果就好,就少的匹配字符。如上
2021-07-30 16:13:05 5435
原创 ECharts使用
由于想要学习可视化,通过查找资料发现使用Echarts进行数据可视化是一个比较好的方式。之后百度了一下知道echart是一个插件。Echarts是“开源”的,提供了创建多种多样的图表。包括折线图、坐标系、散点图等等之类的,这里就不一一列举了。大家可以Echart官网去查看接下来简要说以下初始使用步骤:在官网下载Echarts插件源代码(js文件)可能你会犹豫按照那种方式下载哪个会比较好...
2020-02-21 13:24:51 352
转载 决策树cart算法详解
https://blog.csdn.net/e15273/article/details/79648502算法步骤CART假设决策树是二叉树,内部结点特征的取值为“是”和“否”,左分支是取值为“是”的分支,右分支是取值为“否”的分支。这样的决策树等价于递归地二分每个特征,将输入空间即特征空间划分为有限个单元,并在这些单元上确定预测的概率分布,也就是在输入给定的条件下输出的条件概率分布。CAR...
2019-06-25 10:56:15 1408
原创 django中新建一项目直接运行报编码错误
小白 第一次新建Django项目 结果总是显示编码错误报错一大片 很多都和python内置库有关 最后一行是编码问题:utf-8 can’t code byte 0xd7 in position 0 :invalid continuation byte一开始以为是配置错误 重新安装了一遍 ,结果不是最后发现是主机名的问题,主机名不能够是中文,最好改为英文欢迎使用Markdown编辑器...
2019-05-08 08:22:43 319
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人