![](https://img-blog.csdnimg.cn/20201014180756780.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
大数据
火星种萝卜
c++ vc mfc java
展开
-
Spark-RDD 键值对的操作(Scala版) =>
Spark-RDD 键值对的操作(Scala版) - it610.com转载 2022-01-18 15:51:58 · 197 阅读 · 0 评论 -
SparkContext的parallelize 后数据就可以并行操作了
SparkContext的parallelize的参数_步步为赢的专栏-CSDN博客_parallelize函数转载 2022-01-18 12:42:44 · 363 阅读 · 0 评论 -
RDD是Spark中的数据抽象,意思是弹性分布式数据集
深入浅出Spark(二) 什么是RDD - 知乎转载 2022-01-18 09:51:00 · 261 阅读 · 0 评论 -
SQL INNER JOIN LEFT JOIN RIGHT JOIN 笛卡尔积
https://blog.csdn.net/Michaelwubo/article/details/80923248转载 2021-08-26 10:03:17 · 179 阅读 · 0 评论 -
现代汉语常用汉字3500表
https://blog.csdn.net/Wintalen/article/details/1018776?utm_medium=distribute.pc_relevant_download.none-task-blog-2~default~BlogCommendFromBaidu~default-10.test_version_3&depth_1-utm_source=distribute.pc_relevant_download.none-task-blog-2~default~BlogCo转载 2021-07-10 22:33:19 · 480 阅读 · 0 评论 -
paip.常用汉字形声字大全3500字
https://blog.csdn.net/weixin_34405925/article/details/85604906?utm_medium=distribute.pc_relevant_download.none-task-blog-2~default~BlogCommendFromBaidu~default-19.test_version_3&depth_1-utm_source=distribute.pc_relevant_download.none-task-blog-2~defaul转载 2021-07-10 22:21:51 · 206 阅读 · 0 评论 -
决策树-随机森林-两种Feature importances排序方法
https://blog.csdn.net/sinat_22510827/article/details/114218051转载 2021-07-08 12:06:47 · 498 阅读 · 0 评论 -
用notepad++怎样批量添加引号
https://jingyan.baidu.com/article/48206aeaf63835606bd6b326.html转载 2021-06-27 15:48:17 · 1830 阅读 · 0 评论 -
如何保证数据标注的高质量?
https://www.zhihu.com/question/285776874转载 2021-06-22 15:01:48 · 489 阅读 · 0 评论 -
评价指标对比:准确率(accuracy)、精确率(Precision)、召回率(Recall)、IOU、Kappa系数
https://blog.csdn.net/zsc201825/article/details/93487506转载 2021-05-26 18:11:54 · 691 阅读 · 0 评论 -
衡量机器学习模型的三大指标:准确率、精度和召回率
https://www.cnblogs.com/xuexuefirst/p/8858274.html转载 2021-05-26 17:56:10 · 556 阅读 · 0 评论 -
TortoiseGit配置密钥的方法
https://www.cnblogs.com/suger43894/p/10694657.html转载 2021-05-26 12:42:07 · 419 阅读 · 0 评论 -
LINUX查看GPU使用信息
https://blog.csdn.net/weiyumeizi/article/details/83035711转载 2021-05-25 20:57:35 · 254 阅读 · 0 评论 -
linux安装python3命令-linux系统下安装python3及其配置
https://blog.csdn.net/weixin_39621870/article/details/109618713转载 2021-05-24 16:14:27 · 99 阅读 · 0 评论 -
Pandas.DataFrame删除指定行和列(drop)
https://blog.csdn.net/qq_18351157/article/details/105785367转载 2021-05-23 17:10:35 · 1163 阅读 · 0 评论 -
pandas读取csv Error tokenizing data. C error: Expected 18 fields in line 173315, saw 20
https://blog.csdn.net/ys1305/article/details/97299109转载 2021-05-23 16:50:00 · 554 阅读 · 0 评论 -
随机森林OOB score作用
https://blog.csdn.net/MingRachel/article/details/115038730转载 2021-05-23 08:15:55 · 926 阅读 · 0 评论 -
2021-05-22 Please update your GPU driver by downloading and installing a new version from the URL: h
(pyenv3) [root@bsyocr server]# python nlp/run.py > nlp/log.txt/opt/pyenv3/lib64/python3.6/site-packages/torch/cuda/__init__.py:52: UserWarning: CUDA initialization: The NVIDIA driver on your system is too old (found version 10010). Please update your G原创 2021-05-22 16:52:23 · 1627 阅读 · 0 评论 -
kafka与zookeeper关系
https://blog.csdn.net/u011311291/article/details/85264046转载 2021-05-11 17:04:29 · 244 阅读 · 0 评论 -
xgboost源码 要看的
https://www.cnblogs.com/yifanrensheng/p/12839749.html转载 2021-04-16 16:40:01 · 78 阅读 · 0 评论 -
logistic loss公式的由来 xgboost 雪伦的推导中使用了该公式
公式如下摘录片段如下假设是另外一个hypothesis function,且,把带入式可以得到显然式和式是等价的,即式的Loss形式叫作针对的Logistic Loss,也就是说针对的二进制交叉熵损失等价于针对的Logistic损失,而实际上是通过Logistic function的映射,即也就是说不论这个hypothesis function是什么形式,针对使用Logistic Loss就可以用于二分类问题,因为针对使用Logistic Loss就等价于针对使用二进..转载 2021-04-16 12:57:42 · 211 阅读 · 0 评论 -
数据迷雾诞生因果
https://mbd.baidu.com/newspage/data/landingsuper?context=%7B%22nid%22%3A%22news_9565021777391116715%22%7D&n_type=0&p_from=1转载 2021-04-11 16:48:12 · 71 阅读 · 0 评论 -
java与scala的区别 个位数以内的 就喜欢作者这么言简意赅的
可以说scala来源于java,但又高于java,我的理解是scala就是在java语言的基础上增加了一层编码的 “壳” 让程序人员可以通过函数式编程的方式来开发程序。由于scala最终被编译为.class文件运行在JVM虚拟机中,其实本质上还是java, 所以在scala和java可以互调双方的api;区别:1,变量的声明变量var 常量val scala支持自动类型推测scala更多的是采用常量,而不是变量来解决问题,这样带来的好处是可以减少多线程并发安全问题,特别适合用于多并发分布式的场景转载 2021-03-28 11:29:27 · 88 阅读 · 0 评论 -
2021-03-28为什么用SCALA语言优势在哪里 Scala适合服务端、大数据、数据挖掘、NLP、图像识别、机器学习、深度学习…等等开发。
Go适合服务端、桌面应用程序开发。Scala适合服务端、大数据、数据挖掘、NLP、图像识别、机器学习、深度学习…等等开发。Python适合做网络爬虫、自动化运维、快速地实现算法的原型。但是Python仍有一些不足之处。Python性能是个问题,而且多线程并发是劣势。Python大型项目,架构和重构是灾难。Python的代码缩进是个坑,当你在使用Python,一小部分代码的修改可能导致你要重新调整整个文件的缩进。Python是动态语言,一些本应该报错的地方没有报错,比如你直接把Js转载 2021-03-28 10:45:35 · 875 阅读 · 0 评论 -
简书 SSH 登录流程分析
https://www.jianshu.com/p/0473f269f4a6结合如下看,有评论说下面的总结可能有问题,可能总结反了,总结的流程原理是有参考意义的SSH公钥登录(私钥认证)原理https://blog.csdn.net/csm201314/article/details/78453579在平时工作中我们经常要远程登录服务器,这就要用到SSH协议:$ ssh user@host主要有两种登录方式:第一种为密码口令登录,第二种为公钥登录密码口令登录 通过密码.转载 2021-03-27 17:12:29 · 189 阅读 · 0 评论 -
namenode需要多大内存
https://www.it610.com/article/1281190829121093632.htm转载 2021-03-24 20:33:45 · 349 阅读 · 0 评论 -
-mkdir 创建目录 Usage:hdfs dfs -mkdir [-p] < paths> 选项:-p 很像Unix mkdir -p,沿路径创建父目录。
1 -mkdir 创建目录 Usage:hdfs dfs -mkdir [-p] < paths> 选项:-p 很像Unix mkdir -p,沿路径创建父目录。1,-mkdir 创建目录 Usage:hdfs dfs -mkdir [-p] < paths> 选项:-p 很像Unix mkdir -p,沿路径创建父目录。2,-ls 查看目录下内容,包括文件名,权限,所有者,大小和修改时间 Usage:hdfs dfs -ls [-R] < args&g..转载 2021-03-23 21:19:36 · 2537 阅读 · 0 评论 -
巴菲特的逻辑数据分析
https://mbd.baidu.com/newspage/data/landingsuper?context=%7B%22nid%22%3A%22news_10314348065701007723%22%7D&n_type=0&p_from=1转载 2021-02-28 22:06:42 · 87 阅读 · 0 评论 -
什么是数据倾斜
https://www.sohu.com/a/224276626_543508转载 2020-12-29 17:49:24 · 129 阅读 · 0 评论 -
linux如何安装VM虚拟机
https://jingyan.baidu.com/article/ff42efa9d45ae7c19e220291.html转载 2020-12-29 16:02:41 · 113 阅读 · 0 评论 -
spark运行NLP
https://www.cnblogs.com/panchuangai/archive/2020/07/21/13356061.html转载 2020-12-28 21:26:16 · 304 阅读 · 0 评论 -
sleep()的误差
https://www.magedu.com/72349.html转载 2020-12-21 16:27:14 · 543 阅读 · 0 评论 -
大数据岗位笔试
https://ks.wjx.top/jq/29096793.aspx转载 2020-12-21 15:49:11 · 235 阅读 · 0 评论