商汤实习自己不知道的点
st实习自己不知道的点
Mar.三月
这个作者很懒,什么都没留下…
展开
-
ST记录
1ubuntu安装gitsudo add-apt-repository ppa:git-core/ppasudo apt update; sudo apt install git检验是否安装成功git version2ubuntu安装git-lfsgit-lfs:git的一个管理工具,用于管理二进制大文件...原创 2019-07-08 08:54:46 · 178 阅读 · 0 评论 -
opencv什么鬼
OpenCV(开源计算机视觉库)是一个开源的BSD许可库,其中包含数百种计算机视觉算法。该文档描述了所谓的OpenCV 2.x API,它本质上是一个C ++ API,与基于C的OpenCV 1.x API相反。OpenCV简介OpenCV 是 Intel 开源计算机视觉库。它由一系列 C 函数和少量 C++ 类构成,实现了图像处理和计算机视觉方面的很多通用算法。OpenCV 拥有包括...转载 2019-07-07 11:48:13 · 585 阅读 · 0 评论 -
spark学习(一)
前沿因算法评测系统使用hadoop,且用spark代替了mapreduce,故习之什么是spark?Spark是UC Berkeley AMP lab开发的一个集群计算的框架,类似于Hadoop,但有很多的区别(详细见3.4)。最大的优化是让计算任务的中间结果可以存储在内存中,不需要每次都写入HDFS,更适用于需要迭代的MapReduce算法场景中,可以获得更好的性能提升。例如一次排序...原创 2019-07-15 12:21:49 · 309 阅读 · 0 评论 -
hadoop学习(二)
hadoop能做什么哦?Hadoop框架允许用户快速地编写和测试的分布式系统。有效并在整个机器和反过来自动分配数据和工作,利用CPU内核的基本平行度。hdfs如何保证高容错的?Hadoop文件系统使用分布式文件系统设计开发。它是运行在普通硬件。不像其他的分布式系统,HDFS是高度容错以及使用低成本的硬件设计。HDFS拥有超大型的数据量,并提供更轻松地访问。为了存储这些庞大的数据,这...原创 2019-07-15 11:33:37 · 130 阅读 · 0 评论 -
hadoop学习(一)
前沿由于算法评测脚本需要hadoop相关知识,故习之为什么hadoop会出现?我们的算法评测系统为什么要使用hadoop?因为目前基于单个服务器的性能已经满足不了大数据存储的要求,因此提出分布式的概念去满足大数据的存储,使得大数据存储在不同的机器上,从而提高性能。分布式文件系统,用来满足大数据的存储,每个数据文件大致在GB以上的级别由于算法评测系统本身会有很大的testda...原创 2019-07-15 11:00:42 · 120 阅读 · 0 评论 -
bash脚本的新技能get
linux下的可执行脚本为.sh,通常我们在开发项目的时候有可能需要书写shell脚本,以避免一系列重复命令的输入下面教大家如何编写shell脚本创建.sh文件touch test.sh使得文件可执行chmod +x test.sh输入文件内容echo "hello world"exit 0执行该文件./test.sh输出如下chmod命令+...原创 2019-07-05 13:50:19 · 309 阅读 · 0 评论 -
yml文件
yaml 语言(或者说是一种规范吧)可以编写 .yml 文件,和 json 一样是配置文件。也许是有人认为 json 的写法不爽,于是乎发明了这玩意。YAML 是专门用来写配置文件的语言,非常简洁和强大,远比 JSON 格式方便。...原创 2019-07-10 12:00:20 · 6494 阅读 · 2 评论 -
lock文件
项目中看到的.lock文件,了解下.lock文件被很多的操作系统和应用程序所使用来锁住某些资源,比如一个文件或者一个设备。典型的一般是没有包含任何数据的一个空的文件,但是可能也包含lock文件的属性和设置。Lock文件表明一个应用程序中某个资源在锁释放之前是不能被应用的。这对那些需要并发访问临界资源的应用程序是十分有用的。对于文件锁,应用程序会创建一个新文件,然后将此文件在原有命名的基础上...原创 2019-07-10 11:55:22 · 9708 阅读 · 0 评论 -
toml
toml是一种配置文件格式,常见的配置文件格式有很多种,toml是我最新见到的,常见的有.ini .json .yaml\yml .xml ,但是toml最为简洁、最为语义化!TOML 是前GitHub CEO, Tom Preston-Werner,于2013年创建的语言,其目标是成为一个小规模的易于使用和阅读的语义化配置文件格式。TOML的目标是成为一个有明显语义而容易去阅读的...原创 2019-07-10 11:49:56 · 1716 阅读 · 0 评论 -
长知识了.hpp
之前学习c++,就知道.h .cpp现在尽了新的公司,并不知道.hpp是个什么鬼,哈哈哈.h .hpp .cpp(顾名思义).hpp,本质就是将.cpp的实现代码混入.h头文件当中,定义与实现都包含在同一文件,则该类的调用者只需要include该.hpp文件即可,无需再将cpp加入到project中进行编译。而实现代码将直接编译到调用者的obj文件中,不再生成单独的obj,采用...原创 2019-07-09 19:34:03 · 1182 阅读 · 3 评论 -
关于spark
由于重构的算法评测系统使用到了spark,因此了解下spark干啥的1. Spark概述1. 什么是Spark?Spark作为Apache顶级的开源项目,是一个快速、通用的大规模数据处理引擎,和Hadoop的MapReduce计算框架类似,但是相对于MapReduce,Spark凭借其可伸缩、基于内存计算等特点,以及可以直接读写Hadoop上任何格式数据的优势,进行批处理时更加高效,并有更低...转载 2019-07-09 13:46:36 · 202 阅读 · 0 评论 -
ubuntu截屏&查找文件
最近尽了新的公司,配的系统是ubuntu,截图工具也很不错,系统的截图工具就够用吧1选择截图shif+fn+print screen =截图如果想将截图直接保存到复制板上,则shif+fn+print screen+ctrl2全屏截图fn+print screen3查找文件find / -name 文件名locate 文件名...原创 2019-07-03 09:05:36 · 185 阅读 · 0 评论 -
什么是机器学习中的 训练数据、算法、模型 ?
一句话总结:通过算法 去 引导模型去训练数据,最终使得模型可用,该模型的训练数据的过程就是机器学习的过程一直以来总感觉手写体识别并不适合作为机器学习开篇的基础认知讲解。终究觉得它还不够那么的直观和形象的解释清楚机器学的过程和数据、算法以及模型之间的关系。引出一个象形直白简单的例子教大家如何区分数据、算法、模型之间的关系。希望能够帮到初学者。相比于一上来就去...转载 2019-07-17 11:17:42 · 9590 阅读 · 0 评论