- 博客(13)
- 资源 (3)
- 收藏
- 关注
原创 java自学总结
1. 面向对象和面向过程的区别面向过程:面向过程性能比面向对象高。因为类调用时需要实例化,开销比较大,比较消耗资源,所以当性能是最重要的考量因素的时候,比如单片机、嵌入式开发、Linux/Unix 等一般采用面向过程开发。但是,面向过程没有面向对象易维护、易复用、易扩展。 面向对象:面向对象易维护、易复用、易扩展。因为面向对象有封装、继承、多态性的特性,所以可以设计出低耦合的系统,使...
2020-04-25 12:23:55 398 2
原创 spark streaming
概述Spark Streaming类似于Apache Storm,用于流式数据的处理。根据其官方文档介绍,Spark Streaming有高吞吐量和容错能力强等特点。(https://spark.apache.org/streaming/) Spark Streaming支持的数据输入源很多,例如:Kafka、Flume、Twitter、ZeroMQ和简单的TCP套接字等等。...
2020-04-13 10:19:23 136
原创 MapReduce编程规范-wordcount实战 && hadoop序列化例子
一、程序分为3部分:Mapper,Reducer,Driver通过java实现map_reduce版本的word_count例子1、Mapper阶段(1)用户自定义的Mapper要继承 org.apache.hadoop.mapreduce.Mapper类(2)Mapper的输入数据是KV对的形式(3)Mapper中的业务逻辑在map()方法中实现(4)Mapper的输出数...
2019-11-09 11:14:37 239
原创 百面机器学习读书笔记-第一章
数值型特征归一化Q:为什么需要对数值类型的特征做归一化?A:对数值类型的特征做归一化可以将所有的特征都统一到一个大致相同的数值区间内。常用的归一化方法(1)线性归一化(min-max)(2)零均值归一化(z-score) z=(x-均值)/标准差注:在实际应用中,通过梯度下降法求解的模型通常是需要归一化的,包括线性回归,逻辑回归,支持向量机,神经网络等类别型特征类别型...
2019-06-15 10:30:49 167
原创 linux从本地上传文件夹到gitlab
1.在本地运行ssh-keygen -t rsa -C "your.email@example.com" -b 4096生成SSH.2.cat ~/.ssh/id_rsa.pub 复制里面的内容;之后去Gitlab项目页面,右上角->用户->Settings->左边SSH Keys将cat里面的内容粘贴到这个文本框里3.git clone git@gi...
2019-05-10 11:55:44 3167 1
翻译 torch学习-训练分类器
数据:当我们需要处理图片,文档,音频或者视频数据时,可以使用python的包将数据加载到numpy数组。然后将numpy 数组转换成torch.*Tensor对于图片,Pillow,OpenCV对于音频,scipy和librosa对于文本数据,基于Python或Cython加载,或者借助于NLTK和SpaCy包对于计算机视觉,官方创建了一个torchvision包,这里包含了对于常见数据集(如Im...
2018-04-30 11:08:53 928
原创 pytroch学习-神经网络
用torch.nn包构建神经网络之前已经了解到了autograd,nn依赖于autograd来定义模型并进行求微分操作。nn.Module包含神经网络的各个层,方法forward(input) 返回 output例如,观察下面用于分类手写识别数据的网络:这是一个典型的前馈神经网络。它接受输入数据,将它逐层喂给网络,最后输出。一个神经网络的训练过程如下:定义具有若干可学习参数(权重)的神经网络结构。...
2018-04-30 09:46:49 938
原创 autograd自动求导机制
本文是对http://pytorch.org/tutorials/beginner/blitz/autograd_tutorial.html的部分翻译以及自己理解的部分,如有错误,欢迎指正。对于pytorch中的所有神经网络(nn)而言最重要的是autograd包。对tensor的所有运算autograd包提供了自动求导机制。它遵循了按定义运行的框架,即你的代码如何运行定义了你的反向传播。下面是具...
2018-04-27 10:05:39 3488 1
翻译 windows系统BleiCorpus 数据集加载出错
机器学习系统设计,第四章主题模型的部分,当需要从gensim加载BleiCorpus数据集时,会出现io错误。大家可以到http://www.cs.princeton.edu/~blei/lda-c/ap.tgz下载ap数据,之后放在指定目录下就可以啦~
2016-10-23 16:23:47 363
算法导论课后答案
2016-10-18
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人