请叫我算术嘉
码龄9年
关注
提问 私信
  • 博客:3,830,271
    社区:266
    动态:5
    3,830,542
    总访问量
  • 385
    原创
  • 20,743
    排名
  • 388
    粉丝
  • 1
    铁粉
  • 学习成就

个人简介:快手HDFS

IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:北京市
  • 加入CSDN时间: 2016-05-08
博客简介:

ssjdoudou的博客

查看详细资料
  • 原力等级
    成就
    当前等级
    5
    当前总分
    1,903
    当月
    3
个人成就
  • 获得623次点赞
  • 内容获得235次评论
  • 获得2,445次收藏
  • 代码片获得4,804次分享
创作历程
  • 2篇
    2024年
  • 8篇
    2022年
  • 23篇
    2021年
  • 177篇
    2020年
  • 101篇
    2019年
  • 77篇
    2018年
成就勋章
TA的专栏
  • HDFS
    11篇
  • Hadoop
    11篇
  • Vue.js
    28篇
  • C++
    2篇
  • Tensorflow
    7篇
  • Attention
    3篇
  • Jenkins
    1篇
  • Spring MVC
    1篇
  • zookeeper
    1篇
  • Redis
    1篇
  • C#
    6篇
  • ASP.NET Core
    4篇
  • JavaScript
    3篇
  • Postman
    1篇
  • Sql Server
    1篇
  • Node.js
    2篇
  • CKEditor
    2篇
  • NLP
    2篇
  • ASP.NET
    3篇
  • 时间序列预测论文阅读
    1篇
  • CSRF
    1篇
  • Tornado
    2篇
  • LSTM
    3篇
  • Pytorch
    6篇
  • Echarts
    2篇
  • 算法
    1篇
  • uWSGI
    1篇
  • TCP
    1篇
  • Scrapy
    1篇
  • Servlet
    1篇
  • jsp
    1篇
  • Tomcat
    1篇
  • CentOS
    1篇
  • VPN
  • Git
    3篇
  • GitHub
    1篇
  • streamlit
    1篇
  • ActiveMQ
    1篇
  • Pandas
  • Linux
  • Screen
    1篇
  • SVN
    1篇
  • Hexo
    1篇
  • Influxdb
    1篇
  • Grafana
    1篇
  • django-haystack
    1篇
  • Fbprophet
  • HTTPS
    1篇
  • SSL
    1篇
  • Anaconda
    2篇
  • PE8
    1篇
  • Django
    59篇
  • 机器学习
    8篇
  • leetcode
    83篇
  • collectd
    2篇
  • python
    119篇
  • pylab
    1篇
  • urllib
    2篇
  • 爬虫
    3篇
  • Reveal.js
    1篇
  • 前端
    4篇
  • numpy
    1篇
  • java
    77篇
  • 杂记
    1篇
  • 排序
    2篇
  • mac下brew安装
    1篇
  • mac下tesseract安装
    1篇
  • tesseract
    1篇
  • PIL
    1篇
  • Image
    1篇
  • ImageEnhance
    1篇
  • selenium
    3篇
  • 翻译
    2篇
  • jieba
    3篇
  • robotframework
    1篇
  • Pycharm
    5篇
  • gooletrans
    1篇
  • py_translator
    1篇
  • VS Code
    2篇
  • Docker
    2篇
  • Gitlab
    1篇
  • 腾讯云
    5篇
  • SweetAlert2
    3篇
  • springboot
    11篇
  • Mysql
    9篇
  • 微信小程序
    1篇
  • MacTeX
    1篇
  • viewer.js
  • Flask
    8篇
兴趣领域 设置
  • 数据结构与算法
    推荐算法
  • 人工智能
    tensorflowpytorch
创作活动更多

AI大模型如何赋能电商行业,引领变革?

如何使用AI技术实现购物推荐、会员分类、商品定价等方面的创新应用?如何运用AI技术提高电商平台的销售效率和用户体验呢?欢迎分享您的看法

186人参与 去创作
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

Hadoop 客户端 FileSystem加载过程

hadoop-hdfs-project/hadoop-hdfs/src/main/resources/META-INF/services,可以看到,这个目录下有一个org.apache.hadoop.fs.FileSystem文件。一般我们会这么使用,那么问题来了,FileSystem是个抽象类,我们到底用哪一个呢?通过 loadFileSystems这个方法会加载文件中的所有类,并且根据scheme生成一个map,key是scheme,value是fs。2、如果配置里没有,这个时候用加载的。
原创
发布博客 2024.05.23 ·
651 阅读 ·
8 点赞 ·
1 评论 ·
7 收藏

HDFS源码解析---写数据流程

1、写入(create)创建DFSOutputStream,启动DataStreamer线程run (主线程)2、createBlockOutputStream (client -> dn1 -> dn2 -> dn3)启动blockStream(实际用来写数据)4、new ResponseProcessor 并启动线程run5、按照packet粒度发送 packet 到datanodeb、DataStreamer run方法不断从dataQueue队列take出来发送。
原创
发布博客 2024.02.23 ·
1100 阅读 ·
21 点赞 ·
1 评论 ·
20 收藏

HDFS源码解析---NetworkTopology

NetwordTopology
原创
发布博客 2022.08.03 ·
1139 阅读 ·
1 点赞 ·
1 评论 ·
3 收藏

HDFS源码解析---HA

HDFS 2.X HA 模式下的数据同步机制
原创
发布博客 2022.07.07 ·
615 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

HDFS源码解析---checksum数据校验

客户端获取文件的checksum整体流程如下:1、获取文件的所有block2、遍历每个block3、获取block的所有副本以及所在的datanode,去datanode上获取这个block的checksum4、获取每个block的checksum的byte-per-checksum,crc-per-block(block的crc)以及MD55、根据所有block的MD5计算文件的MD56、文件的MD5 + bytesPerCRC + crcPerBlock 计算MD5FileC
原创
发布博客 2022.03.28 ·
1779 阅读 ·
0 点赞 ·
1 评论 ·
2 收藏

HDFS源码解析---读数据流程

打开文件1、DistributedFileSystem.open返回FSDataInputStream输入流 public FSDataInputStream open(Path f) throws IOException { return open(f, getConf().getInt("io.file.buffer.size", 4096)); }2、调用DFSClient.open,返回DFSInputStream @Override public F..
原创
发布博客 2022.03.22 ·
766 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

基于java swing的学生学籍管理系统

原作githubGitHub - xuexuehan/scmis: Java Swing学籍管理系统Java Swing学籍管理系统. Contribute to xuexuehan/scmis development by creating an account on GitHub.https://github.com/xuexuehan/scmis改进了一下,主要实现了学生学籍的增删改查功能 新建了一张学生学籍表 重写了查询功能 去掉了其他菜单 ps:如果上面的运行代码提示java.lan.
原创
发布博客 2022.03.06 ·
758 阅读 ·
0 点赞 ·
0 评论 ·
8 收藏

Vue 封装 Axios 插件

新建一个request.jsimport axios from 'axios' //引入 axiosimport baseUrl from '../api/baseUrl'// 创建 axios 实例const service = axios.create({ baseURL: baseUrl, // api 的 base_url timeout: 15000, // 请求超时时间});// 添加请求拦截器service.interceptors.req
原创
发布博客 2022.02.27 ·
2850 阅读 ·
2 点赞 ·
0 评论 ·
1 收藏

HDFS源码解析---replaceBlock

前言replaceBlock 这个rpc 在社区版是只有在Balancer中才用到/** * It is used in Balancer and Mover, and it always internal operation. */ @Override public void replaceBlock(final ExtendedBlock block, final StorageType storageType, final Token<Block
原创
发布博客 2022.02.18 ·
575 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Django个人博客搭建教程---基于dwebsocket的实时日志系统

requirementDjango==2.1.7paramiko==2.7.1dwebsocket==0.5.12dwebsocket的配置与HTTPS部署安装uwsgipip install uwsgiuwsgi.ini[uwsgi] chdir = /home/MyBlog module = MyBlog.wsgi:application socket = 127.0.0.1:8000master = true processes = 1threads =
原创
发布博客 2022.02.04 ·
18048 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

HDFS源码解析---TestDFSIO

这个工具怎么用没啥好说的,里面的原理简单说一下。MapReduce 这个工具会起mapreduce 任务在yarn的各个节点(客户端)发起读写请求。TestDFSIO.java的run方法会调用mapreduce作业任务。@Override // Tool public int run(String[] args) throws IOException { TestType testType = null; int buff...
原创
发布博客 2021.12.09 ·
15465 阅读 ·
1 点赞 ·
0 评论 ·
3 收藏

C++中使用new占住固定内存

main.cpp#include <cstdlib>#include <iostream>int64_t total = int64_t(128) * 1024 * 1024 * 1024;char * p;int main() { while (total) { // 一次申请500M size_t batch = 1024 * 1024 * 500; batch = batch > total ? total : batch;
原创
发布博客 2021.11.10 ·
24940 阅读 ·
1 点赞 ·
0 评论 ·
2 收藏

HDFS源码解析---triggerBlockReport

当前有两种方式出发全量块汇报通过命令行 通过hdfs.site.xml参数控制全量块汇报的代码datanode---BPServiceActor/** * Report the list blocks to the Namenode * @return DatanodeCommands returned by the NN. May be null. * @throws IOException */List<DatanodeCommand> block
原创
发布博客 2021.11.02 ·
27194 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

HDFS源码解析---DataTransferThrottler(流量控制)

简介DataTransferThrottler类别Datanode读取和写入数据时控制传输数据速率。这个类是线程安全的,它可以由多个线程共享。用途是构建DataTransferThrottler对象,并设置期限period和带宽bandwidthPerSec,际读写前调用DataTransferThrottler.throttle()方法。假设I/O的速率相对给定的带宽太快,则该方法会将当前线程wait。构造函数双參构造函数,能够设置周期period和带宽ba...
原创
发布博客 2021.08.31 ·
340 阅读 ·
0 点赞 ·
0 评论 ·
2 收藏

HDFS源码解析---数据块

Block、Replica、BlocksMapBlock类Block类用来唯一标识Namenode中的数据块,是HDFS数据块最基本的抽象接口。Block类实现了Writable接口,可以进行序列化。Block类还实现了Comparable接口,按照blockid大小排序。 Block类定义了三个字段。blockId(唯一标识了这个block对象) numBytes(数据块大小,单位是字节) generateStamp(数据块的时间戳)private...
原创
发布博客 2021.08.27 ·
438 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

HDFS源码解析---Balancer

HDFS Balancer概述在输入启动命令的那台机器上会启动一个进程,为了避免给namenode带来过大的负担,整个balance过程由balance server而不是namenode来控制。Balancer的最终结果是namenode上记录的一个block的一个副本从一个datanode转移到另一个datanode上。PS:副本放置策略 第 2 个副本存放于不同于第 1 个副本所在的机架 第 3 个副本存放于第2个副本所在的机架,但 是属于不同的节点 .
原创
发布博客 2021.08.25 ·
4550 阅读 ·
0 点赞 ·
0 评论 ·
5 收藏

v4.0-JavaGuide面试突击版.pdf

发布资源 2021.08.24 ·
pdf

nasdaq100_padding.csv

发布资源 2021.08.23 ·
csv

Erasure Codes for Storage Applications

发布资源 2021.08.20 ·
pdf

HDFS源码解析---Decommission

HDFS DecommissionintroductionDecommissionManager管理数据节点停用。 后台监控线程定期检查正在进行停用的数据节点的状态。源码分析/** * Manage node decommissioning. * 节点Decommission操作状态管理器 */class DecommissionManager { static final Log LOG = LogFactory.getLog(DecommissionManager..
原创
发布博客 2021.08.17 ·
30331 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏
加载更多