神之凝视
码龄10年
关注
提问 私信
  • 博客:283,690
    283,690
    总访问量
  • 137
    原创
  • 667,897
    排名
  • 22
    粉丝
  • 0
    铁粉
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:河南省
  • 加入CSDN时间: 2015-04-21
博客简介:

踏雪无痕

博客描述:
自律是你超越他人使自己变的重要的前提!
查看详细资料
个人成就
  • 获得58次点赞
  • 内容获得49次评论
  • 获得340次收藏
  • 代码片获得707次分享
创作历程
  • 122篇
    2020年
  • 20篇
    2018年
成就勋章
TA的专栏
  • 大数据
    74篇
  • 性能调优
    3篇
  • 数据库
    1篇
  • 系统架构师
    11篇
  • 国学
    2篇
  • 操作系统
    8篇
  • 计算机组成原理
    1篇
  • Scala
    2篇
  • 人性的弱点
    2篇
  • 机器学习
    9篇
  • 图计算
    3篇
  • 卷积神经网络
    1篇
  • TensorFlow
    2篇
  • 编程语言
    1篇
  • HBase
    3篇
  • Github
    5篇
  • Git
    3篇
  • Flink
    28篇
  • Spark
    46篇
  • 搜索引擎
    5篇
  • 微信小程序
    9篇
  • 流计算
    41篇
  • 结构化流
    4篇
  • Kafka
    12篇
  • uni-app
    7篇
  • Vue
    14篇
  • Solr
    9篇
  • weblogic
    2篇
  • tomcat
    2篇
  • sql
    7篇
  • Linux
    3篇
  • Python
    4篇
  • 可视化
    6篇
兴趣领域 设置
  • 人工智能
    机器学习深度学习神经网络自然语言处理tensorflownlp数据分析
创作活动更多

超级创作者激励计划

万元现金补贴,高额收益分成,专属VIP内容创作者流量扶持,等你加入!

去参加
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

NumPy基础:数组和矢量计算

一.ndarrayNumPy最重要的一个特点就是其N维数组对象ndarray,该对象是一个快速而灵活的大数据集容器。可以利用这个数组对整块数据执行一些数学运算,其语法跟标量元素之间的运算一样:ndarray是一个通用的同构数据多维容器,也就是说,其中的所有元素必须是相同类型的。每个数组都有一个shape【表示各维度大小的元组】和一个dtype【用于说明数组数据类型的对象】:二.创建ndarray创建数组最简单的办法就是使用array函数。它接受一切序列型的对象,然后产生一个新的含有传入数据的Nu
原创
发布博客 2020.11.18 ·
462 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Flink高级特性之检查点

一.概述Flink中的每个函数和运算符都可以是有状态的。有状态功能在处理单个元素/事件的过程中存储数据,使状态成为任何类型的更复杂操作的关键构建块。为了使状态容错,Flink需要检查点状态。检查点允许Flink恢复流中的状态和位置,从而为应用程序提供与无故障执行相同的语义。二.先决条件Flink的检查点机制与流和状态的持久存储交互。通常,它要求:持久(或耐用,可以重放某个时间段内一定量的记录)的数据源。此类消息源是持久消息队列(例如,Apache Kafka,RabbitMQ,Amazon Ki
原创
发布博客 2020.11.12 ·
878 阅读 ·
1 点赞 ·
0 评论 ·
2 收藏

Spark SQL常用配置及性能优化

一.在内存中缓存数据Spark SQL可以通过调用spark.catalog.cacheTable(“tableName”)或使用dataFrame.cache()内存列式格式缓存表。然后,Spark SQL将仅扫描所需的列,并将自动调整压缩以最大程度地减少内存使用和GC压力。可以调用spark.catalog.uncacheTable(“tableName”)从内存中删除表或dataFrame.unCache()取消缓存。可以在SparkSession上使用setConf方法或使用SQL运行SET k
原创
发布博客 2020.10.24 ·
2917 阅读 ·
0 点赞 ·
0 评论 ·
10 收藏

系统架构师【数据库系统:数据库模式与范式】

一.数据库管理系统的类型当前,许多商业DBMS中所用的主要数据模型仍是关系型数据模型。有些商业系统中实现了对象数据模型,但未得到广泛使用。近几年随着NoSQL技术的兴起,也产生了一些新的数据模型。目前常见的DBMS按数据模型划分,包括:关系型、文档型、键值型、对象型等等。二.数据库的结构与模式数据库技术中采用分级的方法将数据库划分为多个层次。最著名的是美国ANSI/SPARC数据库系统研究组1975年提出的三级划分法,如下:数据库系统划分为三个抽象级别:用户级、概念级、物理级。用户级数据库。用
原创
发布博客 2020.10.20 ·
477 阅读 ·
0 点赞 ·
2 评论 ·
0 收藏

“中国”一词的由来

“中国”一词最早出现在《诗经》中。如《大雅·民芳》载:“惠此中国”。但《诗经》中的中国实算不得是真正指称国家的“中国”。作为指称国家的“中国”一词,在战国诸之百家书中已屡见不鲜。如《孟子·滕文公上》云:“陈良、楚产地,悦周公仲尼之道,北学于中国”,又“兽蹄鸟迹之道,交于中国。”《庄子·田子方》云:“中国之君子,明乎礼仪而陋于知人心。”这些都说明上古之所谓“中国”者,皆指后世之“中原”也。但又有不同于“中原”的地方,即地域不及后世中原之广,而相当于今山西、山东、河南、河北一带。这一带地区被四周分布的夷、翟
原创
发布博客 2020.10.20 ·
358 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

系统架构师【操作系统:作业管理】

一.简介从用户的角度看,作业是系统为完成一个用户的计算任务【或一次事务处理】所做的工作总和。例如,对于用户编写的源程序,需要经过对源程序的编译、连接编译或连接装入及运行产生计算结果。这其中的每一个步骤,常称为作业步,作业步的顺序执行即完成了一个作业。从系统的角度看,作业则是一个比程序更广泛的概念。它由程序、数据和作业说明书组成。系统通过作业说明书控制文件形式的程序和数据,使之执行和操作。而且,在批处理系统中,作业是占据内存的基本单位。用户的作业可以通过直接的方式,由用户自己按照作业步顺序操作;也可以通
原创
发布博客 2020.10.20 ·
313 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

国学【书法技巧】

一.横画横画在字中起平衡作用,横不平则字不稳。但由于人的视觉习惯,一般写成左低右高之势,这样看起来才显得平稳。起笔稍顿,向右上方行笔,顿笔而收。二.竖画竖画宜写垂直,于字中往往起着关键的支撑作用。需劲挺有力。一般分垂露、悬针两种形式。起笔向右下方顿笔,由种到轻顺势而行,多数竖画写得较长。三.撇画撇画变化较丰富,有斜撇、竖撇、平撇、短撇等。撇有一定弧度,但不可过弯,否则无力,且撇画末端多为出尖,向右稍顿回笔往左下行,由重至轻快速出锋。四.捺画捺画转折微妙,有一波三折之姿。一般为整字的主笔,宜书写
原创
发布博客 2020.10.18 ·
310 阅读 ·
0 点赞 ·
2 评论 ·
0 收藏

Flink之广播状态模式

一.提供的API为了展示所提供的API,我们将以一个示例开始,然后介绍其完整功能。作为正在运行的示例,我们将使用这样的情况,其中有一系列不同颜色和形状的对象,并且我们希望找到遵循某种模式的相同颜色的对象对,例如矩形后跟三角形。我们假设这组有趣的模式会随着时间而演变。在此示例中,第一个流将包含Item带有Color和Shape属性的type元素。另一个流将包含Rules。从流开始Items,我们只需要键入它的Color,因为我们要对相同颜色的。这将确保相同颜色的元素最终出现在同一台物理计算机上。//
原创
发布博客 2020.10.15 ·
2034 阅读 ·
0 点赞 ·
0 评论 ·
5 收藏

系统架构师【操作系统:文件管理】

一.简介操作系统对计算机的管理包括两个方面:硬件资源和软件资源。硬件资源的管理包括CPU管理、存储器管理、设备管理等,主要解决硬件资源的有效和合理利用问题。软件资源包括各种系统程序、各种应用程序、各种用户程序,也包括大量的文档材料、库函数等。每一种软件资源本身都是具有一定逻辑意义的相关信息的集合,在操作系统中它们以文件形式存储。计算机系统的重要作用之一是能快速处理大量信息,因此数据的组织、存取和保护成为一个极重要的内容。文件系统是操作系统中组织、存取和保护数据的一个重要部分。文件管理功能包括:建立、
原创
发布博客 2020.10.14 ·
434 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

系统架构师【操作系统:设备管理】

一.简介在计算机系统中,除了处理器和内存外,其他大部分硬件设备统称为外部设备。它包括输入/输出设备,辅存设备及终端设备等。这些设备种类繁多,特性各异,操作方式的差异很大,从而使操作系统的设备管理变得十分复杂。二.数据传输控制方式设备管理的主要任务之一是控制设备和内存或CPU之间的数据传输。选择和衡量控制方式的原则如下:数据传输速度足够快,能满足用户的需要且不丢失数据。系统开销小,所需的处理控制程序少。能充分发挥硬件资源的能力,使得I/O设备尽量处于使用状态中,而CPU等待时间少。外围设备和
原创
发布博客 2020.10.13 ·
348 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

系统架构师【操作系统:存储管理】

一.简介存储器是计算机系统中最重要的资源之一。因为任何程序和数据以及各种控制用的数据结构都必须占有一定的存储空间,因此,存储管理直接影响系统性能。存储器由内存和外存组成。内存是由系统实际提供的存储单元组成的一个连续地址空间,处理器可直接存取。外存是指软盘、硬盘、光盘或磁带等一些外部存储部件,常用来存放暂时不执行的程序和数据。处理器不能直接访问外存,需通过启动I/O设备才能进行内存、外存交换,其访问速度慢,但价格便宜。常用作内存的后援设备。内存大小由系统硬件决定,存储容量受到实际存储单元的限制。虚拟存储
原创
发布博客 2020.10.12 ·
363 阅读 ·
0 点赞 ·
1 评论 ·
1 收藏

Spark Streaming整合检查点与累加器/广播变量

一.简介无法从Spark Streaming中的检查点恢复累加器和广播变量。如果启用检查点并同时使用“ 累加器”或“广播变量” ,则必须为“累加器”和“广播变量”创建延迟实例化的单例实例, 以便在驱动程序发生故障重新启动后可以重新实例化它们。二.代码实现package org.apache.spark.examples.streamingimport java.io.Fileimport java.nio.charset.Charsetimport com.google.common.io.
原创
发布博客 2020.10.09 ·
230 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

系统架构师【操作系统:进程管理】

一.处理机管理处理机是计算机系统的核心资源。操作系统的功能之一就是处理机管理。随着计算机的迅速发展,处理机管理显得尤为重要。这主要由于计算机的速度越来越快,处理机的充分利用有利于系统效率的整体提升;处理机管理是整个操作系统的重心所在,其管理的好坏直接影响到整个系统的运行效率;而且操作系统中并发活动的管理和控制是在处理机管理下实现的,处理机管理集中了操作系统中最复杂的部分,它设计的好坏关系到整个系统的成败。二.进程进程是处理机管理中最基本、最重要的概念。进程是系统并发执行的体现。由于在多程序系统中,众多
原创
发布博客 2020.10.07 ·
634 阅读 ·
0 点赞 ·
1 评论 ·
1 收藏

系统架构师【操作系统的类型与结构】

一.概述计算机系统由硬件和软件两部分组成。操作系统是计算机系统中最基本的系统软件 ,它既管理计算机系统的软、硬件资源,又控制程序的执行。操作系统随着计算机研究和应用的发展逐步形成并日趋完善,它为用户使用计算机提供了一个良好的环境,从而使用户能充分利用计算机资源,提高系统的效率。操作系统的基本类型有:批处理操作系统、分时操作系统和实时操作系统。从资源管理的角度看,操作系统主要是对处理器、存储器、文件、设备和作业进行管理。二.操作系统的定义操作系统OS是计算机系统中的核心系统软件,负责管理和控制计算
原创
发布博客 2020.10.07 ·
327 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

系统架构师【操作系统:流水线】

一.简介流水线技术把一个任务分解为若干顺序执行的字任务,不同的子任务由不同的执行机构负责执行,而这些机构可以同时并行工作,任一任务只占用其中一个执行机构,这样就可以实现多个任务的重叠执行,以提高工作效率。二.流水线周期流水线应用过程中,会将需要处理的工作分为N各阶段,最耗时的那一段所消耗的时间为流水线周期。如:使用流水线技术执行100条指令,每条指令取址2ms,分析4ms,执行1ms,则流水周期为4ms。三.计算流水线执行时间延续上面的场景,将一个任务的执行过程可分为N各阶段,假设每个阶段完成时间
原创
发布博客 2020.10.01 ·
877 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

人性的弱点【我要喜欢你】

外交的秘诀仅在5个字:我要喜欢你。只是我们把次序弄错了——我们是希望别人先来喜欢我们,却不曾想到如何才能让人喜欢。当然,为了得到友谊和情爱,我们必须先认清“施比受更有福”,然后把这种认知用实际行为表现出来。我们不能只是把金矿藏在心里,黄金必须使用才能显示其价值,像《圣经》所说的:“由所结的果实,便可认出它们来”。我常听到许多人埋怨:“我性情过于羞怯,很难引起别人的注意”,“没有人会对我感兴趣”,或是“别人并不想认识我”等等。不错,别人为什么要喜欢你呢?这世界并没有义务非要喜欢你或我,或任何一个人.
原创
发布博客 2020.09.26 ·
738 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏

系统架构师【存储器系统】

一.概述存储器是用来存放程序和数据的部件,它是一个记忆装置,也是计算机能够实现“存储程序控制”的基础。在计算机系统中,规模较大的存储器往往分为若干级,称为存储器系统。传统的存储器系统一般分为高速缓冲存储器、主存、辅存三级。主存可由CPU直接访问,存取速度快,但容量较低,一般用来存放当前正在执行的程序和数据。辅存设置在主机外部,它的存储容量大,价格较低,但存取速度较慢,一般用来存放暂时不参与运行的程序和数据,CPU不可以直接访问辅存,辅存中的程序和数据在需要时才传送到主存,因此它是主存的补充和后援。当CP
原创
发布博客 2020.09.24 ·
698 阅读 ·
0 点赞 ·
1 评论 ·
3 收藏

系统架构师【计算机系统组成】

一.计算机系统组成计算机系统是一个硬件和软件的综合体,可以把它看成按功能划分的多级层次结构。1.计算机硬件的组成硬件通常是指一切看得见,摸得着的设备实体。原始的冯诺依曼计算机在结构上是以运算器为中心的,二发展到现在,已转向以存储器为中心了。如下图:控制器。控制器是分析和执行指令的部件,也是统一指挥并控制计算机各部件协调工作的中心部件,所依存的是机器指令。控制器的组成包含如下:程序计数器PC:存储下一条要执行指令的地址。指令寄存器IR:存储即将执行的指令。指令译码器ID:对指令中的操作码字段
原创
发布博客 2020.09.18 ·
487 阅读 ·
1 点赞 ·
0 评论 ·
1 收藏

系统架构师考试大纲

2020年计算机软考系统架构设计师考试大纲一.考试目标考试合格人员应能够根据系统需求规格说明书,结合应用领域和技术发展的实际情况,考虑有关约束条件,设计正确、合理的软件架构,确保系统架构具有良好的特性;能够对项目睥系统架构进行描述、分析、设计与评估;能够按照相关标准编写相应的设计文档;能够与系统分析师、项目管理师相互协作、配合工作;具有高级工程师的实际工作能力和业务水平。二.考试要求(1)掌握计算机硬软件与网络的基础知识;(2)熟悉信息系统开发过程;(3)理解信息系统开发标准...
原创
发布博客 2020.09.18 ·
2043 阅读 ·
0 点赞 ·
2 评论 ·
2 收藏

TF-IDF词频逆文档频率算法

TF-IDF词频逆文档频率(TF-IDF) 是一种特征向量化方法,广泛用于文本挖掘中,以反映术语对语料库中文档的重要性。用t表示术语,用d表示文档,用D表示语料库。TF(t,d) 表示术语频率是术语在文档中出现的次数,而DF(t,D)文档频率是包含术语的文档在语料库中出现的次数。如果我们仅使用术语频率来衡量重要性,那么很容易过分强调那些经常出现但几乎不包含有关文档信息的术语,例如“a”,“the”和“of”。如果术语经常出现在整个语料库中,则表示该术语不包含有关特定文档的特殊信息。逆文档频率度量的是一个术
原创
发布博客 2020.09.17 ·
3077 阅读 ·
3 点赞 ·
0 评论 ·
11 收藏
加载更多