自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

课桌

【知乎】https://www.zhihu.com/people/wang-kang-84-84/activities

原创 对于概率论数字特征的理解

数字特征概述 随机变量 常见数字特征 数学期望均值 方差 标准差 协方差 相关系数 协方差矩阵 参考数字特征概述  在我们学习概率论的时候,很多时候我们不能深刻理解概率论中的数字特征所具有的含义,本文章尝试去帮助读者理解一些术语、概念。      什么是数字特征?要回答这个问题,先得弄清楚什么...

2017-04-07 15:47:39 16377 6

原创 机器学习总结

学习路线图 理论 数据预处理 聚类 技术 methods models 范式 特征 应用 相关文章 矩阵理解 工具 numpy scikit-learn scipy matplotlib学习路线图先来看个学习框架图: 下图说明了如何选择模型? 理论数据预处理统计数据归一化与标准化 标准化...

2017-03-04 15:39:37 884 0

原创 科研索引

查看会议日期 方法论 题目 实验设计 论文写作 署名 introduction 结果 结论 相关工作部分 致谢 审稿 数学 工具 Latex 语法检查 数据 细节 关注的博客 学术期刊 中文 最新进展 编程方面查看会议日期wikiCFP 中国会议在线方法论【科学网】跟诺奖得主学做科研 【研...

2017-02-20 11:33:57 654 0

原创 爬虫文章索引

入门如何入门爬虫? 【知乎,全面】零基础如何学爬虫技术?实战[Python爬虫] Selenium爬取新浪微博移动端热点话题及评论 (下) 细节【知乎】爬虫怎么解决封IP?爬虫配置python selenium环境配置Firefox和Chrome 【驱动】firefox驱动下载地址(方便在程...

2017-02-19 09:43:47 953 0

原创 python相关文章导引

python 总述 python运算 python 数据结构 列表 元组 字典 字符串 异常处理 文件操作 细节 排序 数据库操作 异常 语法细节 常见库的使用 time loggingpython 总述Python基础教程(基础,忽略一些细节) 【中文】Python语言参考(语法等) 【中文...

2017-02-17 23:09:02 839 0

原创 文本处理总结

理论基础 LDA原理介绍 LDA评价 文本预处理 总体流程 字符串处理 相关的工具 自然语言工具 NLTK工具 Gensim 相似性 代码示例 情感分析 理论 工具 - TextBlob理论基础【算法与数学】阮一峰的网络日志 TF-IDF与余弦相似性的应用(一):自动提取关键词 TF-IDF与余弦...

2017-02-16 20:39:24 1190 0

原创 算法思想及数据结构 -- 总结

数学数据结构算法 程序的设计过程 算法思想 动态规划 线性规划 数据结构 树 最近公共祖先Lowest Common Ancestor 网上经验数学,数据结构,算法 【王boy】学习数据结构有什么用? 【王boy】递推与递归的区别?程序的设计过程算法思想动态规划什么是动态规划?动态规划的意义...

2017-01-25 12:20:49 1033 0

原创 【数据库学习笔记】数据库事务处理技术 - 并发控制

文章目录概述为什么要进行并发控制三种典型的不一致引入并发控制什么是事务事务的基本概念事务的宏观特性(程序员眼中的事务)事务的微观特性(DBMS看到的事务)事务的特性【TODO:深入阐释】事务的特性: ACIDDBMS对事务的控制事务调度与可串行性 概述 为什么要进行并发控制 并发意味着多个流程,...

2019-07-06 13:09:55 618 1

原创 【学习笔记】数据库基础 - 查询优化

文章目录什么是数据库查询优化?影响查询优化的因素优化策略概述查询优化的总体思路语义优化 -- 内容等价性语法优化(逻辑层优化)---语法等价性执行优化(物理层优化)查询优化在DBMS中的位置逻辑查询优化关系代数优化示例关系代数操作次序交换的等价性明确定义关系代数的等价性等价定理基于关系代数的查询优...

2019-03-30 09:13:38 284 0

原创 【学习笔记】数据库基础 - 数据库查询算法(一趟)

文章目录基本框架数据库查询实现算法概述“查询实现”在数据库管理系统中的位置实现数据库查询的基本思想查询算法与查询实现查询实现算法总览连接算法的实现连接操作的逻辑实现算法物理层面的算法关系的物理存储相关的参数连接操作的基本实现算法连接操作的全主存实现算法P2连接操作的半主存实现算法P3连接操作的大关...

2019-03-17 17:12:25 973 0

原创 【学习笔记】数据库基础 - 索引

文章目录基本内容概述什么是及为什么需要索引生活举例索引的概念索引的一般性特点关于索引的评价对哪些属性建立索引其它一些概念SQL 语言关于索引的基础知识稠密索引 & 稀疏索引根据索引定位记录==稀疏索引如何定位记录====稠密索引如何定位记录==非候选键属性的稠密索引 (3种...

2019-03-17 15:14:00 262 0

原创 【经典】942.DI String Match【排序的变种:按规则排序】

题目 Given a string S that only contains "I" (increase) or "D" (decrease), let N = S.length. Return any permutation A of [0, 1, ....

2019-02-24 16:39:58 155 0

翻译 Top K Frequent Elements【出现次数最多的k个元素 + 数据结构使用 + 函数式编程】

题目 Given a non-empty array of integers, return the k most frequent elements. Example 1: Input: nums = [1,1,1,2,2,3], k = 2 Output: [1,2] Exampl...

2019-02-24 15:14:01 201 0

原创 【Hadoop HDFS学习笔记】HDFS基本学习

文章目录HDFS文件系统HDFS设计的目标计算机集群的基本结构建构在上述物理结构之上的逻辑结构HDFS的基本架构HDFS命名空间管理通信协议客户端HDFS体系结构的局限性HDFS 的关键底层结构块(文件处理的基本单元)![在这里插入图片描述](https://img-blog.csdnimg.cn...

2019-01-06 10:14:53 1120 0

原创 【学习笔记】linux进程

文章目录进程的概念理解进程 的内部结构 与行为进程在内核中的组织形式:进程控制块(PCB)进程的状态文件管理结构内存管理结构进程之间的结构关系进程环境进程的用户空间布局命令行参数环境变量创建进程fork函数的工作流程fork函数执行后父子进程的主要异同父子进程共享文件fork用法vfork参考 ...

2018-12-02 14:11:44 1158 0

转载 KafkaConsumer

转自:https://www.cnblogs.com/f-zhao/p/7843883.html 目录 一、偏移量和消费者位置Offsets And Consumer position 1.1 TopicPartition 1.2 committed position提交偏移量 ...

2018-09-21 15:17:32 454 0

转载 linux awk命令详解

原文链接 : http://blog.chinaunix.net/uid-23302288-id-3785105.html awk是行处理器: 相比较屏幕处理的优点,在处理庞大文件时不会出现内存溢出或是处理缓慢的问题,通常用来格式化文本信息 awk处理过程: 依次对每一行进行处理,然后输出 ...

2018-08-30 10:40:39 121 0

转载 FileReader的编码问题

有一个UTF-8编码的文本文件,用FileReader读取到一个字符串,然后转换字符集:str=new String(str.getBytes(),"UTF-8");结果大部分中文显示正常,但最后仍有部分汉字显示为问号!   [java] view plain copy ...

2018-08-28 09:36:14 1343 0

转载 maven 开发环境 、测试环境、生产环境打包

作为一名程序员,在开发的过程中,经常需要面对不同的运行环境(开发环境、测试环境、生产环境、内网环境、外网环境等等),在不同的环境中,相关的配置一般不一样,比如数据源配置、日志文件配置、以及一些软件运行过程中的基本配置。每次在不同环境部署程序时,都需要修改相应的配置文件,使之完成环境的配置。这么做存...

2018-08-13 11:31:01 230 0

原创 【leetcode-medium】814. Binary Tree Pruning【修剪二叉樹】【自底向上反馈、修剪】

题目 We are given the head node root of a binary tree, where additionally every node's value is either a 0 or a 1. Return the same tree where ev...

2018-08-11 20:11:40 154 0

原创 【leetcode-medium】Score After Flipping Matrix【寻找结果最优化的规则】

题目: We have a two dimensional matrix A where each value is 0 or 1. A move consists of choosing any row or column, and toggling each value in that r...

2018-08-11 19:44:07 148 0

原创 【leetcode-medium】Encode and Decode TinyURL 【对url进行编码】

题目 TinyURL is a URL shortening service where you enter a URL such as https://leetcode.com/problems/design-tinyurl and it returns a short URL such as...

2018-08-11 11:56:31 268 0

转载 hive rcfile存储格式

Hive的三种文件格式:TEXTFILE、SEQUENCEFILE、RCFILE中,TEXTFILE和SEQUENCEFILE的存储格式都是基于行存储的,RCFILE是基于行列混合的思想,先按行把数据划分成N个row group,在row group中对每个列分别进行存储。另:Hive能支持自定义...

2018-06-27 19:01:19 175 0

转载 kafka原理总结

KafkaKafka是最初由Linkedin公司开发,是一个分布式、支持分区的(partition)、多副本的(replica),基于zookeeper协调的分布式消息系统,它的最大的特性就是可以实时的处理大量数据以满足各种需求场景:比如基于hadoop的批处理系统、低延迟的实时系统、storm/...

2018-06-25 10:47:15 251 0

转载 linux 中特殊符号用法详解

# 井号 (comments)#管理员  $普通用户脚本中#!/bin/bash   #!/bin/sh井号也常出现在一行的开头,或者位于完整指令之后,这类情况表示符号后面的是注解文字,不会被执行。# This line is comments.echo "a = $a" # ...

2018-06-19 18:49:54 304 0

原创 【hive】去重操作

概述 ditinct group by 概述 在hive中,去重操作主要有两种: - distinct - group by ditinct 该关键字的存在,决定了是否要去除重复的行。(有distinct,意味着取出规定的重复的行) 【去重规则】需要指出的是,去重的...

2018-04-28 15:42:39 1385 1

原创 【struts】基础知识入门

作用 结合MVC模型理解struts作用 MVC模型 基本配置使用 struts使用流程 小的示例 配置webxml 开发Action处理请求 配置strutsxml建立 Action与URL请求的关系 struts 的工作原理 基本原理图 细节解释 参考 作用 ...

2018-01-12 14:06:07 295 0

原创 【mybatis】入门 - 基本配置、简单示例

mybatis作用 Mybatis的基本配置 环境搭建流程 细节 创建User表 及实体类 配置mybatis 配置映射 userMapperxml任意命名 在java程序中使用mybatis的功能 mybatis工作流程 参考 mybatis作用 【为JDBC提供SQL】...

2018-01-11 20:22:54 316 0

原创 【读书笔记】科技写作与交流 - 3.稿件:研究论文(引言)

总论 内容和组织 了解读者 基本方式 引言的组成 背景 未知问题 问题目的 实验方法 结果与结论 重要性和意义可选 特例描述性论文的引言 引言撰写的重要原则 时态 使用强有力的动词或短句子 连贯和衔接技巧 给读者的信号 引言中常见的问题 总论 引言的目的: 1.吸...

2018-01-05 13:59:59 288 0

原创 【读书笔记】科技写作与交流 - 1.科技写作原则:文体及其构成

科技写作原则文体及其构成 单词 中心原则 单词的选择 词的选择特殊案例 冗长的文字和行话 缩略语 专业名称与专业术语 单词的位置 读者的预期 重要性的竞争 单词的安置 句子 语法与科技文体 人称 语态 时态 句子的长度 动词与动作 名词词组 代词 列举与比较 避免错误的比较 避免拼写标点和语法错误...

2018-01-03 22:29:55 1161 0

原创 理解池化技术

例子 - 为何要用池 策略1一次性使用 策略2重复使用 策略的选择 技术实例 对象池 对象创建的代价 对象池的优势 数据库连接池 线程池 文章首先通过一个通俗的实例帮助读者理解池化思想,随后说明池化思想在各种技术中的体现。 (欢迎指正) 例子 - 为何要用池?先举一个简单的使用篮球 例子,...

2017-12-20 22:16:46 2224 0

转载 Linux 5种IO模型

1. 概念理解      在进行网络编程时,我们常常见到同步(Sync)/异步(Async),阻塞(Block)/非阻塞(Unblock)四种调用方式: 同步:       所谓同步,就是在发出一个功能调用时,在没有得到结果之前,该调用就不返回。也就是必须一件一件事做,等前一件做完了才能做下...

2017-12-07 12:54:44 293 0

原创 如何设计一个系统?

什么叫做系统 如何理解系统 系统与软件的关系 回顾软件开发的过程 系统设计案例 Tomcat 设计目的 功能分解 总体架构 从设计角度查看上述结构现在软件变得越来越复杂,于是我们用“系统”这个词来形容现代的软件。正如生态系统、人的循环系统等一样复杂。 当事物复杂到一定程度的时候,我们就不能用过去...

2017-11-15 11:19:02 9859 3

转载 关于数学的一些观点

大卫·希尔伯特 做数学的艺术在于找到一个特例,其中隐含了所有推广的胚芽。 我们可以测量一个科学研究的重要性,借着数数看因为它而变得多余的出版物有多少。 有时候一个人的视野圈变得越来越小,当半径接近零的时候它集中在一点。然后那个东西变成了他的观点。 笛卡尔 越学习,越发现自己的无知。 怀疑是智慧的源...

2017-11-09 11:07:05 367 0

原创 罗素语录

1. 战争不决定谁对了,只决定谁留下了。 2. 你能在浪费时间中获得乐趣,就不是浪费时间。 3. 幻觉不是你的错,在幻觉中做决定,这就是你的不对了。 4. 人生就是搏斗,就是竞争,而尊敬只能属于胜利者。这种观念使得人们不惜牺牲理性和才智而去过分培养意志。 5. 恐惧是迷信的根源,也...

2017-11-06 17:30:44 556 0

原创 【读书笔记】spring 实战 - 基本概念

明确目标 主要思想 4种关键策略 详解4种关键策略 POJO尽量简洁 在spring中的体现 在spring中的实现方式 依赖注入 依赖注入的角色 依赖注入 如何降低耦合 spring注入的方式 装配 spring装配的原理 应用切面 定制流程 横切关注点的困境 AOP出场 使用模板消除样板式代码...

2017-11-06 12:08:07 205 0

原创 编程中常见出错的地方

常见的错误自身因素 思考问题不全面,自己写的某部分程序存在bug。 使用第3方库,不了解造成了错误使用 各个模块之间衔接的地方出现错误。比如,数据库与java程序交互的地方。 外界因素使用别人的工具本身是存在问题的,比如版本兼容问题。解决方法 确定错误是自己的程序出了问题,还是因为工具的问题。 确...

2017-11-01 00:53:57 448 0

原创 leetcode -- 385. Mini Parser【简单解析器 + 编程语言的解析器 + 递归 + 解析的规则 + 结果的数据结构】

题目 Given a nested list of integers represented as a string, implement a parser to deserialize it. Each element is either an integer, or a lis...

2017-10-17 22:57:42 737 0

原创 今日头条笔试【编程题 + 分析过程发现数学规律 + 回溯法】

编程题 题目1:(回溯法) 【题目描述】给定一个矩阵,从某点出发,找到箱子,然后把箱子推到目的地。计算最少使用多少步。无法到达用-1表示。 public class Main { public static void main(String[] args) { Scanner in ...

2017-10-17 22:36:26 803 0

转载 leetcode -- 691. Stickers to Spell Word【动态规划 + 位图使用】

题目 We are given N different types of stickers. Each sticker has a lowercase English word on it. You would like to spell out the given target strin...

2017-10-09 11:02:56 2865 0

提示
确定要删除当前文章?
取消 删除