- 博客(319)
- 资源 (8)
- 问答 (1)
- 收藏
- 关注
原创 对于概率论数字特征的理解
数字特征概述随机变量常见数字特征数学期望均值方差标准差协方差相关系数协方差矩阵参考数字特征概述 在我们学习概率论的时候,很多时候我们不能深刻理解概率论中的数字特征所具有的含义,本文章尝试去帮助读者理解一些术语、概念。 什么是数字特征?要回答这个问题,先得弄清楚什么是特征。特征是一个客体或一组客体特性的抽象结果。特征是用来描述概念的。任一客体或一组客体都具有众多特性,
2017-04-07 15:47:39 25954 7
原创 机器学习总结
学习路线图理论数据预处理聚类技术methodsmodels范式特征应用相关文章矩阵理解工具numpyscikit-learnscipymatplotlib学习路线图先来看个学习框架图: 下图说明了如何选择模型? 理论数据预处理统计数据归一化与标准化 标准化,归一化和正则化 聚类【推酷主题】聚类分析技术methods【知乎】分类与回归区别是什么? 回归分析
2017-03-04 15:39:37 1107
原创 科研索引
查看会议日期方法论题目实验设计论文写作署名introduction结果 结论相关工作部分致谢审稿数学工具Latex语法检查数据细节关注的博客学术期刊中文最新进展编程方面查看会议日期wikiCFP 中国会议在线方法论【科学网】跟诺奖得主学做科研 【研究生手册(彭明辉教授)】如何读一篇优秀的计算机论文?等等 【知乎】独立情况下,研究生如何阅读文献、提出
2017-02-20 11:33:57 1101
原创 爬虫文章索引
入门如何入门爬虫? 【知乎,全面】零基础如何学爬虫技术?实战[Python爬虫] Selenium爬取新浪微博移动端热点话题及评论 (下) 细节【知乎】爬虫怎么解决封IP?爬虫配置python selenium环境配置Firefox和Chrome 【驱动】firefox驱动下载地址(方便在程序中操作firefox) 【代理】python selenium Frefox使 用代理访问网页 【
2017-02-19 09:43:47 1153
原创 python相关文章导引
python 总述python运算python 数据结构列表元组字典字符串异常处理文件操作细节排序数据库操作异常语法细节常见库的使用timeloggingpython 总述Python基础教程(基础,忽略一些细节) 【中文】Python语言参考(语法等) 【中文】Python 标准库 (可用于查询) 有趣的理解python(有助于理解)python运算【菜鸟教程
2017-02-17 23:09:02 1345
原创 文本处理总结
理论基础LDA原理介绍LDA评价文本预处理总体流程字符串处理相关的工具自然语言工具NLTK工具Gensim相似性代码示例情感分析理论工具 - TextBlob理论基础【算法与数学】阮一峰的网络日志TF-IDF与余弦相似性的应用(一):自动提取关键词TF-IDF与余弦相似性的应用(二):找出相似文章TF-IDF与余弦相似性的应用(三):自动摘要LDA原理介绍【通俗易
2017-02-16 20:39:24 2002
原创 算法思想及数据结构 -- 总结
数学数据结构算法程序的设计过程算法思想动态规划线性规划数据结构树最近公共祖先Lowest Common Ancestor 网上经验数学,数据结构,算法 【王boy】学习数据结构有什么用? 【王boy】递推与递归的区别?程序的设计过程算法思想动态规划什么是动态规划?动态规划的意义是什么?线性规划线性规划(抽象层次) 线性规划(代码实现单纯形法) 线性规划(代码注释较多)数据结构
2017-01-25 12:20:49 1544
原创 【数据库学习笔记】数据库事务处理技术 - 并发控制
文章目录概述为什么要进行并发控制三种典型的不一致引入并发控制什么是事务事务的基本概念事务的宏观特性(程序员眼中的事务)事务的微观特性(DBMS看到的事务)事务的特性【TODO:深入阐释】事务的特性: ACIDDBMS对事务的控制事务调度与可串行性概述为什么要进行并发控制并发意味着多个流程,以某种不确定的方式进行交替执行。这种交替的不确定性,往往会对结果造成相应的不确定性。站在组合的角度来...
2019-07-06 13:09:55 1470 1
原创 【学习笔记】数据库基础 - 查询优化
文章目录什么是数据库查询优化?影响查询优化的因素优化策略概述查询优化的总体思路语义优化 -- 内容等价性语法优化(逻辑层优化)---语法等价性执行优化(物理层优化)查询优化在DBMS中的位置逻辑查询优化关系代数优化示例关系代数操作次序交换的等价性明确定义关系代数的等价性等价定理基于关系代数的查询优化算法及示例==关系代数优化算法:==算法应用示例物理查询优化什么是数据库查询优化?计算机科学家们...
2019-03-30 09:13:38 1518
原创 【学习笔记】数据库基础 - 数据库查询算法(一趟)
文章目录基本框架数据库查询实现算法概述“查询实现”在数据库管理系统中的位置实现数据库查询的基本思想查询算法与查询实现查询实现算法总览连接算法的实现连接操作的逻辑实现算法物理层面的算法关系的物理存储相关的参数连接操作的基本实现算法连接操作的全主存实现算法P2连接操作的半主存实现算法P3连接操作的大关系实现算法P4IO 分析汇总利用迭代器构造查询实现算法迭代器算法的提出两种是实现策略迭代器算法基础迭代...
2019-03-17 17:12:25 3996 1
原创 【学习笔记】数据库基础 - 索引
文章目录基本内容概述什么是及为什么需要索引生活举例索引的概念索引的一般性特点关于索引的评价对哪些属性建立索引其它一些概念SQL 语言关于索引的基础知识稠密索引 & 稀疏索引根据索引定位记录==稀疏索引如何定位记录====稠密索引如何定位记录==非候选键属性的稠密索引 (3种情况)主索引 & 辅助索引主索引辅助索引对比主索引 & 辅助索引其它结构的索引多级索引其它B+ 树索引...
2019-03-17 15:14:00 1283
原创 【经典】942.DI String Match【排序的变种:按规则排序】
题目Given a string S that only contains "I" (increase) or "D" (decrease), let N = S.length.Return any permutation A of [0, 1, ..., N] such that for all i = 0, ..., N-1:If S[i] == "I", then A[i] &l...
2019-02-24 16:39:58 467
翻译 Top K Frequent Elements【出现次数最多的k个元素 + 数据结构使用 + 函数式编程】
题目Given a non-empty array of integers, return the k most frequent elements.Example 1:Input: nums = [1,1,1,2,2,3], k = 2Output: [1,2]Example 2:Input: nums = [1], k = 1Output: [1]Note:...
2019-02-24 15:14:01 569
原创 【Hadoop HDFS学习笔记】HDFS基本学习
文章目录HDFS文件系统HDFS设计的目标计算机集群的基本结构建构在上述物理结构之上的逻辑结构HDFS的基本架构HDFS命名空间管理通信协议客户端HDFS体系结构的局限性HDFS 的关键底层结构块(文件处理的基本单元)![在这里插入图片描述](https://img-blog.csdnimg.cn/2019010608455950.png)名称节点文件树状结构组织方式名称结点的关键数据结构(文件状...
2019-01-06 10:14:53 2810
原创 【学习笔记】linux进程
文章目录进程的概念理解进程 的内部结构 与行为进程在内核中的组织形式:进程控制块(PCB)进程的状态文件管理结构内存管理结构进程之间的结构关系进程环境进程的用户空间布局命令行参数环境变量创建进程fork函数的工作流程fork函数执行后父子进程的主要异同父子进程共享文件fork用法vfork参考主要以linux进程为例进程的概念理解为何引入进程?世界可以看作是过程的集合体,进程这一概念...
2018-12-02 14:11:44 1356
转载 KafkaConsumer
转自:https://www.cnblogs.com/f-zhao/p/7843883.html目录一、偏移量和消费者位置Offsets And Consumer position 1.1 TopicPartition 1.2 committed position提交偏移量 二、消费分组和主题订阅Consumer Groups and Topic Subscriptions...
2018-09-21 15:17:32 750
转载 linux awk命令详解
原文链接 : http://blog.chinaunix.net/uid-23302288-id-3785105.htmlawk是行处理器: 相比较屏幕处理的优点,在处理庞大文件时不会出现内存溢出或是处理缓慢的问题,通常用来格式化文本信息awk处理过程: 依次对每一行进行处理,然后输出awk命令形式:awk [-F|-f|-v] ‘BEGIN{} //{command1; comm...
2018-08-30 10:40:39 306
转载 FileReader的编码问题
有一个UTF-8编码的文本文件,用FileReader读取到一个字符串,然后转换字符集:str=new String(str.getBytes(),"UTF-8");结果大部分中文显示正常,但最后仍有部分汉字显示为问号! [java] view plain copypublic static List<String> getLines( String fileName ) ...
2018-08-28 09:36:14 3201 1
转载 maven 开发环境 、测试环境、生产环境打包
作为一名程序员,在开发的过程中,经常需要面对不同的运行环境(开发环境、测试环境、生产环境、内网环境、外网环境等等),在不同的环境中,相关的配置一般不一样,比如数据源配置、日志文件配置、以及一些软件运行过程中的基本配置。每次在不同环境部署程序时,都需要修改相应的配置文件,使之完成环境的配置。这么做存在一个比较大的问题:每次修改配置非常麻烦,而且配置错误会产生不可预估的影响,比如,在发布生产环境时用的...
2018-08-13 11:31:01 625
原创 【leetcode-medium】814. Binary Tree Pruning【修剪二叉樹】【自底向上反馈、修剪】
题目We are given the head node root of a binary tree, where additionally every node's value is either a 0 or a 1.Return the same tree where every subtree (of the given tree) not containing a 1 has b...
2018-08-11 20:11:40 453
原创 【leetcode-medium】Score After Flipping Matrix【寻找结果最优化的规则】
题目:We have a two dimensional matrix A where each value is 0 or 1.A move consists of choosing any row or column, and toggling each value in that row or column: changing all 0s to 1s, and all 1s to ...
2018-08-11 19:44:07 333
原创 【leetcode-medium】Encode and Decode TinyURL 【对url进行编码】
题目TinyURL is a URL shortening service where you enter a URL such as https://leetcode.com/problems/design-tinyurl and it returns a short URL such as http://tinyurl.com/4e9iAk.Design the encode and ...
2018-08-11 11:56:31 489
转载 hive rcfile存储格式
Hive的三种文件格式:TEXTFILE、SEQUENCEFILE、RCFILE中,TEXTFILE和SEQUENCEFILE的存储格式都是基于行存储的,RCFILE是基于行列混合的思想,先按行把数据划分成N个row group,在row group中对每个列分别进行存储。另:Hive能支持自定义格式,详情见:Hive文件存储格式基于HDFS的行存储具备快速数据加载和动态负载的高适应能力,因为行存...
2018-06-27 19:01:19 415
转载 kafka原理总结
KafkaKafka是最初由Linkedin公司开发,是一个分布式、支持分区的(partition)、多副本的(replica),基于zookeeper协调的分布式消息系统,它的最大的特性就是可以实时的处理大量数据以满足各种需求场景:比如基于hadoop的批处理系统、低延迟的实时系统、storm/Spark流式处理引擎,web/nginx日志、访问日志,消息服务等等,用scala语言编写,Link...
2018-06-25 10:47:15 423
转载 linux 中特殊符号用法详解
# 井号 (comments)#管理员 $普通用户脚本中#!/bin/bash #!/bin/sh井号也常出现在一行的开头,或者位于完整指令之后,这类情况表示符号后面的是注解文字,不会被执行。# This line is comments.echo "a = $a" # a = 0由于这个特性,当临时不想执行某行指令时,只需在该行开头加上 # 就行了。这常用在撰写过程中。#echo "a =...
2018-06-19 18:49:54 700
原创 【hive】去重操作
概述ditinctgroup by概述在hive中,去重操作主要有两种: - distinct - group byditinct该关键字的存在,决定了是否要去除重复的行。(有distinct,意味着取出规定的重复的行)【去重规则】需要指出的是,去重的规则是根据后面的关键字进行的,比如:如果col1,col2同时重复才会去重。即 col1重复 &...
2018-04-28 15:42:39 3345 1
原创 【struts】基础知识入门
作用结合MVC模型理解struts作用MVC模型基本配置使用struts使用流程小的示例配置webxml开发Action处理请求配置strutsxml建立 Action与URL请求的关系struts 的工作原理基本原理图细节解释参考作用 使用Struts的目的是为了帮助我们减少在运用MVC设计模型来开发Web应用的时间。结
2018-01-12 14:06:07 662
原创 【mybatis】入门 - 基本配置、简单示例
mybatis作用Mybatis的基本配置环境搭建流程细节创建User表 及实体类配置mybatis配置映射 userMapperxml任意命名在java程序中使用mybatis的功能mybatis工作流程参考mybatis作用【为JDBC提供SQL】mybatis本身用于生成JDBC所需要的各种SQL串。【映射对象、SQL】节省了大量代码,使用户专
2018-01-11 20:22:54 645
原创 【读书笔记】科技写作与交流 - 3.稿件:研究论文(引言)
总论内容和组织了解读者基本方式引言的组成背景未知问题问题目的实验方法结果与结论重要性和意义可选特例描述性论文的引言引言撰写的重要原则时态使用强有力的动词或短句子连贯和衔接技巧给读者的信号引言中常见的问题总论引言的目的: 1.吸引读者阅读论文; 2.提供足够的背景信息以使读者了解早期发表的相关研究。 PS:通常是
2018-01-05 13:59:59 874
原创 【读书笔记】科技写作与交流 - 1.科技写作原则:文体及其构成
科技写作原则文体及其构成单词中心原则单词的选择词的选择特殊案例冗长的文字和行话缩略语专业名称与专业术语单词的位置读者的预期重要性的竞争单词的安置句子语法与科技文体人称语态时态句子的长度动词与动作名词词组代词列举与比较避免错误的比较避免拼写标点和语法错误从句子到段落参考:霍夫曼. 科技写作与交流[M]. 科学出版社, 2012.科技写作原则:文体及其构成
2018-01-03 22:29:55 2921
原创 理解池化技术
例子 - 为何要用池策略1一次性使用策略2重复使用策略的选择技术实例对象池对象创建的代价对象池的优势数据库连接池线程池 文章首先通过一个通俗的实例帮助读者理解池化思想,随后说明池化思想在各种技术中的体现。 (欢迎指正)例子 - 为何要用池?先举一个简单的使用篮球 例子,我们有多种策略使用篮球,并且使用篮球之后会产生一定的代价,主观上认为我们倾向于将代价最小化。策略1:(一
2017-12-20 22:16:46 3260 1
转载 Linux 5种IO模型
1. 概念理解 在进行网络编程时,我们常常见到同步(Sync)/异步(Async),阻塞(Block)/非阻塞(Unblock)四种调用方式:同步: 所谓同步,就是在发出一个功能调用时,在没有得到结果之前,该调用就不返回。也就是必须一件一件事做,等前一件做完了才能做下一件事。例如普通B/S模式(同步):提交请求->等待服务器处理->处理完毕
2017-12-07 12:54:44 431
原创 如何设计一个系统?
什么叫做系统如何理解系统系统与软件的关系回顾软件开发的过程系统设计案例Tomcat设计目的功能分解总体架构从设计角度查看上述结构现在软件变得越来越复杂,于是我们用“系统”这个词来形容现代的软件。正如生态系统、人的循环系统等一样复杂。 当事物复杂到一定程度的时候,我们就不能用过去暴力的方法进行求解了。这时候我们就需要借助完善的、系统的方法来进行求解,这将大大降低开发的代价。什么叫做
2017-11-15 11:19:02 27817 3
转载 关于数学的一些观点
大卫·希尔伯特做数学的艺术在于找到一个特例,其中隐含了所有推广的胚芽。我们可以测量一个科学研究的重要性,借着数数看因为它而变得多余的出版物有多少。有时候一个人的视野圈变得越来越小,当半径接近零的时候它集中在一点。然后那个东西变成了他的观点。笛卡尔越学习,越发现自己的无知。怀疑是智慧的源头。仅仅具备出色的智力是不够的,主要的问题是如何出色地使用它。无法做出决策的人,或
2017-11-09 11:07:05 979
原创 罗素语录
1. 战争不决定谁对了,只决定谁留下了。 2. 你能在浪费时间中获得乐趣,就不是浪费时间。 3. 幻觉不是你的错,在幻觉中做决定,这就是你的不对了。 4. 人生就是搏斗,就是竞争,而尊敬只能属于胜利者。这种观念使得人们不惜牺牲理性和才智而去过分培养意志。 5. 恐惧是迷信的根源,也是造成残忍的主要原因之一。智慧始于征服恐惧。 6. 人的情绪起落是与他对事实的感知成反比的,你对事实
2017-11-06 17:30:44 1013
原创 【读书笔记】spring 实战 - 基本概念
明确目标主要思想4种关键策略详解4种关键策略POJO尽量简洁在spring中的体现在spring中的实现方式依赖注入依赖注入的角色依赖注入 如何降低耦合spring注入的方式装配spring装配的原理应用切面定制流程横切关注点的困境AOP出场使用模板消除样板式代码样板式代码spring的解决办法其他参考更新中“`明确目标要弄明白spring 的作用,要时刻明白
2017-11-06 12:08:07 345
原创 编程中常见出错的地方
常见的错误自身因素思考问题不全面,自己写的某部分程序存在bug。使用第3方库,不了解造成了错误使用各个模块之间衔接的地方出现错误。比如,数据库与java程序交互的地方。外界因素使用别人的工具本身是存在问题的,比如版本兼容问题。解决方法确定错误是自己的程序出了问题,还是因为工具的问题。确定自己程序的哪个模块产生了错误。单元测试。 (更新中…)
2017-11-01 00:53:57 781
原创 leetcode -- 385. Mini Parser【简单解析器 + 编程语言的解析器 + 递归 + 解析的规则 + 结果的数据结构】
题目Given a nested list of integers represented as a string, implement a parser to deserialize it.Each element is either an integer, or a list -- whose elements may also be integers or other l
2017-10-17 22:57:42 1061
原创 今日头条笔试【编程题 + 分析过程发现数学规律 + 回溯法】
编程题题目1:(回溯法)【题目描述】给定一个矩阵,从某点出发,找到箱子,然后把箱子推到目的地。计算最少使用多少步。无法到达用-1表示。public class Main { public static void main(String[] args) { Scanner in = new Scanner(System.in); String str = in.
2017-10-17 22:36:26 1013
转载 leetcode -- 691. Stickers to Spell Word【动态规划 + 位图使用】
题目We are given N different types of stickers. Each sticker has a lowercase English word on it.You would like to spell out the given target string by cutting individual letters from your co
2017-10-09 11:02:56 3550
Vue.js实战(带目录)
2019-03-27
geckodriver - win64
2017-02-01
eclipse黑夜主题
2016-08-14
关于如何阅读代码疑问?
2016-06-25
TA创建的收藏夹 TA关注的收藏夹
TA关注的人