- 博客(9)
- 收藏
- 关注
原创 LeetCode分类习题-查找
查找1. 查找表这一部分主要考察各种数据结构的使用:Set:元素互不重复,且只需要元素的值本身HashMap:需要键值对存储,键不重复,无序TreeMap:键值对存储,默认按键排序,也可自定义Comparator< E >PriorityQueue:优先队列,用于无序输入、有序输出,例如任务调度场景,根据重要度返回队首1.1 两个数组的交集(一)重复结果只需要输出一次,因此只需要两个Set取交集class Solution { public int[] inters
2020-08-25 22:53:48
111
原创 LeetCode分类习题-动态规划
动态规划可以利用动态规划解决的问题有这样一种特点:总问题可分解为子问题,而每一步子问题都依赖于前一步或前几步的结果。动态规划的求解速度相对于朴素解法更快,因为子问题的结果已经被记录,后面需要的时候直接调用即可。动态规划的步骤:确定状态代表什么(dp[i]或dp[i] [j]都代表啥);状态如何转移的(dp[i] 和dp[i - 1] 或dp[i - k]之间的关系),一开始可以先枚举尝试,如果特别麻烦建议回到步骤1重新定义状态;确定边界条件(dp[0]或dp[0] [0]都是啥);确定输出是什
2020-08-22 16:26:14
167
原创 LeetCode分类习题-分治
分治算法1.多数元素此题思路非常多,主要介绍分治思想的应用和常见其他解法。1.1 分治法求原数组的众数可以转化成求各子数组的众数,最后将子数组的结果合并为原数组结果。这就涉及两个问题:a)递归头。当子数组只有一个元素时,众数即为该元素。b)合并规则。class Solution { public int majorityElement(int[] nums) { return getMajority(nums, 0, nums.length - 1); }
2020-08-19 21:22:35
156
原创 MapReduce原理及源码浅析(二)
MapReduce原理及源码浅析(二)回顾:上一篇文章我们讨论了客户端提交MapReduce作业时是如何创建split清单以及MapTask如何读取split中的记录的。获取split实际上调用了FileInputFormat的getSplits()方法,split有四个重要的参数:Pathoffsetlengthhosts和cachedhostssplit中的记录向map环节写...
2019-07-12 23:41:26
200
2
原创 MapReduce原理及源码浅析(一)
官网介绍是否依赖Hadoop整个计算流程,自己画图clientmaptaskreducetasksplit信息拼接combine读取键值对输出MapReduce原理及源码浅析MapReduce是ASF推出的大数据开源计算框架,虽然如今的开发过程中已经很少直接编写MR程序,但是MR仍然是大数据计算的灵魂思想,这篇文章主要分析MapReduce计算层面(先不管Yarn层)的原理。...
2019-07-08 21:21:58
269
原创 python爬虫(二)
python爬虫(二)2.1 Beautiful SoupBeautiful Soup 是一个可以从HTML和XML文件中提取数据的python库,它可以使用用户喜欢的转换器实现惯用的文档导航,修改,定位等功能。由于使用的编译环境是python3,安装bs4时,注意使用pip3命令bs有几种解析器,按照不同的需求选择使用:Tag对象bs中有几种对象,本次任务主要用到了Tag对象。Ta...
2019-05-13 17:48:28
145
原创 python爬虫(一)
python网络爬虫(一)1.get与post请求关于HTTP超文本传输协议(HTTP)目的是保证客户端与服务器端的通信,其作用就是实现客户端与服务器的请求-应答。Get与PostGet和Post是HTTP最常用的两种方法(除此之外还有HEAD,PUT,DELETE等)Get:从指定的资源请求数据Post:向指定的资源提交要处理的数据两种请求都可以用requests包中的get...
2019-05-12 16:59:08
169
原创 Hadoop配置
ifconfig 查看网卡名称vim /etc/sysconfig/network-scripts/ifcfg-ens33(要看ifconfig命令显示的网卡名称)设置master的IP地址(与主机在同一网段内)和子网掩码vim /etc/sysconfig/network(设置网关)hostnamectl set-hostname master更改本机名称为master...
2019-05-04 19:43:52
84
原创 MySQL笔记(一)
MySQL笔记基本概念数据库定义保存有组织的数据的容器关系型数据库二维表格模型列(字段)行(记录)主键本质:一列作用:能够唯一标识每一行要求:任意两行主键值不同;每行都必须具有主键值(且非null)习惯:不更新、不重用、值不变检索数据选择数据库USE DATABASE;SHOW DATABASES;SHOW TABLES;SHOW COLUMNS FR...
2019-04-02 21:09:23
175
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人