零散的学习笔记
老胡当道卧
这个作者很懒,什么都没留下…
展开
-
使用hadoop做wordcount笔记
以前写的mapreduce的wordcount,都忘了怎么执行了hadoop jar/home/dmc/hadoop/share/hadoop/tools/lib/hadoop-streaming-2.6.0.jar-mapper mapper1.py-file mapper1.py-reducer reducer1.py-file reducer1.py-input /user/hu原创 2017-06-08 12:41:48 · 351 阅读 · 0 评论 -
改改host,轻松登录dropbox!(For Windows)
自从dropbox被屏蔽之后,已经很久没有登录过它了,我都快要将他遗忘了,突然收到邮件让我登录,否则就关闭账户,可我又登不上去,这可如何是好?这里不用vpn,只用改一下host就能轻松登录dropbox!STEP 1打开:http://ping.chinaz.com/ ping一下dropbox.com,如图所示: 可以得到如下结果: STEP 2将所有的响应ip复制粘贴到一个txt文档里,文原创 2017-06-09 11:16:32 · 28854 阅读 · 4 评论 -
python3爬天气后报历史数据
查询国内各地市的天气数据,天气后报网http://www.tianqihoubao.com/lishi是一个还凑合的选择,因为里面只有天气状况、气温、风力风向这三方面的数据,是一个不能更基本的天气数据了。可以注意到每个数据页的url构造很有规律,基本上就是www.tianqihoubao.com/lishi/+地市拼音+/month/+六位月份+.html 由于数据量不大,这里的策略就是:在ww原创 2017-06-09 12:20:49 · 4935 阅读 · 0 评论 -
利用python求数组中连续k个相同值的最大的k
例如,对于一个数组a=(a1,a2,...,an)a=(a_1,a_2,...,a_n),我们想知道使得ai=ai+1=...=ai+k=xa_i=a_{i+1}=...=a_{i+k}=x的最大kk是多少,最笨的办法是我们需要做两层循环:# 这里假设x=1aaa = [1, 1, 0, -1, 1, 1, 1, -1, -1, -1, -1, 0, 0]len_a = len(aaa)max原创 2017-07-14 15:17:29 · 1102 阅读 · 0 评论 -
python中计算一个列表中连续相同的元素个数
最简单的例子:a = [1,1,1,1,2,2,2,3,3,1,1,1,3]# 问:计算a中最多有几个连续的1很明显,答案是4如果用代码实现,最先想到的就是itertools:import itertoolsa = [1,1,1,1,2,2,2,3,3,1,1,1,3]print max([len(list(v)) for k,v in itertools.group...原创 2018-03-05 19:15:46 · 21912 阅读 · 3 评论 -
正则表达式只匹配整数不匹配小数
现在我们有形如如下字符串的数据:联系列表:[上海浦东发展银行白金专线]主叫1次共5.48分钟,被叫0次共0.0分钟;[工商银行]主叫4次共28.36666666分钟,被叫0次共0.0分钟;[建设银行信用卡服务热线]主叫3次共9.26666666分钟,被叫0次共0.0分钟;[浦发银行信用卡热线]主叫0次共0.0分钟,被叫1次共0.58分钟我们需要从中计算出所有银行主被叫的次数之和为了...原创 2018-01-11 17:28:46 · 5993 阅读 · 0 评论