- 博客(8)
- 资源 (6)
- 问答 (2)
- 收藏
- 关注
原创 python——使用itemgetter和sorted对列表内的元素进行排序
参考文章http://www.cnblogs.com/100thMountain/p/4719503.html胡哥在疯狂阅读deep walk之类的算法和论文,下了python包,看源码。突然喊我:诶,kf,你看这个。我一看,是以前没见过的itemgetter用法。itemgetter和sorted很适合于列表循环,比如:score = [('A',80),('B',82),('C
2017-06-29 20:27:32 1498
原创 Django——session登录以及页面取值
上一篇中,我们用最简单的方法实现了登陆,但是真实的开发中肯定不现实,我们需要使用session来保存我们需要的数据,并在需要的时候显示在页面上。我们的登陆代码变成了:def checkuser(request): if request.method == 'POST': user = request.POST.get('username') passwd = request.PO
2017-06-23 18:20:16 12781 2
原创 hadoop集群之间的文件拷贝——distcp
之前部门迁移hadoop,涉及到hive表的重建,以及hdfs上文件的迁移,还有oozie任务的修改。 hive重建表比较简单,首先show create table tablename;然后把建表语句拷贝下来即可,这里要注意的是,最好把stored as XXX语句也加上。一开始我没加,还出了错,因为两个hadoop集群的hive建表时的默认的存储格式不一致。 hdfs的数据
2017-06-22 11:45:23 5337
原创 Django——登陆模块的简单实现
本文仅介绍最简单的登陆功能,希望能对初学者有所帮助。 首先,我们在templates目录下新建一个login.html,并加入如下代码:
2017-06-19 18:29:46 1816
原创 postgre的数组使用
今天受益匪浅,抛砖引出了大神的玉。 我的砖如下: A表,字段有id,name和words,words字段以"|"为分隔符,如下: B表,字段为words和numbers,但是words字段有所不同,具体如下: 需求为:通过表B中的“董事”或者“投资”或者“债券”或者其他词,此处我们默认按B表的number字段排序,limit3,然后去表A匹配出
2017-06-12 19:34:48 2728
原创 嫌pandas的to_sql方法过慢?神方法让你一分钟搞定
本来50万条数据,使用pd.tosql方法,设置chunksize=2000,跑了5个小时。而上面这个方法,插40万条数据,只需1分钟。
2017-06-08 11:22:01 33480 23
原创 django设置中文时区
一开始写成LANGUAGE_CODE = 'zh-CN'TIME_ZONE = 'Asia/Beijing'但是报错ValueError: Incorrect timezone setting: Asia/Beijing改成TIME_ZONE = 'Asia/Shanghai'最后改成LANGUAGE_CODE = 'zh-Hans'TIME_Z
2017-06-06 22:02:34 7446 1
原创 python——修改Dataframe列名的两种方法
首先新建一个Dataframeimport pandas as pddf = pd.DataFrame({'a':[1,2,3],'b':[1,2,3]})如下: a b0 1 11 2 22 3 31、修改列名a,b为A、B。df.columns = ['A','B']2、只修改列名a为A
2017-06-02 20:51:01 352906 16
waffles工具
2016-04-07
SVDFeature
2016-04-07
jieba分词的停用此表,为什么对英文不起作用?
2017-06-13
关于lenskit 跑的时候出了点问题
2016-01-19
TA创建的收藏夹 TA关注的收藏夹
TA关注的人