- 博客(33)
- 资源 (15)
- 收藏
- 关注
原创 pandas - merge, concat合并两张表
pandas中合并两张表的函数包括merge,concat。1. merge2. concat
2017-08-30 16:03:24 18522
原创 Python - strptime从字符串获取时间信息
1. 函数原型strptime函数可以从一个具有时间格式的字符串中获取时间信息,其函数原型为:strptime(string, [format)2. 应用import time""" 返回值struct_day为一个struct格式的时间, 包含9个元素: tm_year: 年 tm_mon: 月 tm_mday: 日
2017-08-26 16:58:20 3866
原创 pandas - series序列转化为星期几
series序列中每个元素都是带有日期形式的字符串,需要将其转化为一个同等大小的series,且其中每个元素都是星期几。1)将Series转化为datetime格式;2)将Series中每个元素转化为星期;time_list = ["2017-05-10 17:19:19", "2017-05-11 17:19:20", "2017-05-12 17:19:20", "2017
2017-08-24 21:02:10 8042
原创 pandas - groupby, agg分组统计
参考文献http://jingyan.baidu.com/article/adc8151358a781f723bf73c4.htmlhttp://jingyan.baidu.com/article/d45ad148947fd369552b80f6.html
2017-08-21 22:47:27 37167
原创 Python - 格式化字符串%
参考文献http://www.cnblogs.com/vamei/archive/2013/03/12/2954938.html
2017-08-21 21:30:09 359
原创 数据挖掘 - geohash算法
参加摩拜单车举行的数据单车停放点位置预测数据挖掘竞赛,发现他的起始位置和终止位置是经过geohash算法编码的(相信如美团,百度等等也是如此吧)。经过geohash之后的地理位置是一个字符串,无法直接参与算法的运算。比如某辆单车的起始,终止位置是这样:[wx4snhx, wx4snhj]。一个字符串同时表示该位置的经度,维度;同时geohash表示的是一个比较精确的矩形区域,而不是一个点。Py
2017-08-21 14:28:54 2509
原创 Java数据结构与算法 - 二叉树
1. 为什么使用二叉树为什么使用树?因为二叉树通常结合两种数据结构的有点:有序数组,链表。在树中查找数据和有序数组一样快,在树中删除数据,添加数据和链表一样快。有序数组中,插入数据很慢,链表中查找数据太慢。2. 树的基本术语1)根:也叫根节点,最上面那个节点。一棵树只有一个根。2)父节点3)子节点4)叶子节点:叶子节点下面不再有节点。5)子树6)层:根叫做第
2017-08-10 23:38:27 366
原创 推荐算法 - 常用推荐算法
1. 基于人口统计学的推荐2. 基于内容的推荐3. 基于关联规则的推荐4. 基于协同过滤的推荐4.1 基于用户的协同过滤4.2 基于物品的协同过滤
2017-08-10 16:56:17 2600
原创 Python - map函数
1. 函数原型2. 应用参考文献http://blog.csdn.net/seetheworld518/article/details/46959871http://www.cnblogs.com/superxuezhazha/p/5714970.html
2017-08-07 14:05:52 383
原创 机器学习 - SVD
1. SVD1.1 分解如下图,一个矩阵可以分解为两个方阵和一个对角矩阵的乘积:C = m * n;u = m * m;sigma = m * n;v' = n * n1.2 奇异值sigma是一个对角矩阵,但通常不是方阵。sigma的对角元素被称为奇异值,与特征值类似。因此与PCA类似,我们可以取sigma中最大的k个,来简化数据:u' = m * k;s
2017-08-07 00:52:54 8256 5
原创 Python - Pythonic下划线
Python的面向对象没有严格的定义私有,公有,保护;但是有一定的命名风格来显示当前成员变量,成员函数的属性。先挖坑参考文献http://www.cnblogs.com/wanpython/archive/2013/05/23/3095534.htmlhttp://www.cnblogs.com/wangshuyi/p/6096362.html
2017-08-05 10:54:09 523 2
原创 numpy - 获取array中数组元素的索引
1. 函数原型2. 应用参考文献http://blog.csdn.net/vernice/article/details/50990919
2017-08-05 10:36:59 24203 1
原创 Python - 创建字典的多种方式
http://blog.csdn.net/csujiangyu/article/details/45176399
2017-08-04 16:49:51 1656
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人