- 博客(4)
- 收藏
- 关注
转载 Spark与Pandas中DataFrame的详细对比
Pandas Spark 工作方式 单机single machine tool,没有并行机制parallelism 不支持Hadoop,处理大量数据有瓶颈 分布式并行计算框架,内建并行机制parallelism,所有的数据和操作自动并行分布在各个集群结点上。以处理in-memory数据的方式处理distributed数据。 支持Hadoop,能处理大量数...
2018-08-10 16:29:15 274
原创 基于tcp协议的远程文件传输(递归函数)
1.从客户端远程连接到服务端,并请求获取服务端的默认路径下文件、目录列表,在终端打印出文件目录列表 客户端代码如下: import os import time def do_list(s): #接收服务器确认 OK or FALL data = s.recv(128).decode() print(data) if ...
2018-08-10 15:09:09 502
转载 5类系统推荐算法,非常好使,非常全
◆ ◆ ◆ 序言 最近因为PAC平台自动化的需求,开始探坑推荐系统。这个乍一听去乐趣无穷的课题,对于算法大神们来说是这样的: 而对于刚接触这个领域的我来说,是这样的: 在深坑外围徘徊了一周后,我整理了一些推荐系统的基本概念以及一些有代表性的简单的算法,作为初探总结,也希望能抛砖引玉,给同样想入坑的伙伴们提供一些思路。 ◆ ◆ ◆ 什么是推荐系...
2018-08-10 14:08:44 235
原创 递归的优化(动态规划)
前段时间看赵俊老师的教学是视频,其中给出了一道作业题,是让我们解决递归过程中重复计算的问题,题目如下: 使用递归方法来计算组合数: 从m个不同元素中,任取n(n≤m)个元素并成一组,叫做从m个不同元素中取出n个元素的一个组合;从m个不同元素中取出n(n≤m)个元素的所有组合的个数,叫做从m个不同元素中取出n个元素的组合数。 公 式: C(m,n)=n!/(...
2018-08-10 13:41:27 1162
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人