Python
文章平均质量分 89
Python相关
程序员进化者
这个作者很懒,什么都没留下…
展开
-
使用PySpark处理数据
使用PySpark做用户画像 文章目录使用PySpark做用户画像一、数据准备二、用户点击率1.创建SparkSession对象2.读取数据,将数据根据‘~’拆分,获取userid和behavior两列3.统计用户的各类行为数4.将userid,behavior和数量取出作为3列,并转为DataFrame格式5.根据userId进行分组,将behavior列数据进行旋转作为列标数值为cnt。并将behavior的0和1替换为“browse”和”click”。6.填充缺失值7.将计算的数据作为新列添加到数据8原创 2020-12-27 19:05:17 · 1042 阅读 · 0 评论 -
Pandas数据分析本文就够
十分钟快速上手Pandas数据处理一、常用操作1、csv读取和导出2、dataframe转换为列表3、某一列求和4、某一列格式转换5、选择数据6、修改数据7、删除数据8、处理NaN值9、保留小数和百分数处理10、列名更换11、复制12、相关值替换二、合并数据1、concat2、merge三、排名与排序1、排名,生成排序序号列。不改变数据顺序2、排序,改变数据顺序四、分组统计1、分组求和2、分组计数3、分组求累加值五、复杂操作1、条件赋值 一、常用操作 1、csv读取和导出 df = pd.read_csv(原创 2020-07-16 19:53:58 · 603 阅读 · 0 评论 -
二叉树前序、中序、后序遍历-python
一、中序遍历 def inorderTraversal(root): if not root: return [] return inorderTraversal(root.left) + [root.val] + inorderTraversal(root.right) def inorderTraversal(root): stack = ...原创 2019-10-10 10:49:00 · 166 阅读 · 0 评论 -
快速排序和归并排序-python
一、快速排序 def quick_sort(arry): if len(arry)<=1: return arry target = arry[0] left, right = [], [] i = 1 while i < len(arry): if arry[i] <= target: ...原创 2019-09-01 09:50:00 · 111 阅读 · 0 评论 -
57-1和为s的数字-python
题目:输入一个递增排序的数组和一个数字s,在数组中找查找两个数,使他们的和正好为s。如果有多对,输出任意一对即可。 def find_nums_sum(nums,s): begin,end=0,len(nums)-1 while begin<end: if 2*nums[begin]<s or 2*nums[end]>s: ...原创 2019-09-17 22:03:00 · 80 阅读 · 0 评论