![](https://img-blog.csdnimg.cn/20201014180756923.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据统计
Power of the sea
不积跬步无以至千里,不积小流无以成江河。
记录一些自己在编程中遇到的问题,以便自己以后使用,也为大家提供方便,共同进步。
展开
-
pandas 满足多条件的行的某列求和
import numpy as np import pandas as pd import csv import random # train_msg = pd.read_csv('../../txCTR/train_msg.csv') # train_msg = train_msg.sort_values(by='user_id', ascending=True) # 按照特定列排序,如果没有重新赋值,原数据不会改变 # train_msg_train = train_msg[train_msg.use.原创 2020-05-27 23:37:06 · 4782 阅读 · 1 评论 -
pandas创建Dataframe
import numpy as np import pandas as pd import csv import random # 下面一段代码生成一个用来模拟统计的表格 # simulation = pd.DataFrame(columns=('user_id', 'industry', 'category', 'click_times')) # for i in range(100): # user_id = random.randint(1, 10) # 闭区间 # industr...原创 2020-05-27 23:31:26 · 166 阅读 · 0 评论