pandas使用
夜观天象昼编程
这个作者很懒,什么都没留下…
展开
-
重复源的筛选
在天文学中有一些数据中是有很多重复源的,例如LAMOST,大约有20%的重复观测,实际使用中,我们应当去掉重复源,否则在数据拟合或者进行机器学习的时候,会导致部分源的权重偏大,导致模型拟合的不好。对于重复源,一般是两种做法,如果数据中有信噪比,那么我们肯定是选择重复源中信噪比最大的一个数据,如果没有信噪比,那么我们就应该对重复源求一个平均值或者中位数,原创 2022-11-01 15:56:38 · 294 阅读 · 1 评论 -
pandas 使用
对于操作csv文件,pandas是一个很好的工具,比如分析部分学生的成绩:#读入数据文件data1=pd.read_csv('students_grade1.csv')>>>> Unnamed: 0 学号 语文 数学 英语0 0 20167598 89 89 891 1 20167589 85 85 852 2 20164569 52 52 52原创 2020-05-25 10:10:06 · 220 阅读 · 0 评论 -
pandas dataframe合并时的问题
使用函数:pd.concat([df1,df2])这样就可以将两个dataframe df1,df2合并可选参数:(1)ignore_index,默认是false ,但是会导致合并后的dataframe的索引错误,ser1 = pd.Series(['A', 'B', 'C'])ser2 = pd.Series(['D', 'E', 'F'])pd.concat([ser1, s...原创 2020-03-23 16:03:30 · 1029 阅读 · 0 评论