背景(目标)
能够按照一个列索引,将数据进行分类,进而进行进一步的处理,我们就不需要用上一篇的笨办法,把他们的值赋值被数组了。本文通过访问Dataframe,Series的方法, 定义series_to_list()函数,成功实现两个目的:
- 将DataFrame转化成array的形式
- 优化方法,避开for循环+if条件语句,使代码更简洁。
- 学会使用方法(indexer),在不使用临时变量的情况下链接数据选择操作。
代码
老规矩先上代码
# -*- coding: utf-8 -*-
"""
Created on Thu May 9 04:40:12 2019
@author: alfred90
"""
import pandas as pd
import numpy as np
import math as ma
import random as rd
from random import sample
import scipy as sp
data = pd.read_excel("data.xlsx")
gbr = data.groupby("群类别")
gbr.groups
#定义一个字典,明确各类的比例
typicalFracDict = {
1:0.23,
2:0.14,
3:0.09,
4:0.2,
5: