目录
- dataframe相当于 表格型的数据结构,含有一组有序的列
- 可视为series 的字典(列集合)
默认已引入
import numpy as np
import pandas as pd
from pandas improt DataFrame,Series
1 用网站的数据源 创建
link='复制网址'
import webbrowser
webbroswer.open(link)
结果为TRUE则可看
2 在网站复制表格(到 剪贴板)
df=pd.read_clipbroad()
运行 df 就显示复制的 表
3 查某列数据
每列为一个series
- df.列名
- df ['列名']
4 返回所有列名称
- df.columns
5 取其中几列 赋值 生成新的dataframe
- df_new = DataFrame ( df, columns = [ '列1', '列2' ] )
可新增原本不存在的列名,内部series会对应为 NaN,如 给新的列'Oct'赋值;
可用index表示坐标位置,精确赋值。如 给Oct的第2、3行赋值:
- df_new [ 'Oct' ] = range (0,10)
- df_new [ 'Oct' ] = Series( [100,200] , index[2, 3] )
6 访问某几行
[ 起始行数 从0开始:结尾行数 ]
第1行到第3行,类似切片 ;用loc 访问第1行,loc 相当于标签:
- df [ 0:2 ]
- df. loc [ 0 ]
7 访问某几行的某几列
用loc表示行的起始,再跟精确列名(第3到4行,和列名);
用 iloc 表 行和列的起始(第1到3行,第1到3列)
- df. loc [ [2,5 ] , ['Oct' ,'列名2' ] ]
- df. iloc [0:3, 0:3 ]
8 访问前几 / 后几列
- df.head ()
- df.tail ()