大数据基础-数据抽取

字段抽取

'''
数据抽取:
    字段抽取是指抽出某列上指定位置的数据做成的新数据
    其代码格式为:slice(start,stop)
    start表示开始位置
    stop表示结束位置
'''
from pandas import read_excel
df=read_excel(r'i_nuc.xls',sheet_name='Sheet4');
print(df);
print('-------------------')
# 将电话一列转换类型
df['电话']=df['电话'].astype(str);
print(df['电话']);
print('------------------');
Leixing=df['电话'].str.slice(0,3);#切分电话前三位的数字
print(Leixing)
Leixing2=df['电话'].str.slice(3,7)#切分电话3-7位的数字
print('-------------------')
print(Leixing2)
print('-------------------')
Leixing3=df['电话'].str.slice(7,11);
print(Leixing3);

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

数据拆分

'''
字段拆分
    字段拆分就是指按指定的字符sep,拆分已有的字符串,其命令格式为:
    split(sep,n,expand=False)
    sep:表示用于分割字符串的分隔符
    n:表示分割后新增的列数
    expand:表示是否展开为数据框,默认为False
'''
from pandas import read_excel
data=read_excel(r'i_nuc.xls',sheet_name='Sheet4');
print(data);
print('-------------------')
#获取IP值并将IP值转化成字符串格式
data['IP']=data['IP'].astype(str);
print(data['IP'])
print('---------------------')
#将其进行拆分
data['IP']=data['IP'].str.strip();
data1=data['IP'].str.split('.',1,True)
print(data1);

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

随样抽取

  • 0
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值