基于python的大数据分析之数据抽取

自己总结的一点小知识,相互提高吧。

# -*- coding: utf-8 -*-
"""
Created on Thu Dec 19 14:43:52 2019

Description: 关于数据抽取

@author: EricRay

"""
import numpy as np
import pandas as pd
from pandas import read_excel
from pandas import DataFrame
df = read_excel(r'E:\python\hello\files\i_nuc.xls',sheet_name='Sheet4')
print(df.head(),'\n')
#i_buc.xls会在资源中给出
"""
记录抽取:
根据一定的条件,对数据进行抽取
    df[condition]
    condition表示过滤条件
    返回值:DataFrame
condition常用类型:
比较运算:==, < , > , <= , >= , !=
范围运算:between(left,right)
空值运算:pandas.isnull(column),如df[df.title.isnull()]
字符串匹配:str.contains(patten,na = False),如df[df.title.str.contains('column',na=False)]
逻辑运算:&,| ,not(取反)
"""
print("电话为133322252452的学生:\n",df[df.电话==13322252452],'\n')
print("电话>13500000000的学生:\n",df[df.电话>13500000000],'\n')
print("电话号码在13400000000和13900000000之间:\n",df[df.电话.between (13400000000,13999999999)],'\n')
print("IP为空的:\n",df[df.IP.isnull()],'\n')
print("IP包含222:\n",df[df.IP.str.contains('222',na=False)],'\n'
  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Python Spark招聘推荐与数据分析系统是一种基于Python和Spark框架开发的用于人才招聘推荐和数据分析的系统。 首先,Python是一种通用的编程语言,拥有简洁的语法和生态系统,广泛应用于数据科学和人工智能领域。而Spark是一个高性能的分布式计算框架,能够处理大规模数据集并提供快速的计算能力。 Python Spark招聘推荐与数据分析系统借助Spark的分布式计算能力,可以对大规模的招聘数据进行处理和分析。系统可以从各种数据源中抽取和整合招聘数据,例如职位信息、候选人简历、招聘网站等,通过数据清洗和预处理,将数据转化为可供分析的格式。 在数据分析方面,系统可以运用Python数据科学库如pandas、numpy等进行数据分析和挖掘。通过对招聘数据进行统计分析、机器学习算法的建模和预测等手段,系统能够为招聘人员提供人才推荐和招聘决策的支持。例如,可以通过分析候选人的个人技能和工作经历,与企业需求进行匹配,为招聘人员提供符合条件的候选人推荐。 此外,系统还可以通过可视化技术将分析结果以图表和报表的形式展示出来,帮助招聘人员直观地理解和分析数据。这有助于他们发现招聘趋势、候选人特征以及更好地调整招聘策略。 综上所述,Python Spark招聘推荐与数据分析系统结合了Python和Spark的优势,为招聘活动和数据分析提供了强大的支持。通过系统的使用,可以提高招聘效率和准确性,优化人才匹配和决策过程,为企业的招聘工作带来更多价值。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值