Python数据获取-文件、word、Excel、数据库

数据获取是进行数据分析与数据挖掘的基础,而数据预处理是影响数据挖掘结果好坏的关键因素。


Python数据获取
数据获取是指从数据源采集数据,微数据分析与数据挖掘做数据准备的工作。

从键盘获取数据

>>>value=input()
>?"YEN"
>>>value
'"YEN"'

从文本文件读取数据

#打开文件
# r 只读     w 只写       a 附加到文件末尾        r+读写
# 如果要以二进制的方式打开,需要在mode后面加字符"b" 比如"rb"  "wb"
f=open("G:\\PythonTest.txt","r")

# 读取文件数量,括号内不加参数默认全部读取,加参数读取指定数量
print("读取全部内容:"+f.read())
# 关闭文件
f.close()

这里写图片描述


# 读取文件一行内容
print("读取一行内容:"+f.readline())

# 读取文件所有行到数组里[line1,line2...linen]
print(f.readlines())
print("读取数组内容:")
lines=f.readlines()
for line in lines:
    line=line.strip()
    print(line)

这里写图片描述

这里写图片描述

import linecache
#与打开文件方式不同,linecache模块可以进行缓存优化,提高文件的读取效率
print(linecache.getline("G:\\PythonTest.txt",2))  #读取第两行

这里写图片描述

从word读取数据

from win32com  import client # 从win32com包引入client包
# import win32com.client


word=client.Dispatch('Word.Application')  # 创建对象实例

doc=word.Documents.Open(r'G:\Demo.doc') # 打开

print(doc.content)  #打印

doc.Close() #关闭

word.Quit()

通过Excel读取数据

# 导入模快
import xlrd

# 打开excel
data=xlrd.open_workbook('G:\datatest.xls')

# 1.查看并打印文件包含的sheet名称
sheet_names=data.sheet_names()

print(sheet_names)

# 通过序列顺序获取
table=data.sheet_by_index(0)

# 2.获取第一张工作表的行数和列数
nrows=table.nrows
print(nrows)

ncols=table.ncols
print(ncols)

# 3.获取第一张工作表的第二行和第二列的值(数组)
print(table.row_values(2))
print(table.col_values(2))

# 4.获取特定单元格的值
print(table.cell_value(0,0))
print(table.cell_value(0,1))

表中的数据
表中的数据

运行结果
这里写图片描述

从Mysql数据库获取数据

import pymysql

#打开数据库
db=pymysql.connect('localhost','root','admin','messagedb')

#使用cursor()获取操作游标
cursor=db.cursor()

# 使用execute执行sql语句
cursor.execute("select version()")

# 使用fetchone()方法获取一条数据
data=cursor.fetchone()

print("数据库版本:")
print(data)
db.close()

这里写图片描述

import pymysql

#打开数据库
db=pymysql.connect('localhost','root','admin','messagedb')

#使用cursor()获取操作游标
cursor=db.cursor()

try:
    # 使用execute执行sql语句
    cursor.execute("select * from tb_user")

    result=cursor.fetchall()

    for row in result:
        name=row[1]
        password=row[2]
        print(name)
        print(password)
except:
    print("操作异常")


db.close()

这里写图片描述
这里写图片描述

从互联网上获取数据
爬虫,即网络爬虫,自动抓取万维网信息的程序或者脚本。

  • 2
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值