Excel Spreadsheets
对excel表格数据的操作步骤:
首先利用openptxl.load_workbook打开工作簿–>确定数据所在的sheet–>sheet.cell确定所用数据的cell–>cell.value得到数据;
柱形图:
首先得到reference对象(参数:数据位置)–>定义barchart对象–>数据送给barchart对象–>将图表画在sheet中(参数:图表左上顶点)
# Excel Spreadsheets
import openpyxl as xl
from openpyxl.chart import BarChart, Reference
wb = xl.load_workbook('transactions.xlsx')
sheet = wb['Sheet1']
cell = sheet['a1'] # 表示第a列、第2行
print(cell.value) # 定位在a1的值
cell = sheet.cell(1, 1) # 起始于2行2列,该形式与a1等价
print(cell.value)
print(sheet.max_row)
for row in range(2, sheet.max_row+1): # 以表格的行作为循环
cell = sheet.cell(row, 3) # 依次取出第三列的cell,即表格中的格子对象
corrected_price = cell.value * 0.9 # 格子中的数*0.9
corrected_price_cell = sheet.cell(row, 4) # 定位第四列的cell
corrected_price_cell.value = corrected_price # 将计算后的值放入格子中
values = Reference(sheet, # 确定画图数据的位置
min_row=2,
max_row=sheet.max_row,
min_col=4,
max_col=4)
print(values)
chart = BarChart() # 定义BarChart()对象类型
chart.add_data(values) # 将数据添加到chart中
sheet.add_chart(chart, 'e2') # chart顶点在e2
wb.save('transactions2.xlsx')
Jupyter
Jupyter新建的python文件后缀名是.ipynb,与其他编辑器相比的优点是,方便查看数据,可以分块运行,分块输出
get到一个机器学习实战网站kaggle