话不多说,直接上脚本代码。代码不规范仅做记录使用
import cx_Oracle
import pandas as pd
import matplotlib.pyplot as plt
import datetime
import xlwt
conn = cx_Oracle.connect('sys/root@127.0.0.1:1521/orcl')
# 操作游标
cursor = conn.cursor()
result = cursor.execute(r"select column from table order by xxx")
# 一次读出所有内容到内存中,性能较差
all_data = cursor.fetchall()
# 给列取上名字
chart = pd.DataFrame(all_data, columns=['one'])
# 用数组去接收分组之后的值
# chart['one']//5*5 表示数字每五个分一组
ls = []
# 整句表示的是对取出来的整列数字进行分组统计,算出每一组的占比
ls = chart.groupby(chart['one']//5*5).count() / len(chart)
print(ls['one'])
# 表示将整列数字分组之后的占比存到txt中
text = chart.groupby(chart['one']//5*5).count() / len(chart)
text.to_csv('point.txt', sep='\t', index=False)
cursor.close()
conn.close()
值得注意的是:
1 直接对pandas(DataFrame)进行打印的时候,虽然只有一列数字,但是在命令行中会出现两列数字。类似:
100 0.11123
105 0.111111
110 0.222222
但是存到txt文本后,只有
0.11123
0.111111
0.222222
2 chart[‘one’]//5*5是两个斜杠