《python数据处理》
《python数据处理》代码复现与错误修正
python__reported
python菜鸟入门,期待成为数据分析的大神;
互相帮助!
展开
-
《Python数据处理》第十四章笔记
《Python数据处理》第十四章笔记一、Python日志二、邮件一、问题:一、Python日志源码及其注释import loggingfrom datetime import datetimedef start_logger():‘’‘日志初始化设置、文件名(时间)、DEBUG为调试级别(级别导致输出内容的不同)、日志的记录格式、日期格式’’’logging.basicConfig(filename='daily_report_error_%s.log' %原创 2020-05-19 18:18:25 · 2443 阅读 · 0 评论 -
plotly动态图片保存问题:The orca executable is required to export figures as static images, but it could not
plotly动态图片保存问题:The orca executable is required to export figures as static images, but it could not found on the sysytem path一、plotly图片输出一、plotly图片输出使用npm即node.js下载nodejs这个node.js有个讨厌的自动安装python的毛病,没有找到python就会自动安装,还要安装到C盘。我的python为3.7,不在C盘,导致凭空安装一个py原创 2020-05-19 17:12:55 · 3551 阅读 · 0 评论 -
《Python数据处理》10.2.3地图笔记
《Python数据处理》10.2.3地图笔记一、源码问题二、render_to_png一、源码问题源码worldmap_chart = pygal.Worldmap()worldmap_chart.title = 'Child Labor Worldwide'cl_dict = {}for r in ranked.rows: cl_dict[r.get('country_code_complete').lower()] = r.get('Total (%)')worldmap_chart原创 2020-05-18 21:17:17 · 2424 阅读 · 0 评论 -
《Python数据处理》9.1.6创建分组笔记:NameError:name text_type is not defined
《Python数据处理》9.1.6创建分组笔记:NameError:name text_type is not defined一、现象二、解决方法(一)查阅文档(二)Github中的问题寻找一、现象源码:import jsonfrom 数据集连接再测试 import cpi_and_climport pprintimport agatepath = 'I:\\360下载\\data-wrangling\\data\\chp9\\earth.json'country_json = json原创 2020-05-17 22:03:38 · 3328 阅读 · 0 评论 -
《Python数据处理》9.1.2探索表函数笔记:print不输出期望值而是输出内存地址或者数据类型
print输出内存地址或者数据类型一、输出内存地址、数据类型(一)内存地址(二)数据类型二、结论及解决之道一、输出内存地址、数据类型(一)内存地址a = 1print(id(a))直接输出内存地址是因为调用了id()方法print()方法在不调用id()方法时不会输出内存地址(二)数据类型但是有长得很像内存地址的数据类型其中at 0x00这样的内容原本以为是内存地址的,试图通过内存地址来输出相应的值,参见《https://blog.csdn.net/ainu2919/article/原创 2020-05-17 21:22:47 · 3638 阅读 · 0 评论 -
《Python数据处理》9.1.2探索表函数笔记:agate模块的关键为table
《Python数据处理》9.1.1导入数据笔记一、问题一一、问题一源码:most_egregious = table.order_by('Total (%)', reverse=True).limit(10)报错:KeyError: 'Total (%)'可能是自己写错了,但是agate出来的也是没有找出来哪里错了只能修改为most_egregious = table.order_by(table.column_names[1], reverse=True).limit(10)原创 2020-05-16 20:59:37 · 2554 阅读 · 0 评论 -
《Python数据处理》9.1.1导入数据笔记:agate.exceptions.CastError: Can not parse value as Decimal. Error at row
《Python数据处理》9.1.1导入数据笔记:agate.exceptions.CastError: Can not parse value as Decimal. Error at row一、报错现象:二、解决方法第一步:第二步:三、疑惑成功去掉报错后的截图一、报错现象:源码:def agate_data_check(self): '''数据类型猜测,将xlrd数据类型转为agate数据类型''' text_type = agate.Text() number_typ原创 2020-05-16 10:37:37 · 3829 阅读 · 0 评论 -
《Python数据处理》7.2.7笔记:读取方式不能是二进制的即rb改为r
《Python数据处理》7.2.7笔记:读取方式不能是二进制的即rb改为r一、源码有误之处二、修改一、源码有误之处可能是自己买的盗版的印刷问题,但是更可能是源码错误源码:from csv import DictReaderimport pprintpath = 'I:\\360下载\\data-wrangling\\data\\unicef\\mn.csv'data = DictReader(open(path, 'rb'))data_row = [d for d in data]d原创 2020-05-15 09:00:57 · 1983 阅读 · 0 评论 -
《Python数据处理》7.2.4笔记:寻找唯一键的源码修改——由于zip方法
《Python数据处理》7.2.4笔记:寻找唯一键的源码修改——由于zip方法一、原因:zip方法二、修改后一、原因:zip方法参考《python中使用zip函数出现》,原因是为了节约内存,python3基于此对此进行了优化,输出只输出对象的内存位置而不打印出来。而在python2中可以直接输出到屏幕,解决方法:需要增加list源码:set_keys = set( ['%s-%s-%s' % (x_[0][1], x_[1][1], x_[2][1]) for x_ in zipp原创 2020-05-14 20:35:20 · 1691 阅读 · 0 评论 -
《Python数据处理》7.2.1笔记: zip函数输出为“zip object at 0x00000272CAEDD488”
《Python数据处理》7.2.1笔记:zip函数输出为“zip object at 0x00000272CAEDD488”一、现象二、原因三、解决办法(一)增加一个list()(二)进行美化一、现象书中位置:2合并问题与答案的 第三个代码处:#变量名有不同,原为zipped_datazip_data = []for drow in new_data: zip_data.append(zip(head_row, drow)) #作者是直接打印的 zip_data[原创 2020-05-12 18:47:33 · 5929 阅读 · 1 评论 -
《Python数据处理》6.7.3笔记:Sqlite3数据库的创建命令、No module named 'MySQLdb'以及dataset操作MySQL
《python数据处理》6.7.3笔记:sqlite3数据库的创建命令一、创建不成功的源码一、创建不成功的源码源码:sqlite3 data_wrangling.db报错:'sqlite3' 不是内部或外部命令,也不是可运行的程序或批处理文件。二、成功创建的代码源自《python数据分析基础》import sqlite3con = sqlite3.connect('data_wrangling.db')con.commit()...原创 2020-05-12 14:48:04 · 1577 阅读 · 0 评论 -
《python数据处理》5.2.2笔记:cmd中py文件运行命令
《python数据处理》5.2.2笔记:cmd中py文件运行命令一、问题二、解决思路一、问题在cmd中直接运行书中的源码:注:修改了范例pdf2txt.py -o I:\桌面文件\捕诉模式\恢复重建以来检察机关内设机构改革的历史经验与启示_邱学强.txt I:\桌面文件\捕诉模式\恢复重建以来检察机关内设机构改革的历史经验与启示_邱学强.pdf会出现pd2txt.py文件即:然而txt的内容就没有二、解决思路1、可能是环境问题?os.system('pdf2txt.py -o I:\桌原创 2020-05-12 08:11:28 · 1583 阅读 · 0 评论 -
解决:slate报错 AttributeError: module 'importlib._bootstrap' has no attribute 'SourceFileLoade
在学习《python数据处理》时遇到了安装slate出错,这个问题不仅在slate、在之前按照pycurl时也出现,一直没有解决,原因差不多,都是这个报错,涉及python setup.py egg_info Check the logs for full command output.报错内容:ERROR: Command errored out with exit status 1: c...原创 2020-05-01 20:37:39 · 5789 阅读 · 0 评论 -
《python数据处理》pdf文件解析模块:pdfminer和pdfplumber
pdfplumber以pdfminer为基础,但是pdfminer的操作过于复杂且代码过于冗长。注:pdfminer在python3.0以上为pdfminer3kpdfminer3k 实现解析的代码:from pdfminer.pdfparser import PDFParserfrom pdfminer.pdfdocument import PDFDocumentfrom pdfmi...原创 2020-05-01 17:47:03 · 2487 阅读 · 0 评论