python文件处理
初来乍到小penguin
这个作者很懒,什么都没留下…
展开
-
datawhale学习-数据可视化(3)
datawhale学习-数据可视化(3)一、子图1. 使用 plt.subplots 绘制均匀状态下的子图二、子图上的方法作业作业1. 墨尔本1981年至1990年的每月温度情况作业2:画出数据的散点图和边际分布一、子图1. 使用 plt.subplots 绘制均匀状态下的子图返回元素分别是画布和子图构成的列表,第一个数字为行,第二个为列figsize 参数可以指定整个画布的大小sharex 和 sharey 分别表示是否共享横轴和纵轴刻度tight_layout 函数可以调整子图的相对大小使字原创 2020-12-20 20:54:30 · 295 阅读 · 2 评论 -
datawhale组队学习 Task02 - 艺术画笔见乾坤
一、概述1. matplotlib的三层apimatplotlib的原理或者说基础逻辑是,用Artist对象在画布(canvas)上绘制(Render)图形。就和人作画的步骤类似:准备一块画布或画纸准备好颜料、画笔等制图工具作画所以matplotlib有三个层次的API:matplotlib.backend_bases.FigureCanvas 代表了绘图区,所有的图像都是在绘图区完成的matplotlib.backend_bases.Renderer 代表了渲染器,可以近似理解为画笔,控原创 2020-12-18 22:45:04 · 328 阅读 · 1 评论 -
datawhale组队学习——数据可视化(1)
第一回:Matplotlib初相识一、认识matplotlibMatplotlib是一个Python 2D绘图库,能够以多种硬拷贝格式和跨平台的交互式环境生成出版物质量的图形,用来绘制各种静态,动态,交互式的图表。Matplotlib可用于Python脚本,Python和IPython Shell、Jupyter notebook,Web应用程序服务器和各种图形用户界面工具包等。Matplotlib是Python数据可视化库中的泰斗,它已经成为python中公认的数据可视化工具,我们所熟知的pand原创 2020-12-14 20:57:29 · 76 阅读 · 0 评论 -
20201203
推荐系统新闻推荐——特征工程制作特征和标签, 转成监督学习问题导包df节省内存函数数据读取训练和验证集的划分获取历史点击和最后一次点击读取训练、验证及测试集读取召回列表读取各种EmbeddingWord2Vec训练及gensim的使用读取文章信息读取数据对训练数据做负采样将召回数据转换成字典特征工程制作与用户历史行为相关特征用户和文章特征用户相关特征分析一下点击时间和点击文章的次数,区分用户活跃度分析一下点击时间和被点击文章的次数, 衡量文章热度特征用户的系列习惯用户的设备习惯用户的时间习惯用户的主题爱好用原创 2020-12-03 06:58:37 · 157 阅读 · 0 评论 -
2020-11-27
系列文章目录提示:这里可以添加系列文章的所有文章的目录,目录需要自己手动添加例如:第一章 Python 机器学习入门之pandas的使用提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档推荐系统入门实战-新闻推荐系列文章目录数据分析建议一、pandas是什么?导入包读取数据数据预处理计算用户点击rank和点击次数数据浏览¶总结数据分析数据分析的价值主要在于熟悉了解整个数据集的基本情况包括每个文件里有哪些数据,具体的文件中的每个字段表示什么实际含义,以及数据集中特征之间的相关性原创 2020-11-27 23:31:47 · 85 阅读 · 0 评论 -
将json文件转为xml,没有换行符问题解决
将json文件转为xml,没有换行符问题解决将json转为xml的方法,网上大概有两种方案,dom和elementtree我习惯于使用后者了,可是这种方法书写出的xml没有换行符号,实在不忍直视。于是找到了以下代码片段,来解决这一问题,非常简单:def indent( elem, level=0): i = "\n" + level*" " if len(elem): if not elem.text or not elem.text.strip():原创 2020-09-23 12:14:05 · 625 阅读 · 0 评论