python数据分析
文章平均质量分 56
Parzival_
要努力变强~
展开
-
Python获取列表中最大/最小的n个元素及索引
方法一:sorted函数方法二:heapq库原创 2022-03-10 21:14:08 · 3019 阅读 · 0 评论 -
「Python数据分析」pyechart绘制网络图
背景想学习用pyechart画网络图(Graph)。参考:官方文档https://pyecharts.org/#/zh-cn/intro官方示例:https://github.com/pyecharts/pyecharts-gallery遇到的第一个问题:运行不报错,但是打开生成的html,标题可以显示,没有图形。查找资料发现可能是因为找不到静态资源文件。这个问题参照官方文档就可以解决:资源引用。其中,pyecharts-assets 项目保存到能找得到的文件夹都行(最好在自己常用的画原创 2021-04-28 19:58:24 · 2309 阅读 · 4 评论 -
「Python数据分析」社会网络:networkx批量计算网络指标案例
从原始数据一步步得到合作网络之后,需要计算一些网络指标才能的到一些有意义的分析结论。networkx是python中常用的社会网络分析包,里面支持各种图以及非常多指标计算函数。官网:https://networkx.org中文网站:https://www.osgeo.cn/networkx/index.html案例接下来是由合作网络中的边作为原始数据,计算各种网络指标的一个简单示例。包括:生成网络图、计算指标、提取计算结果、存储五个基本步骤。有更多、更复杂的需求也都可以在这个框架基础上进行二次开原创 2021-02-05 01:19:44 · 2599 阅读 · 2 评论 -
「Python数据分析」CSV读取与写入的常见问题(空行、BOM、r/w/a模式、指针)
1. 多余的空行原因python正常写入文件的时候,每行的结束默认添加’\n’,即0x0D,而writerow命令的结束会再增加一个0x0D0A,因此对于windows系统来说,就是两行。采用’ b’参数,用二进制进行文件写入,系统默认是不添加0x0D的(故python2.x中的解决方式是使用“wb模式打开文件”,该方法python3.x中已不适用,会报错如下)。TypeError: a bytes-like object is required, not 'str'解决方法打开文件时添加new原创 2020-07-10 00:39:01 · 2636 阅读 · 3 评论 -
「Python数据分析」 使用邻接表存储共现/合作网络(无向图)
存储合作网络/图的一种形式是邻接表。由于网络大多是稀疏的,因此这种存储方式相比邻接矩阵空间效率更高。下面是从原始数据里构建邻接表的代码实现。构建邻接矩阵见:get_cooperate_matrix()使用的数据形式示例:其中F列是作者信息,其他列包含其他信息。输入形式:先把数据行读取到列表中。# 二维列表形式的数据co_list = [ ["AA | BB | CC | DD",2019], ["EE | BB | FF ",2018],原创 2020-07-22 22:04:32 · 1668 阅读 · 0 评论 -
「Python数据分析」 社会网络:无向有权图生成带权重的边列表(遇到浅拷贝的坑)
赋值、浅拷贝、深拷贝方法集合在文末。遇到的问题及解决方法先贴一开始犯错的代码。这个函数实现的功能是输入一个由边组成的二维列表,输出所有不重复的边以及权重(重复次数)。用于后续的社会网络分析与指标计算,因为是合作网络,所以不存在方向关系。具体输入输出格式见代码注释。def get_weighted_links(links): ''' links:是包含边的列表,[[节点1,节点2],...],边可以重复,重复次数记为权重 返回值:带权重的边列表,[[节点1,节点2,weight原创 2020-07-12 20:09:15 · 2694 阅读 · 0 评论 -
「Python数据分析」 社交网络:共现/合作网络(无向有权图)的节点列表、边列表
存储合作网络的一种形式是:节点列表+边列表。下面是从原始数据里构建这两种列表的代码实现。使用的数据形式示例:其中F列是作者信息,其他列包含其他信息。输入形式:# 二维列表形式的数据co_list = [ ["AA | BB | CC | DD",2019], ["EE | BB | FF ",2018], ["AA | GG | FF | HH | KK",2019], ["CC | DD | FF原创 2020-07-22 00:16:23 · 2946 阅读 · 0 评论 -
「Python数据分析」 社交网络:共现/合作网络(无向有权图) 生成邻接矩阵、共现矩阵
使用从数据库中导出的论文、专利数据,做作者/专利权人合作网络,实际上也就是共现网络。使用的数据形式示例:其中F列是作者信息,其他列包含其他信息。合作网络构建生成合作网络代码主函数:if __name__ =='__main__' : co_list = [ ["AA | BB | CC | DD",2019], ["EE | BB | FF ",2018], ["AA | GG | FF | HH | KK",2019],原创 2020-07-19 23:56:25 · 11484 阅读 · 8 评论