- 博客(4)
- 资源 (3)
- 收藏
- 关注
原创 Python在Dataframe中新添加一列
在敲代码的过程中,老是会遇到在Dataframe中新添加一列的情况,每次都要重新google,这次做个记录。其实在Dataframe中新添加一列很简单,直接指明列名,然后赋值就可以了。import pandas as pddata = pd.DataFrame(columns=['a','b'], data=[[1,2],[3,4]])data>>> dat...
2019-08-13 16:31:25 279405 7
原创 【Python】内置数据集介绍
在动手操作一个算法的时候,可能需要自己生成数据集。Python sklearn给我们提供了一些有用的数据生成器和数据加载工具,所以就不需要我们写代码来生成数据啦。下面介绍几个大家都比较常用的数据集:数据加载工具这个工具下面一共有24个数据集,只要直接导入就可以使用,就像导入一个csv文件一样。1.datasets.load_iris()这个数据集应该是最常见的了,经常看见网上博主们...
2019-08-28 17:52:30 8864
原创 Python pandas处理(提取/删除)DataFrame中的重复行
在处理数据的时候,我们经常会遇到处理重复数据的情况。根据需求一般有两种情况,下面我们分别针对两种情况举????:第一种情况,去掉重复的数据:### 构造数据data = pd.DataFrame(data=[['a',1],['a',2],['b',1],['b',2],['a',1]],columns=['label','num'])dataOut[17]: label nu...
2019-08-22 10:47:29 37255 2
原创 使用pyecharts画词云(wordcloud)
词云是一个比较常见的数据可视化方法,通过词的大小可以让人一眼就可以看到哪个词比较突出。我现在知道的画词云的方法有两种,一种是用pyecharts,另一种是用python的wordcloud包。这里主要讲使用pyecharts画词云的方法。pyecharts github的链接:https://github.com/pyecharts/pyecharts,但是感觉写的不是很清楚啊用pye...
2019-08-07 17:22:47 13913
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人