数据可视化
文章平均质量分 52
数据可视化
我的Python教程
零基础Python系列教程,喜欢的老铁可以多多点赞!
展开
-
Python教程:(Sweetviz)仅三行代码就能实现数据可视化
Sweetviz 能够自动分析数据集的特征和属性,并生成详细的 EDA 报告。用户无需手动编写复杂的代码,只需简单调用 Sweetviz 函数即可生成完整的报告。Sweetviz 生成的报告是交互式的,用户可以通过简单的点击和拖拽来进行探索和导航。Sweetviz是一个用于生成数据集探索性数据分析(EDA)报告的Python库。Sweetviz 提供了多种可视化图表,包括直方图、箱线图、核密度图、散点图等,以帮助用户更直观地理解数据分布和特征之间的关系。确保你已经安装了Sweetviz库。原创 2024-03-31 13:23:45 · 293 阅读 · 0 评论 -
Pillow教程03:图像处理的基本步骤+分离split+合并merge+混合blend+composite遮罩
4.Image.blend():用于将两个图像混合在一起,根据指定的alpha值来决定每个图像在混合结果中的贡献程度。alpha值范围从0(完全第一个图像)到1(完全第二个图像),当取值=0.5时,为两个图像的中合,因此该值的大小决定了两个图像的混合程度。mask是一个遮罩图像,它决定了 image2 在合成图像中的哪些部分应该是可见的,哪些部分应该是透明的。图像混合与透明度调整:使用Image.blend()方法混合两张图像,通过调整alpha值来控制图像的混合程度。加载图像到内存中,准备进行后续处理。原创 2024-03-25 12:21:06 · 1583 阅读 · 0 评论 -
Python教程95:jieba去掉停用词+词频统计+tokenize分词位置的示例用法
4.jieba.tokenize示例用法:返回一个生成器,每次迭代返回一个包含三个元素的元组(word, start, end),其中 word 是分词结果中的一个词,start 和 end 分别是该词在原始句子中的起始和结束位置(基于字符索引)。通用量词:如“一些”、“很多”、“这个”、“那个”等。代词:如“我”、“你”、“他”、“她”、“它”等。连词:如“和”、“与”、“但是”、“而且”等。介词:如“在”、“到”、“从”、“对于”等。助词:如“的”、“了”、“着”、“过”等。原创 2024-03-22 12:59:16 · 2014 阅读 · 0 评论 -
Matplotlib如何显示多张图片(管理多个子图)
两个示例中,subplot 和 subplots 方法都用于创建包含两个子图的图形。subplot 方法通过指定行数、列数和面板编号来添加子图,而 subplots 方法则返回一个包含 Figure 和 Axes 对象的元组,使得操作更加直观和灵活。Matplotlib 可以使用 subplot 或 subplots 方法来创建子图,从而在同一窗口中显示多张图片。subplots 方法返回一个包含 Figure 对象和一组 Axes 对象的元组,可以更方便地操作和管理多个子图。2.使用 subplots。原创 2024-03-19 12:00:48 · 2749 阅读 · 0 评论 -
WordCloud模块中to_image的用法
上述示例中,首先创建了一个WordCloud对象,并使用generate方法生成词云。然后,通过调用to_image方法将词云转换为PIL.Image对象,并使用show方法显示图像。在WordCloud模块中,to_image方法用于将词云转换为PIL.Image对象。执行该方法后,词云将转换为PIL.Image对象,并返回给调用者。原创 2023-09-03 20:40:54 · 123 阅读 · 0 评论 -
WordCloud模块中process_text的用法
此外,process_text函数返回的结果是一个字典,其中包含了分词后的token以及对应出现的次数。如果不需要统计词频,可以只使用分词结果。需要注意的是,process_text函数并不会对文本进行编码解码、去重等操作,如果需要执行这些操作,需要额外编写代码实现。经过process_text处理后,文本被分成了多个token,并统计了每个token出现的次数。函数主要用于对文本进行预处理,包括分词、去除停用词、去除标点符号等操作。经过process_text处理后的文本可以用于生成词云。原创 2023-09-03 20:45:32 · 213 阅读 · 0 评论 -
WordCloud模块中如何筛选出重要的关键词
接下来,我们通过sorted()函数和lambda函数对所有单词按照权重值进行排序,并选择前N个关键词作为重要关键词。基于TextRank算法的关键词筛选:TextRank算法是一种基于图的关键词抽取算法,它通过构建文本的上下文关系图,并计算每个单词的PageRank值来评估其重要性。词频统计:统计每个单词在文本中出现的次数,出现次数越多的单词可能越重要。基于TF-IDF的关键词筛选:使用TF-IDF算法计算每个单词的权重,然后根据权重值对单词进行排序,选择权重值较高的单词作为重要关键词。原创 2023-09-03 20:36:15 · 80 阅读 · 0 评论 -
Python源码05:使用Pyecharts画词云图图
*Pyecharts是一个用于生成 Echarts 图表的 Python 库。Echarts 是一个基于 JavaScript 的数据可视化库,提供了丰富的图表类型和交互功能。**通过 Pyecharts,你可以使用 Python 代码生成各种类型的 Echarts 图表,例如折线图、柱状图、饼图、散点图等。Pyecharts 提供了许多方便的 API 和方法,可以让你轻松地创建和定制自己的图表。Scatter():用于创建散点图。Line():用于创建折线图。Pie():用于创建饼图。原创 2023-08-15 18:50:43 · 2051 阅读 · 0 评论 -
我的Python教程:使用Pyecharts画关系节点图
【代码】我的Python教程:使用Pyecharts画关系节点图。原创 2023-08-08 13:31:33 · 587 阅读 · 0 评论 -
Pandas教程09:DataFrame数据可视化绘制折线图、柱状图、散点图、直方图等
pandas.plot() 是 pandas 库中的一个非常方便的函数,用于绘制各种图形,例如线图、柱状图、散点图等。----------★★历史博文集合★★----------原创 2023-12-07 13:49:32 · 4571 阅读 · 0 评论