![](https://img-blog.csdnimg.cn/20201014180756919.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python数据分析
ayixixixi
这个作者很懒,什么都没留下…
展开
-
返回某年某月份有多少天
用到了calendar模块import calendar# Returns weekday of first day of the month and number of days in month, for the specified year and month.# 返回的第一个数加上1 对应的是 当月的第一天是星期几calendar.monthrange(2020,1)返回的结果是:(2, 31)表示的含义是2020年1月1日对应的是星期三,然后一月份有31天。下面查看2020年每原创 2021-02-01 15:15:47 · 408 阅读 · 0 评论 -
《python数据处理》去除重复行
针对dataframe类型的数据,对重复行进行去除:import pandas as pddf = pd.DataFrame([[1,2,3],[2,3,4],[4,5,6],[1,2,3]])df.columns = ["A","B","C"]dfdf.drop_duplicates()原创 2020-12-26 17:49:18 · 3350 阅读 · 0 评论 -
python将列表格式的字符串转化为列表
python将列表格式的字符串转化为列表针对是列表格式的字符串,将其转化为列表形式,进而进行词频的统计。from ast import literal_evali = 0for line in df["contents_clean"]: df["contents_cleann_new"][i] = literal_eval(line) i+=1完成转换...原创 2020-12-24 15:37:05 · 1368 阅读 · 1 评论 -
papi酱微博数据可视化(截至2020年12月9日)
papi酱微博数据可视化(截至2020年12月9日)1. 爬取微博数据 使用爬虫爬取网站时,首选的是m站,其次是wap站,最后考虑PC站,因为PC站的各种验证最多。然而PC站的信息最全,可以使用高级搜索,针对某具体时间段和关键词进行爬取。一般m站都以m开头后接域名, 此次针对某微博用户进行微博数据可视化,选取m.weibo.cn去分析微博的HTTP请求。(1) 需要的模块import urllibimport urllib.requestimport timeimport jsonimpo原创 2020-12-11 21:28:54 · 3817 阅读 · 6 评论 -
pyecharts模块的使用
数据可视化pyecharts模块的使用1. pyecharts介绍pyecharts 是一个用于生成 Echarts 图表的类库。echarts 是百度开源的一个数据可视化 JS 库,主要用于数据可视化。pyecharts 是一个用于生成 Echarts 图表的类库。实际上就是 Echarts 与 Python 的对接。使用 pyecharts 可以生成独立的网页,也可以在 flask , Django 中集成使用。2. pyecharts安装pip install pyecharts我安装的是原创 2020-08-14 18:23:48 · 894 阅读 · 0 评论 -
泰坦尼克号生还情况数据分析
1.数据探索我们首先对样本数据集的结构,规律和质量进行了分析,从数据质量分析和数据特征分析等两个角度进行展开。1.1 数据质量分析训练集train.csv中样本共891个,包括以下12个特征: 特征名 含义 PassengerID 乘客ID Survived 是否生还 Pclass 船舱级别 Name原创 2020-06-15 19:03:37 · 4039 阅读 · 2 评论