自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(29)
  • 收藏
  • 关注

原创 python画柱状图bar:并列柱状图

参数:1.alpha:柱状图形的透明度2.width:柱形图的宽度3.edgecolor:图形的边缘颜色4.label:图例,每个图像代表的含义 让图例展示出来的代码,并可指定其在图形中的位置5.plt.legend("upper right")方法一:import numpy as npimport pandas as pdimport matplotlib.p...

2019-10-07 19:45:40 12415

原创 2019年大数据网络赛 第六部分:综合题 第三问

3 使用Spark统计《烈火英雄》相关文章关于评论人性别的占比(请提供完整代码和结果截图5分)。解析:题目要求用spark,我用了python的方法round的用法:可四舍五入保留小数例子:pi = 3.141592653589793round(pi) #输出整数round(pi, 2) #保留两位小数输出round(pi, 3) #保留三位小数输出format的用法:...

2019-09-28 20:56:21 400

原创 2019年大数据网络赛 第六部分:综合题

题目:4 统计关于《上海堡垒》话题的舆情走势,已知其上映时间为2019-08-09。(本题可以使用你擅长的编程语言和框架)解析:由题目可知,数据是包含上海堡垒和烈火英雄的,但题目要求只统计有关上海堡垒的,所以要从数据中将所有有关上海堡垒的提取出来,这时我们可以使用一种提取我们所需要内容的代码:如下: bool = df["x"].str.contains("y")filter_...

2019-09-28 20:17:10 653

原创 2019年大数据网络赛 第四部分:可视化 柱线混合图:twinx()

第三问:利用柱线混合图形画出合肥市,高新区,庐阳区的pm2.5的值。要求将输出的折线图保存成图像文件,X轴表示时间,柱状表示 高新区 的pm2.5的值,线形表示 庐阳区的pm2.5的值。(5分)要求:图形中含有图例说明:此题主要利用了twinx()将柱形图与折线图进行连接放在一起ax1 = fig.add_subplot(111)ax2 = ax1.twinx()代码如下:...

2019-09-28 17:46:31 1130 3

原创 2019年大数据网络赛 第四部分:可视化,柱状图和折线图

第一问:利用Bar图输出城市(city)合肥、黄山、芜湖的PM2.5指数,Y轴表示平均数,;X轴表示城市名称代码如下:import numpy as npimport pandas as pdimport matplotlib.pyplot as pltfrom pandas import Series,DataFramedf = pd.read_csv("new1")plt...

2019-09-28 17:11:22 1225 1

原创 饼图的用法和举例以及append连接数据的用法

1、pie(x, explode, labels, colors, autopct, pctdistance, shadow, labeldistance, startangle, radius, counterclock, wedgeprops, textprops, center=(0,0), frame=False)x:x为每一部分标签的数据大小labels:饼图的标签,即代表每一块...

2019-08-28 21:49:20 1103

原创 有关pandas中set_index的使用和例子

1.set_index可设置单索引和复合索引用法:DataFrame.set_index(keys, inplace=True/False, drop=True, append=False, verify_integrity=False)单索引:s = s1.set_index("a")复合索引:s = s1.set_index(["a","b"])2.reset_index可以还原索...

2019-08-28 20:27:22 1030

原创 南京各区域二手房平均单价:平均值mean

import numpy as npimport pandas as pdimport matplotlib.pyplot as pltfrom pandas import DataFrame,Series#制定用编译器python就行# df = pd.read_csv("home1.csv",engine='python')#可以把格式正确的重新写入一个csv 也可以不用# ...

2019-08-27 19:52:42 172

原创 python的折线图以及折线图转折点 marker 样式的设置

import numpy as npimport pandas as pdimport matplotlib.pyplot as pltfrom pandas import DataFrame,Seriesdf = pd.read_csv("homenew.csv")plt.rcParams['font.sans-serif']=['SimHei']df.quyu.value_co...

2019-08-19 18:22:27 11166

原创 python中的柱状图list ,bar的用法

import numpy as npimport pandas as pdimport matplotlib.pyplot as pltfrom pandas import DataFrame,Seriesdf = pd.read_csv("shujunew 1")plt.rcParams['font.sans-serif']=['SimHei']# df = pd.read_cs...

2019-08-19 12:12:45 1917

原创 2018年专科组 大数据比赛 第三部分 数据可视化 第5小问

import numpy as npimport pandas as pdimport matplotlib.pyplot as pltfrom pandas import DataFrame,Seriesdf = pd.read_csv("../tiantic.txt",sep='\t')fig = plt.figure(figsize=(12,6))plt.rcParams[...

2019-08-15 17:27:46 238

原创 2018年大数据比赛专科组 第3部分 数据可视化第四小问

import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport mpl_toolkits.axisartist.axislines as axislinesfrom pandas import DataFrame,Seriesdf = pd.read_table("tiantic")# 利用柱状...

2019-08-10 22:33:27 358

原创 2018年大数据比赛专科组 第3部分 数据可视化

import numpy as npimport pandas as pdimport matplotlib.pyplot as pltfrom pandas import DataFrame,Seriesdf = pd.read_table('tiantic')# 扇形图,也就是饼图s1 = (df['Sex'] == 'female').sum()s2 = (df['Sex...

2019-08-10 16:04:38 603

原创 2018年大数据比赛本科组 第3题 电影数据分析

import numpy as npimport pandas as pdimport matplotlib.pyplot as pltfrom pandas import Series,DataFramedf = pd.read_table("H:\PythonData\\top250_f1.txt",encoding='utf8',delimiter='\t') #第一问:...

2019-08-08 13:41:40 747

原创 2018年大数据比赛本科组 第4题数据可视化 有关气象信息

import numpy as npimport pandas as pdimport matplotlib.pyplot as pltfrom pandas import Series,DataFrame# 第一问:通过折线图展示2018年9月份天每天最高温度变化图和最低温度变化图df = pd.read_table('weather.txt')df_new = df.loc[d...

2019-08-04 18:41:19 685

原创 python可视化之雷达图

import numpy as npimport matplotlib.pyplot as plt# 标签 labellabels = np.array(['3','5','6','3','1','3','3','2'])# 数据个数dataLenth = 8# 数据data = np.array([3,5,6,3,1,3,3,2])# 设置雷达图的角度,用于平分切开一个圆面,d...

2019-08-04 15:50:01 6004 3

原创 python的可视化

import pandas as pdimport numpy as npimport matplotlib.pyplot as plt折线图:plot柱形图:plot(kind='bar')# 纵向柱形图:plot.bar()# 横向柱形图:plot.barh()#堆积柱形图:plot.bar(stacked=True)直方图:plot.hist()# 透明度:alph...

2019-08-02 20:48:09 156

原创 一份用户消费行为的分析报告

# 这是一份数据分析报告# 围绕一下几个部分进行分析# 1、描述统计# 2、用户复购率的计算# 3、复购率import pandas as pdimport numpy as npimport matplotlib.pyplot as plt# %matplolib inline# 列名单独取了一个列表的形式columns = ['user_id','order_dt','o...

2019-08-02 17:09:02 1285

原创 7-62 会场安排问题

7-62会场安排问题(20分)题目来源:王晓东《算法设计与分析》假设要在足够多的会场里安排一批活动,并希望使用尽可能少的会场。设计一个有效的 贪心算法进行安排。(这个问题实际上是著名的图着色问题。若将每一个活动作为图的一个 顶点,不相容活动间用边相连。使相邻顶点着有不同颜色的最小着色数,相应于要找的最小 会场数。)输入格式:第一行有 1 个正整数k,表示有 k个待安排的活动。...

2019-03-21 19:32:39 1532

原创 2018年第九届蓝桥杯题目 第九题 标题:全球变暖

标题:全球变暖你有一张某海域NxN像素的照片,".“表示海洋、”#"表示陆地,如下所示:….##….##……##.…####.…###.…####其中"上下左右"四个方向上连在一起的一片陆地组成一座岛屿。例如上图就有2座岛屿。####由于全球变暖导致了海面上升,科学家预测未来几十年,岛屿边缘一个像素的范围会被海水淹没。具体来说如果一块陆地像素与海洋相邻(上下左右四个相邻像素...

2019-03-19 16:44:36 983 3

原创 第九届蓝桥杯省赛C++B组 日志统计

题目:小明维护着一个程序员论坛。现在他收集了一份”点赞”日志,日志共有N行。其中每一行的格式是:ts id 表示在ts时刻编号id的帖子收到一个"赞"。现在小明想统计有哪些帖子曾经是"热帖"。如果一个帖子曾在任意一个长度为D的时间段内收到不少于K个赞,小明就认为这个帖子曾是"热帖"。具体来说,如果存在某个时刻T满足该帖在[T, T+D)这段时间内(注意是左闭右开区间)收到不少于K个...

2019-03-14 20:56:40 110

原创 7-36 集合相似度

7-36集合相似度(25 分)给定两个整数集合,它们的相似度定义为:N​c​​/N​t​​×100%。其中N​c​​是两个集合都有的不相等整数的个数,N​t​​是两个集合一共有的不相等整数的个数。你的任务就是计算任意一对给定集合的相似度。输入格式:输入第一行给出一个正整数N(≤50),是集合的个数。随后N行,每行对应一个集合。每个集合首先给出一个正整数M(≤10​4​​),是集合中...

2019-03-11 22:38:41 160

原创 7-52 最长连续递增子序列

7-52最长连续递增子序列(20 分)给定一个顺序存储的线性表,请设计一个算法查找该线性表中最长的连续递增子序列。例如,(1,9,2,5,7,3,4,6,8,0)中最长的递增子序列为(3,4,6,8)。输入格式:输入第1行给出正整数n(≤10​5​​);第2行给出n个整数,其间以空格分隔。输出格式:在一行中输出第一次出现的最长连续递增子序列,数字之间用空格分隔,序列结尾不能...

2019-03-10 16:14:48 592

原创 7-8 朋友圈

7-8 朋友圈 (25 分)某学校有N个学生,形成M个俱乐部。每个俱乐部里的学生有着一定相似的兴趣爱好,形成一个朋友圈。一个学生可以同时属于若干个不同的俱乐部。根据“我的朋友的朋友也是我的朋友”这个推论可以得出,如果A和B是朋友,且B和C是朋友,则A和C也是朋友。请编写程序计算最大朋友圈中有多少人。输入格式:输入的第一行包含两个正整数N(≤30000)和M(≤1000),分别代表学校的学生总...

2019-03-09 23:23:14 106

原创 7-9 魔法优惠券

7-9 魔法优惠券 (25 分)在火星上有个魔法商店,提供魔法优惠券。每个优惠劵上印有一个整数面值K,表示若你在购买某商品时使用这张优惠劵,可以得到K倍该商品价值的回报!该商店还免费赠送一些有价值的商品,但是如果你在领取免费赠品的时候使用面值为正的优惠劵,则必须倒贴给商店K倍该商品价值的金额…… 但是不要紧,还有面值为负的优惠劵可以用!(真是神奇的火星)例如,给定一组优惠劵,面值分别为1、2、...

2019-03-09 17:49:14 354

原创 7-2 求前缀表达式的值

7-2 求前缀表达式的值 (25 分)算术表达式有前缀表示法、中缀表示法和后缀表示法等形式。前缀表达式指二元运算符位于两个运算数之前,例如2+3*(7-4)+8/4的前缀表达式是:+ + 2 * 3 - 7 4 / 8 4。请设计程序计算前缀表达式的结果值。输入格式:输入在一行内给出不超过30个字符的前缀表达式,只包含+、-、*、/以及运算数,不同对象(运算数、运算符号)之间以空格分隔。输...

2019-03-06 09:29:40 1212

原创 7-20 悄悄关注

##7-20 悄悄关注 (25 分)新浪微博上有个“悄悄关注”,一个用户悄悄关注的人,不出现在这个用户的关注列表上,但系统会推送其悄悄关注的人发表的微博给该用户。现在我们来做一回网络侦探,根据某人的关注列表和其对其他用户的点赞情况,扒出有可能被其悄悄关注的人。输入格式:输入首先在第一行给出某用户的关注列表,格式如下:人数N 用户1 用户2 …… 用户N其中N是不超过5000的正整数,每个...

2019-03-03 21:48:48 217

原创 标题:递增三元组

标题:递增三元组给定三个整数数组A = [A1, A2, … AN],B = [B1, B2, … BN],C = [C1, C2, … CN],请你统计有多少个三元组(i, j, k) 满足:1 <= i, j, k <= NAi < Bj < Ck【输入格式】第一行包含一个整数N。第二行包含N个整数A1, A2, … AN。第三行包含N个整数B...

2019-02-27 20:30:33 475 4

原创 QQ帐户的申请与登陆

7-44 QQ帐户的申请与登陆 (25 分)实现QQ新帐户申请和老帐户登陆的简化版功能。最大挑战是:据说现在的QQ号码已经有10位数了。输入格式:输入首先给出一个正整数N(≤10​5​​ ),随后给出N行指令。每行指令的格式为:“命令符(空格)QQ号码(空格)密码”。其中命令符为“N”(代表New)时表示要新申请一个QQ号,后面是新帐户的号码和密码;命令符为“L”(代表Login)时表示...

2019-02-27 17:09:30 315

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除