自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 【网页处理与文本分析】某电视剧弹幕信息情感分析

3.遍历新得到的那块数据的'likeCount'列的数据进行判断,如果小于100,使用df[df['columns']==元素].index获取到其索引,使用pandas里的drop()方法把那些不符合要求的直接删除掉那一行,并直接修改原始的值inplace = True,随后重置下索引。

2022-11-03 20:46:38 448 1

原创 【网页处理与文本分析】影片票房任务

如 '24.8%' 需要转换为 0.248;2.再通过任务的要求通过find()方法找到电影名字,进行if判断跟传入的值进行比较,再跟任务要求取其所需的值。给定内地某日票房排行榜,输入指定影片名称 movie_name,如:'金刚川'。3. 任务一中,如果是上映天数是“上映首日”,返回0;如果上映天数是“点映”,返回 -1;2. 任务二:获取指定影片的综合票房(万元)。1. 任务一:获取指定影片的上映天数。3. 任务三:获取指定影片的排片占比。上映20天,返回 20;,返回 432.33;

2022-11-01 20:52:38 244

原创 【数据处理与分析】景点数据简易处理

方法找到任务二所需的销售额最多的那个值,再通过之前找到元素索引的方法找到其索引,再通过索引找到相对应景点的名字,再把任务所需的两个值添加到列表中返回。2.取出所有景点的所在地区进行遍历,并把省份用split()方法提取出来,并且添加到列表里,随后把列表的值赋值到df['place'],如果存在两个销售额最大的景点,取索引排名靠前的景点。),平均值为指定省、直辖市市或自治区销售额的平均值,找到传入值的所有的索引,再遍历得到的索引,通过。获取到之前所计算的景点的销售额,再添加到列表里。4.根据Numpy里的。

2022-11-01 20:25:01 330

原创 【数据处理与分析】DataFrame计算平均值

2.新建一个列表,遍历之前得到的数据,按照要求四舍五入保留两位小数,并添加到新的列表当中。1.使用Numpy中的mean()方法计算出DataFrame里每一行的平均值。程序接收 DataFrame 对象 df,返回结果是。axis=1/0 1是行,0是列。添加新列 'avg' 用于计算各行的平均值;以上仅代表个人的思路,如有欠缺请指教。给定一个DataFrame对象。使用数组返回新列 'avg'。,要求返回各行的平均值。

2022-10-30 07:00:00 10122 1

原创 【数据处理与分析】电商订单数据计算

传入一个字符串,返回订单总金额 (quantity * item_price) 最大或最小的商品,并返回商品的名称(item_name)。4.对新生成的DataFrame对象的['colunt'],使用Numpy中的argmax()/argmin()获取最大值和最小值的索引。1. 传入一个字符串('max' 或 'min'),返回订单总金额最大或最小的商品的名称(item_name);2. 传入的字符串不区分大小写,即传入值可能是"Max",也可能是"max";补充完整,函数的返回值为字符(

2022-10-29 12:45:14 1474

原创 【数据处理与分析】电商订单数据清洗

1.选取到数据表columns为['choice_description']使用 isnull() 判断空值 是为True 不是为False。统计订单表格中,商品描述(choice_description)中为“NaN”的数量,并将其批量替换为“banana”,1. 订单数据表为以逗号为分隔符的csv文件,编码方式为。补充完整,函数的返回值为整数值,既为“NaN”的数量。3. DataFrame 读取为订单数据表;3.if判断p==True count+1。请根据以上要求,将函数。

2022-10-28 23:21:47 742 2

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除