笔记
JECK_ケーキ
这个作者很懒,什么都没留下…
展开
-
pandas学习之电影评分(利用python进行统计分析)的学习笔记
之前看《利用python进行数据分析》的书,觉得里面电影评分的例子非常好。只是看别人的代码,觉得棒,实际动手自己做,还是眼高手低。印象最深的是电影《阿呆和阿瓜》男性评分很高,女性评分反而比较低。我看过这个电影,所以觉得很有趣,今天试着做了出来。代码很烂,后期再继续学习,直接贴上了。反正自己做的,不要求多好,凑合着自己看吧。尽管如此,还是实现了分析目的,就是比较男性和女性对不同电影的评分差异。解决了这个,后面就是数据合并,透视表,基本的描述统计了。其中特别要说名的是,电影的名字数据表,必须指定“原创 2022-10-30 22:46:43 · 1422 阅读 · 0 评论 -
替换文章中的关键词
最近写豆瓣,写一写个人感想,现在的网络环境,就是很多不能说,有些词,不能通过审核,我自己手动把一些关键词替换掉。想到用Python直接写了一个简单脚本。这一段,是一遍一遍筛选词,一遍一遍替换,效率有点低,但是还没想到更好更高效的解决办法。结果就是这样的,不知道能不能通过审核发布,比如,把这些次替换掉。希望有高手帮忙指点。...原创 2022-08-28 21:01:32 · 160 阅读 · 0 评论 -
pandas 怎么样扩展数据,就是把加权数据,转换成个案数据
之前一直用stata,觉得有一个很好用的功能呢,就是expand,具体来说就是,比如有一个交叉表,是这样的。这是风笑天社会研究方法一书里的例子,我想把这个数据变成个案数据,让学生练习,首先,你的按照百分比,计算出每一个格子的绝对数,大概是这么多。如果使用spss统计的话,spss菜单里有一个weight 菜单。可以很轻松的解决这个问题。不需要把加权数据变成个案数据。但是如果使用excel的话,就不行,我向把数据变成这样的,就是变成单独一个人的,通俗的理解就是把权重..原创 2022-05-27 15:21:01 · 383 阅读 · 0 评论 -
ppt设置字体,抄过来的。
Sub ChangeTextFont() Set pages = ActivePresentation.Slides.Range pageCount = pages.Count '第一页和最后一页跳过 For i = 2 To pageCount - 1 DoEvents ActiveWindow.View.GotoSlide Index:=i shapeCount = ActiveWindo.转载 2022-05-16 08:10:12 · 272 阅读 · 0 评论 -
记录webscraper的使用过程
这个记录一下webscraper的使用过程。帮朋友爬取山东慈善总会的网页。由于比较简单,我不想写代码了,就用webscraper把。首先是网站上的新闻,如图:这个新闻有13页,都是比较简单的网页。问题在于要爬去多个页面,然后提取二级页面的内容。使用webscraper,这里就是需要二级页面的内容,包括title, time, content。links是设置的链接。页面的链接形式自由最后一个数字在变:eaa-7aef73cf6329&page=2如下:..原创 2021-07-15 15:25:29 · 631 阅读 · 0 评论 -
python根据列表形成字典。
最近在爬取一个志愿服务的项目,网页是志愿服务网,爬的时候偷懒,只存成了一个大的字典,放到pickle里。无用代码较多。我截图了。得到一个df,这个df是字典的的形式。df = pd.read_pickle(os.path.join(data_dir, org_data_list[1299]))其中PTU是一个里列表,里面还有字典。ptu = df['PTU']ptulen(ptu)ptu里面的每一个元素,有volun_name ,我向做一个大的字典...原创 2021-07-15 10:31:33 · 595 阅读 · 0 评论 -
修改字典的方法
抄来的描述Python 字典 update() 方法用于更新字典中的键/值对,可以修改存在的键对应的值,也可以添加新的键/值对到字典中。用法与 Python dict() 函数相似。D.update(key/value)实例以下实例展示了 update() 方法的使用方法:D = {‘one’: 1, ‘two’: 2}D.update({‘three’: 3, ‘four’: 4}) # 传一个字典print(D)D.update(five=5, six=6) # 传关键字pri原创 2021-06-30 09:13:49 · 1219 阅读 · 0 评论