![](https://img-blog.csdnimg.cn/20201014180756738.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python
文章平均质量分 70
yun5945
这个作者很懒,什么都没留下…
展开
-
城市机会清单中处处是机遇——实现pdf转excel
清单变变变,机遇来来来原创 2022-06-29 00:25:50 · 387 阅读 · 1 评论 -
“TED演讲”可视化(应统期末作业)(二)
先说好哈,欢迎学习借鉴,请勿直接搬运,好歹你改一改换个逻辑,改改代码再用作你的是吧!天下文章一大抄,就看你会抄不会抄!分析开始1.TED角度1)TED远不止是TED从我们所获取的数据中,我们发现TED下属子类划分十分细致,具体有TED、TEDGlobal、TEDWomen、TEDMED、TEDIndia、TEDSummit等等,但通过清洗和统计,演讲次数的份额结果表明,依旧是传统的TED拔得头筹比例独占49.90%,远超其他种类如TEDglobal排在其次,拥有22.06%,而其他的都仅仅是个位百原创 2022-02-10 10:27:16 · 554 阅读 · 0 评论 -
“TED演讲”可视化(应统期末作业)(一)
先说好哈,欢迎学习借鉴,请勿直接搬运,好歹你改一改换个逻辑,改改代码再用作你的是吧!天下文章一大抄,就看你会抄不会抄!一、研究背景和研究目的(我就不按照小论文那套规规矩矩的写了)主要是为了完成可视化期末大作业,老师让我们自行选题,本来想做英雄联盟历届比赛可视化,感觉会超级无敌炫酷,后来那些lol里面英文专业术语我实在有点难懂,没文化终究限制了我的发挥正题二、数据概况及清洗本文所使用的数据均来自于Kaggle上一位叫做鲁纳克·巴尼克的TED粉丝收集的TED官方网站的视频数据。该数据集主要包括两个表原创 2022-02-10 09:30:26 · 520 阅读 · 1 评论 -
统信uos-使用Python3.7将doc格式文档转换成docx格式
苦逼gwy 对战通信uos 批量转换doc文档成docx原创 2022-01-06 16:45:56 · 1233 阅读 · 0 评论 -
许久没更新,安装Python第三方库python-docx都困难系列(统信UOS)
通信uos安装Python-docx的小问题原创 2022-01-06 10:52:48 · 3437 阅读 · 0 评论 -
selenium模块:截图获取12306的验证码作为图片发生偏移,解决方案
selenium模块学习自动化爬虫时,遇到一个很头痛的问题,题主用了一下午才彻底搞定,真菜警告追随B站up主爬虫视频其中项目https://www.bilibili.com/video/BV1Yh411o7Sz?t=1533&p=56:1.解决12306模拟登陆,我在截图整张浏览器页面2.再裁剪图片,聚焦获取12306的验证码,即目标为:但是,我按照up主一步一步,发现聚焦剪裁目标图片时,发现得到的根本不是我要的结果,得到了如下结果:甚至是!!!都发生了一定的位置偏移和缩放,但是原创 2020-08-31 23:05:29 · 1445 阅读 · 2 评论 -
VScode报错python-No module named lxml
前言:刚学习爬虫使用vscode时感觉看起来很好用,但是与很多设置需要自己配置所以菜鸡博主就出糗了分明已经pip install lxml包了,为啥告诉我还是没有这个玩意类???于是搜了好多帖子,感觉讲的不细致,因为我实在没看懂,综合其他所有于是我是这样解决的,因为你安装的lxml包在另外一个python里面点红色的那个地方切换python版本**惊奇地发现!!!!**有两个环境对不对!!!于是切换成另外一个,然后一直点下去就ok...原创 2020-08-27 20:54:59 · 1815 阅读 · 6 评论 -
mapreduce实战之空气质量分析(三)
我实在是太勤劳了,本来想之后分享的,但是想了想虚拟机开关好费时间,好麻烦,算了,一伙给大家康康把前言:本文默认各位读者具备了一定的java编程能力和MapReduce基本运作过程,作者尽量给大家多注释。数据介绍:数据近40万行,时间从2018.8.1 零点 至 2019.6.10 23点,城市有北京,上海, 天津,青岛,济南,厦门,郑州,乌鲁木齐,成都,呼和浩特,海口和昆明;其中每个城市有很多站号(采集点),一个站号,每个小时的采集数据占一行。给大家放个云盘连接吧。链接:https://pan.原创 2020-07-07 20:51:26 · 2326 阅读 · 0 评论 -
sklearn.metrics中报错multiclass-multioutput format is not supported问题解决
多标签问题是单标签问题的拓展,比单标签问题解决起来要棘手的多报错出现multiclass-multioutput format is not supported很有可能是你的多标签的解释变量(是一个0、1矩阵)里面有非0非1 的数字比如:[[0 1 0 … 0 0 0][0 1 0 … 0 0 0][1 1 0 … 0 2 0][0 1 0 … 0 1 0][1 0 1 … 0 0 0][0 0 1 … 0 0 0]]注意注意!!!!如果你是自己手动实现one-hot编码的话,很有可能出现原创 2020-06-20 15:29:42 · 9634 阅读 · 2 评论