Python
老肥码码码
Hello World
展开
-
混淆矩阵及其可视化
混淆矩阵(Confusion Matrix)是机器学习中用来总结分类模型预测结果的一个分析表,是模式识别领域中的一种常用的表达形式。它以矩阵的形式描绘样本数据的真实属性和分类预测结果类型之间的关系,是用来评价分类器性能的一种常用方法。我们可以通过一个简单的例子来直观理解混淆矩阵。通过分类模型我们得到的预测结果以及真实的属性可以通过列表的形式展现,y_pred=["ant", "ant", "...原创 2020-04-25 12:28:03 · 5346 阅读 · 0 评论 -
用Python来掷个色子
掷色子的问题总会出现在概率课本中,老师们都喜欢拿这个耳熟能详的事件来举例子,但今天我们不讲概率,我们来用Python模拟掷色子。用random模块我们可以轻易地模拟输出点数(一般我们取的这个点数是色子顶上的点数),即随机生成一个1-6的数字。random.randint(1,6)的确非常容易,但如果我们想要知道色子的正面反面,左面右面的数值,又该如何计算呢?本着求知探索精神, 我翻箱倒柜...原创 2020-04-25 12:27:01 · 979 阅读 · 0 评论 -
十分钟掌握Pandas基本操作(上)
为了更好地掌握数据科学必备库Pandas的基本使用,本文通过精灵宝可梦的数据集实战,我们一起过一遍Pandas的常用方法,文中的代码都附有注释,并给出了结果的配图。鉴于篇幅,本文分为上下两篇,另外这个有意思的数据集可以直接在后台回复「宝可梦」获得。话不多说,我们开始吧![外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-9MPzDcGq-1587788724344)...原创 2020-04-25 12:26:05 · 1645 阅读 · 1 评论 -
导入Keras、TensorFlow 时出现报错:Failed to load the native TensorFlow runtime.
因为某些原因需要在cpu的环境下安装tensorflow,但是出现了Failed to load the native TensorFlow runtime的报错,下面是我的解决办法使用如下命令升级所有的包conda upgrade --all 使用如下命令安装tensorflowconda install tensorflow虽然pip install tensorfl...原创 2020-04-01 15:17:55 · 938 阅读 · 1 评论 -
从两个数据角度来看全国复工情况
转眼时间马上要来到三月份,随着疫情形势不断出现积极变化,全国各地复工复产的脚步已悄悄加快。那么目前的复工情况如何呢?我找到了清华大学信息技术研究院“智库2861”项目组研发的AI大数据平台——DaaS实时数据库,本文的所有数据均来源于该数据库。DaaS实时数据库平台由我国全域网格(即划分到每1平方公里共计960万个空间网格)2.2亿个采集点实时产生的互联网活动信息数据库,辅以三千多个分类数据库...原创 2020-03-08 07:53:27 · 300 阅读 · 0 评论 -
阴阳师自动御魂觉醒超鬼王脚本
上回说到这个PyUserInput这个库能够模拟鼠标和键盘点击,今天老肥再来实战一波游戏脚本制作。此游戏以爆肝著称,不如写个简单的小脚本解放一下双手。我们的目标就是为了能够在该点击某个按键的时候点击,以达成自动完成任务的目标。关于如何确定点击位置,可以采取如下两种方式。手动确定对应按键位置;通过收集按键图像素材,与当前屏幕截图进行对比,从而定位按键位置。第一种方法具有显而易见的缺...原创 2020-02-24 11:05:48 · 1554 阅读 · 0 评论 -
换个姿势「模拟登录」
今天老肥给大家介绍Python一个非常有意思的库PyUserInput,它集成了PyMouse和PyKeyboard这俩模块,能够模拟鼠标和键盘的操作,可以说是轻量级的按键精灵。我们可以用这个库来进行一些机械的重复操作,也可以作为小游戏的脚本。俗话说得好,工欲善其事,必先利其器,我们需要先将PyUserInput安装。模块安装不同的操作系统需要安装不同的依赖:Linux - XlibMa...原创 2020-02-22 10:09:11 · 1144 阅读 · 0 评论 -
我用Python撸了一个激活码自助提取器
我们在使用JetBrains的各种IDE时,例如IntelliJ IDEA、PyCharm、WebStorm、PhpStorm等等,免不了需要激活码来获取长时间的使用权。不然会出现三十分钟自动关闭的尴尬场面,打开IDE,泡上一杯茶,建好项目,开始coding,导入几个包之后,啪唧IDE自动关闭了。为解决此类烦恼,我用Python写了一个JetBrains全家桶激活码提取器,方便大家随时获...原创 2020-02-18 15:42:14 · 6735 阅读 · 2 评论 -
做一个时光回忆录小软件当作情人节礼物
受疫情影响,很多情侣即使相隔一个小区也无法见面,快递也迟迟未启动。在这情人节到来之际,宅在家中不妨自己动手做一个小软件来当作情人节礼物。我做了这样一个“时光回忆录”,主要分为以下四部分,登录界面的设计,倒数日模块,照片模块以及甜言蜜语模块。登录界面因为照片,情话这种较为隐私的东西,我决定设计一定的登录门槛。但是与此同时,我给出了love、you这两个菜单栏作为账号密码的提示,通过entr...原创 2020-02-14 07:09:01 · 761 阅读 · 0 评论 -
像20200202这种完全对称的公历日期,真的是千年一遇吗?
2020年2月2日这个日子是无数人心中迈入婚姻殿堂的好日子,因为其对称,正着读和反过来读是完全一样的,并且20还有谐音“爱你”的意思。但实际上,这传说中的千年对称日其实并非千年一遇,我运用简单的Python编程计算了未来千年内的所有对称日。显然这是一个判断字符串是否回文的问题,只不过该字符串为日期。直接利用暴力求解的方法,遍历这一千年里每一个日期是否回文。import datetimes...原创 2020-02-12 09:25:40 · 1845 阅读 · 2 评论 -
用Python做一个久坐提醒小助手
不论是日常的工作还是学习,现代年轻人在电脑屏幕时长数据能让人惊掉下巴,继而引发一系列身体不适的现象。小李也是久坐族中的一员,为了时刻提醒自己起来活动活动,我开发了一款基于PythonGUI编程的久坐提醒小助手。整体设计整体的构思类似于一个番茄时钟,提供一个倒计时功能并且在完成计时时发出警告。主要分为如下几个模块,一是时间选择模块,二是按钮模块,控制计时开始、暂停以及恢复,三是倒计时显示模块...原创 2020-02-09 22:36:20 · 670 阅读 · 1 评论 -
一行命令实现视频、音频倍速
最近小李看了一部悬疑爱情电视剧 《想见你》,看过的朋友估计都已经被伍佰的一首《last dance》洗了脑,相当上头。由于我是二倍速观看的视频,里面播放的歌曲也是二倍速。脱离开视频,我下载了这首歌试听之后,感觉截然不同,整体节奏放缓,不够洗脑,不符合新时代快节奏的生活,简而言之,没那味了。于是我便想要将此歌倍速播放,掏出了法宝FFmpeg。改变音频速率改变音频速率最简单的方法是直接调整音频的...原创 2020-02-08 12:35:59 · 2652 阅读 · 0 评论 -
用Python做自己的2020专属Flag动图
2020年的开头并不顺利,有不少朋友希望能够重启2020。然而时光不可倒流,我们都应该学会积极的向前看。我们可以给自己的2020年立下Flag,或者说给自己在这剩下的11个月里定下小目标,并不断为之努力。今天我们就用这万能的Python来做自己的2020专属Flag动图。整个动图制作可以分为如下几步,将愿望写入图片,循环播放图片形成gif的效果或者直接合成图片生成动图。图片制作我找了一张...原创 2020-02-02 09:36:03 · 1436 阅读 · 0 评论 -
闲得我把魔爪伸向了Ta
最近小李宅在家中,无所事事。网友们甚至都已经做起了网络包工头,半夜不睡觉在看火神山雷神山的建设直播。而我则打起了公众号开发的主意,因为本号是非认证的订阅号,因而可供开发的功能较少,只能满足几项基本需求。在这个前提下,我对本公众号做了一些基于werobot框架的基础开发。文字数据查询最近全国上下都关注着新型肺炎的动态,我用爬虫做了一个简单的查询器,在后台输入“数据”,“新闻”即可...原创 2020-01-28 17:10:07 · 1247 阅读 · 2 评论 -
二十种编程语言齐送鼠年祝福
在这新春佳节到来之际,小李在此给大家送上最诚挚的祝福,祝大家都有Pythonprint("Happy Year of the Rat !")Javapublic class HappyNewYear { public static void main(String[] args) { System.out.println("Happy Year of ...原创 2020-01-24 22:07:30 · 487 阅读 · 0 评论 -
微博之夜数据大盘点
北京时间2020年1月11日,一年一度的“微博之夜“在北京顺利举行。许多大家耳熟能详的明星都出席了本次活动,如下图的三杨同框,更是看点十足。你们以为小李今天是在写娱乐版新闻报导吗,非也非也。我们撸圈超人气选手Uzi以4亿8678万的超高票数力压娱乐圈明星王一博,成功斩获年度人物第一。但在投票期间,两位超人气明星的票数差距非常小,王一博的票数也几度超越Uzi。我是怎么知道的?当然我从投票...原创 2020-01-23 18:27:01 · 1112 阅读 · 0 评论 -
三十行代码实现自动戴口罩
自1月20日钟南山院士肯定此次新型肺炎存在着人传人的现象起,到今日的武汉封城,我们人民群众也需要提高对此次疫情的重视程度,做好自身的防范工作,平平安安,过个好年。尽量少去人群密集的场所,如果非要出门一定要戴上口罩,勤用肥皂和清水或含有酒精的洗手液洗手也是非常有必要的。在网络世界中,我们可以通过给头像戴口罩,来呼吁广大群众积极保护自身安全。在这里,我们运用Python简单的几十行代码来实现在社交...原创 2020-01-23 18:26:05 · 11003 阅读 · 14 评论 -
还单身?不如来看看AI脱单神器!
今天小李在逛人类知识宝库时发现一个非常有意思的项目,“CoupleGenerator”, 可以理解为伴侣生成器。哦也不对,单身的小伙伴不要想太多,国家不会分配,AI自然目前也是没法大变活人,给你分配对象的。那这个项目是做什么的呢,准确的说是生成伴侣的样貌图片,通过一定夫妻合照的数据集进行训练,你只要输入你的照片便可以通过生成对抗网络训练出一个和你最为般配的你的“爱人”的图片。下图是模型训练了...原创 2020-01-10 12:29:25 · 1056 阅读 · 0 评论 -
Leetcode上最南的是哪道题?
大家伙想要找份好工作,刷题是一道绕不过的坎,Leetcode大家都很熟悉了,很多公司面试的时候会用上面的原题,今天我们就来看看这Leetcode上的题!首先依然通过利索的爬虫获取了Leetcode官网题库的所有题的数据,包括点赞、踩、提交数、AC率等等数据,有了这些数据,我们就可以对这些题目做一个简单的数据分析,从而作为自己刷题参考的一个依据。经统计,Leetcode上点赞最多的题,依次是...原创 2020-01-07 14:24:32 · 1013 阅读 · 0 评论 -
Nice, 我用AI给表情包分门别类
实战背景之前有写过爬取大量表情包以供广大网友斗图使用,有部分网友反映这样的表情包太乱太杂,量确实是足够的,但没有分门别类,熊猫头、杰尼龟、脆皮鹦鹉等等热门表情包都是一锅乱炖,今天我们就来做做这件事!那这第一个想法显然是利用深度神经网络其极强的非线性拟合能力来完成对表情包的分类,但是很可惜,我没有能够用于训练的带标签的表情包,用人工做标注费时费力,难以令人接受。于是,这小脑袋瓜一转我就想到了...原创 2020-01-05 10:02:36 · 1613 阅读 · 3 评论 -
我的2019年度代码报告
不知从何时起,年度报告总能在旧年将近、新年伊始的时候掀起朋友圈的热潮。近日,网易云音乐、知乎等各大流行app也如期放出了其用户2019年的年度报告,我突发奇想,为何不为自己生成一个GitHub的年度代码报告?绿油油的GitHub仿佛在诉说着咱们coder的岁岁年年。本报告的数据来源于我的 GitHub 2019年全年的代码提交数据,经简单的Python网络爬虫与数据分析获得。...原创 2020-01-01 09:06:08 · 1283 阅读 · 2 评论 -
普通快排和随机快排的世纪大战
算法一直是计算机学科中一个非常核心的内容,学习大黑书可以让我们年轻人得到充沛的力量(也就是少点头发),在程序的海洋里快乐徜徉。排序算法是算法之中一个既基础又核心的内容,而快速排序则是比较排序中的佼佼者。今天我们就一起来探究一下快速排序。普通快速排序快速排序是一个经典的分治算法,解决分治问题的三个步骤就是 分解、解决、合并。拆开来看看快速排序的基本思想:分解 :将输入数组A[l..r]...原创 2019-12-31 23:45:57 · 967 阅读 · 0 评论 -
自动化篇 | 模糊匹配助力自动答题
前几天的一篇文章给大家分享了利用 Selenium 自动刷课的脚本,时光飞逝,挂脚本刷完时长,又到了要考试的日子。对于这种 “无关紧要” 的考试,我打算继续使用 聪明 的自动化工具帮我完成考试~爬取题库想要完成作答,免不了需要题库的支撑。考试的题目也都是源于题库,甚至原封不动从题库中抽取题目进行测试。爬虫那可是咱的拿手好戏,说干咱就干!加入必要的 params 参数,构造简单的 reque...原创 2019-12-29 15:20:52 · 3726 阅读 · 7 评论 -
数据可视化 | 2019中国最好学科排名
近日,软科发布了2019年“中国最好学科排名”,包含96个国内一级学科的排名榜单,与2018年相比增加了系统科学、兵器科学与技术、风景园林学这三个一级学科。软科世界大学学术排名与泰晤士高等教育世界大学排名、QS世界大学排名、USNews世界大学排名是公认的四大权威大学世界排名。可以说软科发布的排名,具有广泛的公信力。今天,我们就来看看这些排名情况吧!我们需要先来大致了解一下排名方...原创 2019-12-29 14:59:07 · 1116 阅读 · 1 评论 -
资深抱佛脚玩家的自我修养
随着课程的结束,期末考试的脚步也近了。作为“资深抱佛脚玩家”,在得知准确的考试安排后我便可以及时做好预习准备,从而在 deadline 的压力之下,迸发出惊人的力量,强化自己的学习能力!而期末考试的通知是第一时间发布在培养办的网站上,即该网站是最快获取考试信息的渠道。由于经常手动访问该网站会造成自己的焦虑并且浪费宝贵的时间,我决定用我的好帮手「 网络爬虫 」来帮我自动化监测网站,并且当培养办的...原创 2019-12-29 14:50:42 · 906 阅读 · 0 评论 -
B站视频之CC字幕抓取
出于某些不可告人的特殊原因,我需要得到某个B站视频的 「 字幕 」,自己手动记录字幕实在过于繁琐,每几秒都会有字幕不断地更新,一个1小时的视频字幕的收集便是一个浩大的工程~因此我再次召唤我的好帮手 网络爬虫 ,来帮我采集字幕并且以 srt 文件的格式保存。这个 srt 的全称是SubRip Text,这是一种非常流行的文本字幕,包含一行时间,一行字幕,制作规范非常简单。如上图所示,这个字幕是...原创 2019-12-29 14:46:21 · 6079 阅读 · 0 评论 -
15年前,一则公路旁的Google的招聘广告
最近小李在看吴军博士的《浪潮之巅》一书,下册书中讲到了Google公司的发展故事,作者用了其14个不为人知或被公众忽略的侧面来描述这个传奇的公司。而在对Google公司的介绍中,一张插图引起了我的注意,这张插图是Google在101号高速公路旁打的大幅招聘广告。这15年前的招聘广告竟如此有创意,现在火热得不可开交的表情包等结合高等数学令人耳目一新的创意来源可能就是来源于此吧~真是江山代有人...原创 2019-12-29 14:37:22 · 3161 阅读 · 1 评论 -
经典算法之八皇后问题
八皇后问题是一个古老而又著名的问题,是学习回溯算法的一个经典案例。今天我们就一起来探究一下吧!时间退回到1848年,国际西洋棋棋手马克斯·贝瑟尔提出了这样的一个问题,在8×8格的国际象棋上摆放八个皇后,使其不能互相攻击,即任意两个皇后都不能处于同一行、同一列或同一斜线上,问一共有多少种摆法。后面陆续有不同的学者提出自己的见解。大数学家高斯认为一共有76种摆法,1854年在柏林的象棋...原创 2019-12-24 22:55:07 · 934 阅读 · 0 评论 -
来斗图吧 骚年!
之前有介绍过GitHub上的表情包仓库,但感觉数量太少,不能满足经常斗图的需求,于是我决定从无所不有的互联网中挖掘表情包资源。这次的爬取目标是人均年薪百万的某乎,里面有关表情包的问答,几乎每个回答都给出了大量的表情包,来自五湖四海的网友在某乎以表情包会友,那我就来把你们发的全部都收集起来~首先我们先把所有回答展开,查看全部回答。打开开发者工具,找到回答所在页面,将Requests Head...原创 2019-12-15 20:20:52 · 572 阅读 · 0 评论 -
身份证号码的那些事
身份证对我们来说可谓是息息相关的。身份证就是身份的证明,不论是出行坐船、坐火车、坐飞机,还是出门办事情都离不开这个“宝贝”。我们都知道身份证是由18位数字(或者最后一位是X)构成的,那么具体这些数字每一位是如何设置的呢?身份证号码组成下面这个表给出了各位数字的由来。首先是前六位,这六位是地址码,就是户口所在地的对应编号,如下图 110105 就是北京朝阳区的编号;中间的八位是出生日期码,对...原创 2019-12-15 19:49:09 · 1251 阅读 · 0 评论 -
你朋友圈发的假图被我发现了!
我们常用的搜索引擎百度,它的搜索框内有一个小相机,不知道大家有没有注意,我们将照片上传可以找到相似图片以及图片的出处。比方我上传一张Ng的图片,百度就会给出它的搜索答案。这件事是如何做到的呢?相似的图片是如何比对找到的呢?其中有一个最基础的算法:“感知哈希”。这个算法的原理是非常直观且易于理解的,它的作用是对每张图片生成一个"指纹",然后比较不同图片的指纹。如果结果接近,就说明图片相...原创 2019-12-15 11:37:49 · 1184 阅读 · 0 评论 -
花式照片墙之脆皮鹦鹉
观众老爷们,小李今天给大家展示一下我“精湛”的厨艺。如题所示,花式照片墙这道小菜马上给大家端上来,大家吃好喝好。原材料准备:Python3,图片(最好是某一类图片,一家人整整齐齐)这里我使用的是“脆皮鹦鹉”表情包,高糊却又不失档次。佐料:pillow模块,以及一些Python自带的模块原材料处理:咱先来处理一下原材料。把这些图片的大小尺寸给整齐划一了,方便...原创 2019-12-15 10:06:51 · 1173 阅读 · 0 评论 -
time库
Python time1 时间戳:格林威治时间1970年01月01日00分00秒(北京时间1970年01月01日08时00分00秒)起至现在的总秒数。Python中获取时间的常用方法是,先得到时间戳,再将其转换成想要的时间格式。2 元组struct_time:日期、时间是包含许多变量的,所以在Python中定义了一个元组struct_time将所有这些变量组合在一起,包括:4位数年...原创 2019-01-31 20:37:56 · 2480 阅读 · 0 评论 -
calendar库
Python calendarcalendar.calendar以一个多行字符串格式返回一年的日历parameter:w :每个日期之间的间隔字符数l : 每周所占用的行数c :每个月之间的间隔字符数m: 每行几个月calendar.prcal的效果与之相同,均能打印指定年份的日历 import calendara=calendar.calend...原创 2019-01-31 19:27:51 · 560 阅读 · 0 评论 -
Pandas库
Pandas是Python第三方库,提供高性能易用数据类型和分析工具,Pandas基于NumPy实现,常与NumPy和Matplotlib一同使用import pandas as pd两个数据类型:Series, DataFrame基于上述数据类型的各类操作:基本操作、运算操作、特征类操作、关联类操作 Series类型Series类型由一组数据及与之相关的数据索引组成...原创 2019-01-27 09:44:09 · 803 阅读 · 0 评论 -
datetime库
Python datetimePython提供了多个内置模块用于操作日期时间,如calendar,time,datetime。其中calendar用于处理日历相关 ;time提供的接口与C标准库time.h基本一致;而其中应用最广的即datetime,相比于time模块,datetime模块的接口则更直观、更容易调用。其为日期和时间处理提供了多种方法,还可格式化输出,支持对时区进行处...原创 2019-01-31 17:24:18 · 270 阅读 · 0 评论 -
Matplotlib基础绘图函数
pyplot饼图的绘制import matplotlib.pyplot as pltlabels='Frogs','Hogs','Dogs','Logs'sizes=[15,30,45,10]explode=(0,0.1,0,0) #第二个突出显示plt.pie(sizes,explode=explode,labels=labels,autopct='%1.1...原创 2019-01-26 16:48:23 · 481 阅读 · 0 评论 -
Matplotlib库
Matplotlib库由各种可视化类构成,内部结构复杂受Matlab启发matplotlib.pyplot是绘制各类可视化图形的命令子库,相当于快捷方式import matplotlib.pyplot as pltplt.plot()只有一个输入列表或数组时,参数被当作Y轴,X轴以索引自动生成import matplotlib.pyplot as pltplt.plot([...原创 2019-01-26 11:28:56 · 245 阅读 · 0 评论 -
图像的手绘效果(PIL的应用实例)
图像的变换:原图像:1.读入图像后,获得像素RGB值(所有RGB值取反),修改后保存为新的文件from PIL import Imageimport numpy as npim=np.array(Image.open("D:/pytest/a.jpeg"))print(im.shape,im.dtype)b=[255,255,255] -imnewim=Image.fr...原创 2019-01-25 22:35:37 · 881 阅读 · 0 评论 -
Numpy库
NumPyNumPy是一个开源的Python科学计算基础库,包含:• 一个强大的N维数组对象 ndarray• 广播功能函数• 整合C/C++/Fortran代码的工具• 线性代数、傅里叶变换、随机数生成等功能NumPy是SciPy、Pandas等数据处理或科学计算库的基础NumPy的引用import numpy as npN维数组对象:ndarrayndarr...原创 2019-01-25 17:13:53 · 2113 阅读 · 0 评论