老肥码码码

微信公众号:老肥码码码
私信 关注
librauee
码龄3年

Hello World

  • 177,201
    被访问量
  • 236
    原创文章
  • 20,081
    作者排名
  • 330
    粉丝数量
  • 于 2018-03-31 加入CSDN
  • 入选《PHP领域内容榜》第6名
获得成就
  • 获得574次点赞
  • 内容获得234次评论
  • 获得448次收藏
  • GitHub 获得1,308Stars
荣誉勋章
兴趣领域
  • #人工智能
    #TensorFlow#PyTorch#数据分析#视觉/OpenCV#Python#机器学习#深度学习#自然语言处理#图像处理#算法
TA的专栏
  • Python数据分析
    15篇
  • 区块链
    2篇
  • python网络爬虫实战
    8篇
  • Linux
    8篇
  • C++
    10篇
  • Python
    62篇
  • POJ
    41篇
  • 数据库
    8篇
  • MachineLearning
    15篇
  • Leetcode
    1篇
  • 最近
  • 文章
  • 资源
  • 问答
  • 课程
  • 帖子
  • 收藏
  • 关注/订阅

“梧桐杯”中国移动大数据应用创新大赛 - 智慧金融赛道Baseline

老肥今天和大家分享的是“梧桐杯”中国移动大数据应用创新大赛的智慧金融赛道的Baseline方案(抱歉鸽了很久),线上成绩为0.9438,处于一个相对靠前的排名位置。赛题介绍背景在金融领域,...
原创
75阅读
0评论
1点赞
发布博客于 3 天前

手把手之如何写一个抢课脚本

大家好,我是菜鸡q,大家好久不见!故事的起因是由于群里有人通知马上要选下学期的课了,鉴于第一学期立志认真上课的我头铁选了几门巨难的课后,到学期中由于真的听不懂后索性懒得去上课,所以我决定下...
原创
141阅读
1评论
0点赞
发布博客于 4 天前

基于AI的信道信息反馈性能提升Baseline分享

今天老肥和大家分享一个和通信相关的人工智能比赛,有不少朋友在这个赛题上遇到了很多问题,导致无法正常提交或者无法得到有效的分数,我搜集了一些与赛题相关的论文资料,并会给出目前排名前十的Ba...
原创
309阅读
3评论
0点赞
发布博客于 2 月前

CCF企业非法集资风险预测Rank11赛后总结

这是老肥第一次参加CCF大数据与计算智能大赛,选择了企业非法集资风险预测这个相对简单的结构化数据赛题,本赛题共有4210人、3403支队伍参赛,是今年CCF BDCI大赛参赛人数最多的赛...
原创
327阅读
4评论
2点赞
发布博客于 2 月前

中移集成首届OneCity编程大赛Rank15赛后总结

今天老肥和大家分享的是我最近参加的一个自然语言处理的比赛,复赛Rank15,喜提小米充电宝一枚。因为之前已经分享过本次竞赛的Baseline, 具体的赛事信息就不在此赘述,有需要的同学可...
原创
115阅读
5评论
1点赞
发布博客于 2 月前

公积金贷款逾期预测Baseline分享

今天老肥和大家分享的是山东省第二届数据应用创新创业大赛-日照分赛场-公积金贷款逾期预测的baseline, 这个赛题是结构化数据的分类问题,相对来说入门门槛较低,那就一起来看看吧!赛事介...
原创
868阅读
1评论
4点赞
发布博客于 2 月前

中移集成首届OneCity编程大赛Baseline分享

机缘巧合在DC竞赛上看到了这个比赛,这个编程比赛正是数据类算法比赛,主要是自然语言处理相关的文本多分类任务,老肥我从来没有学习过这NLP领域相关的知识,正好借这个比赛学习充电,在此分享一...
原创
123阅读
0评论
0点赞
发布博客于 3 月前

在消失的几个月里,我拿奖啦

最近不怎么出现在大家的视野中,可不是因为我偷懒喔。在普遍唱衰算法岗位的大环境下,为了给自己的空白简历增加点色彩,也是给自己未来在就业市场增加求职的筹码,从今年六月份到现在这5个月我一共参...
原创
43阅读
2评论
0点赞
发布博客于 4 月前

百行代码轻松爬取视频

最近老肥在追剧,遇到了不是VIP无法畅享剧集的小困难。然后我在某强大的搜索引擎中发现了一个视频网站,该网站涵盖了各大热门视频,与VIP的更新速度同步,并且无需等待广告。视频网站?不如我们...
原创
117阅读
0评论
0点赞
发布博客于 7 月前

用Python拓展副业的几种方式

Python是当下最火的编程语言之一,除了成为一名Python程序员之外,我们能否将Python作为自己的副业利器呢?答案是肯定的,本文就给大家介绍一些可以用Python赚零花钱的一些方...
原创
408阅读
0评论
0点赞
发布博客于 8 月前

定制你的私人arXiv论文报告,掌握一手科研动态

arXiv是一个收录科学文献预印本的在线数据库,许多还未被期刊会议收录的论文会被挂到arXiv上,以证明作者论文的原创性。我们需要阅读相关领域最新的论文,掌握一手科研动态,看看自己关注的...
原创
168阅读
0评论
0点赞
发布博客于 8 月前

字体反爬之博X网实战

今天的目标网站是某彩票网站博X网。其主要的反爬技术为字体反爬,话不多说,我们直接开始!我们想要获取的是具体的开奖号码,此号码是通过蓝色的小球表示的,如何获取呢?观察NetWork后,我们...
原创
176阅读
0评论
0点赞
发布博客于 9 月前

Python做一个藏头诗生成器

前几天给大家介绍了有意思的藏头诗,今天我们就用Python来自己根据输入语句实现自动生成藏头藏尾诗吧。整个诗句生成的逻辑是这样的,先根据输入语句爬取符合要求的诗句(来自百度汉语),再根据...
原创
575阅读
0评论
2点赞
发布博客于 9 月前

解决滑动验证码的新姿势

最近正在在学习数字图像处理,这个滑动验证码从本质上来说就是将两张图片按照缺口的位置拼在一起,我便想尝试使用图像处理的方法来找到这个图片的缺口位置。模板匹配的方法应该是适用于该问题的,这是...
原创
279阅读
0评论
1点赞
发布博客于 9 月前

手把手教你爬取研招网调剂信息

这篇文章是去年我在博客上写的一篇基础爬虫,利用了简单的Python爬虫来定时收集目标专业的调剂信息,后面也确实帮助我成功上岸。时间又来到了调剂的时间点,调剂通道已打开,经过热心小伙伴测试...
原创
430阅读
2评论
2点赞
发布博客于 9 月前

Python&520

明天就是一年一度的520了,小伙伴们有没有准备好如何应对?老肥这里给大家找了几种实用的用Python来表达爱意的操作,包括心动照片墙、时光回忆录、数学爱情怪以及文采飞扬藏头诗。心动照片墙...
原创
796阅读
1评论
4点赞
发布博客于 9 月前

石油类专业三个月跨考中科大大数据一志愿上岸

我的好哥们Q同学本科就读于某211石油专业,他在毕业前后干了2年Python程序员,于2019年9月20日离职,刚好3个月脱产考研(在离职之前是边上班边学),在录取的兴奋之余,和大家分享...
原创
660阅读
4评论
5点赞
发布博客于 9 月前

图像增强:灰度变换(Python实现)

图像增强能够有目的地强调图像地整体或是局部特征,将不清晰地图像变得更为清晰,或是强调某些感兴趣的特征,使其改善图像质量,加强图像判别和识别的效果。现有的图像增强的方法非常多,今天我们主要...
原创
1185阅读
0评论
1点赞
发布博客于 9 月前

十分钟掌握数据可视化基本操作(下)

和之前学习Pandas一样,我们继续以宝可梦数据集作为学习可视化的例子,进而梳理Python绘图的基本操作,主要涉及seaborn以及matplotlib两个可视化库。上半篇我们主要使用...
原创
141阅读
0评论
0点赞
发布博客于 9 月前

十分钟掌握数据可视化基本操作(上)

和之前学习Pandas一样,我们继续以宝可梦数据集作为学习可视化的例子,进而梳理Python绘图的基本操作,主要涉及seaborn以及matplotlib两个可视化库。上半篇我们主要使用...
原创
144阅读
0评论
0点赞
发布博客于 9 月前

我用Python写了一个论文降重工具

时值毕业季,有不少小伙伴深受论文查重的困扰。因此我便想到做一个简单的自动去重的工具,先看看效果,我们再对原理或是代码实现做进一步的分析。首先需要输入appid以及key,这些可以在百度翻...
原创
1939阅读
4评论
5点赞
发布博客于 10 月前

十分钟掌握Pandas基本操作(下)

为了更好地掌握数据科学必备库Pandas的基本使用,本文通过精灵宝可梦的数据集实战,我们一起过一遍Pandas的基本操作,文中的代码都附有注释,并给出了结果的配图,这里是下篇,上篇链接戳...
原创
204阅读
0评论
1点赞
发布博客于 10 月前

混淆矩阵及其可视化

混淆矩阵(Confusion Matrix)是机器学习中用来总结分类模型预测结果的一个分析表,是模式识别领域中的一种常用的表达形式。它以矩阵的形式描绘样本数据的真实属性和分类预测结果类型之间的关系,是用来评价分类器性能的一种常用方法。我们可以通过一个简单的例子来直观理解混淆矩阵。通过分类模型我们得到的预测结果以及真实的属性可以通过列表的形式展现,y_pred=["ant", "ant", "...
原创
693阅读
0评论
1点赞
发布博客于 10 月前

用Python来掷个色子

掷色子的问题总会出现在概率课本中,老师们都喜欢拿这个耳熟能详的事件来举例子,但今天我们不讲概率,我们来用Python模拟掷色子。用random模块我们可以轻易地模拟输出点数(一般我们取的这个点数是色子顶上的点数),即随机生成一个1-6的数字。random.randint(1,6)的确非常容易,但如果我们想要知道色子的正面反面,左面右面的数值,又该如何计算呢?本着求知探索精神, 我翻箱倒柜...
原创
260阅读
0评论
0点赞
发布博客于 10 月前

十分钟掌握Pandas基本操作(上)

为了更好地掌握数据科学必备库Pandas的基本使用,本文通过精灵宝可梦的数据集实战,我们一起过一遍Pandas的常用方法,文中的代码都附有注释,并给出了结果的配图。鉴于篇幅,本文分为上下两篇,另外这个有意思的数据集可以直接在后台回复「宝可梦」获得。话不多说,我们开始吧![外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-9MPzDcGq-1587788724344)...
原创
452阅读
1评论
0点赞
发布博客于 10 月前

我用Python在网上复制文字的几种实用方法

平常学习或是工作需要,我们会想要复制网页上的文字内容,但是现在的网页非常不单纯,我简单列举几个我遇到的网页,当我看中了网页上的内容,想要复制其内容的时候,各种二维码,VIP的限制页面便会...
原创
401阅读
0评论
1点赞
发布博客于 10 月前

李宏毅《机器学习》2020春季课程学习笔记一

笔记摘要本次机器学习课程主要包含如下内容,较之前的课程有部分改变。机器学习就是一个自动找函数的方法。想要找什么样子的函数?回归问题想要找到一个输出是数值的函数分类问题想要找到一个输出分类的选择的函数如何告诉机器你想要找什么样的函数?监督学习(Supervised Learning)用带标签的数据来训练,告诉机器什么是正确的输出。通过loss,机器可以判断函数的好坏,...
原创
112阅读
0评论
0点赞
发布博客于 10 月前

李宏毅《机器学习》2020春季课程作业

台大李宏毅教授的2020年的机器学习春季课程已经上线。学习一波,走你!光看视频肯定不行, 作业一定要自己动手完成才行。但是作业是发布在google云上的,为方便大家,我这里有完整的作业资源,需要的可以在后台回复 ML获得!...
原创
860阅读
13评论
5点赞
发布博客于 10 月前

高可用免费代理ip爬取实战

我们在使用爬虫的时候,会对代理ip有一定程度的需求。今天爬取的这个免费代理网站不是大家已经爬烂的西刺和66等代理网站,是我无意间发现的~这个网站还是有一点意思的。注意到没有,这里的ip地址被换成了图片,而这个图片长得似乎和验证码非常相似。定位ip地址元素发现,确实是图片,并且是base64编码的形式。这样我们就有了整体的思路,首先爬取网页上图片的base64编码,将编码解码保存为图片,接...
原创
724阅读
1评论
2点赞
发布博客于 10 月前

一次免费代理ip的爬取实战

我们在使用爬虫的时候,会对代理ip有一定程度的需求。今天爬取的这个免费代理网站不是大家已经爬烂的西刺和66等代理网站,是我无意间发现的宝藏网站~这个网站还是有一点小意思的。注意到没有,这...
原创
89阅读
0评论
0点赞
发布博客于 10 月前

中华人民共和国国家标准GB/T7714-2015 下载

新版参考文献国家标准
原创
5998阅读
0评论
5点赞
发布博客于 10 月前

用Python来掷个色子~

掷色子的问题总会出现在概率课本中,老师们都喜欢拿这个耳熟能详的事件来举例子,但今天我们不讲概率,我们来用Python模拟掷色子。用random模块我们可以轻易地模拟输出点数(一般我们取的...
原创
131阅读
0评论
0点赞
发布博客于 10 月前

用Python获取可能是全网最全的杰尼龟表情包(第三弹)

根据前几篇文章,我们已经得到了大量包含杰尼龟的图片,接下来我们就对这些图片来做一些简单的处理,添加与图片相符的文字或是生成gif动图。文字添加迅哥曾经说过,没有文字的表情包是没有灵魂的。因此今天我们就用Python在图片上添加文字,先随便拿一张杰尼龟的图片。这里我们采用PIL库来给图片的指定位置添加指定的文字,truetype函数来设置字体类型以及大小,text函数来添加指定颜色的文字。...
原创
465阅读
0评论
0点赞
发布博客于 11 月前

用Python获取可能是全网最全的杰尼龟表情包(第二弹)

上回说到我们已经通过爬虫以及将视频切割成多幅图片,今天就来谈谈如何通过机器学习的方法来减少筛选杰尼龟的工作量。这些图片可以粗暴地分为两类,是杰尼龟或者不是杰尼龟,这个分类任务不同于猫狗识别的二分类,而是单分类任务。分类算法分类算法若是按照类别个数划分,可以分为单分类、二分类以及多分类这三种。一般我们见的比较多是二分类或是多分类。通过朴素贝叶斯算法来识别垃圾邮件、用神经网络来识别猫狗都是典型的...
原创
330阅读
0评论
0点赞
发布博客于 11 月前

用Python获取可能是全网最全的杰尼龟表情包(第一弹)

杰尼龟系列表情包在广大网友之间传递快乐,红极一时。我想是杰尼龟可爱的外表以及憨憨的形态,圆圆的脸蛋大大的眼睛,且其经常在剧中摆出各式夸张表情,因而被广大网友制成各式各样的表情包,并且深受沙雕网友的喜爱。正好,我也是这沙雕网友大军中的一员,通过各种渠道收集了一些杰尼龟的表情包。但,我想要更多,只有拥有沙雕表情包最多的人才能在斗图中立于不败之地,于是便有了用Python获取可能是全网最全的杰尼龟表...
原创
701阅读
0评论
0点赞
发布博客于 11 月前

Python找寻知乎最美最帅之人

都说某乎卧虎藏龙,女网友有倾国倾城、闭月羞花之容貌,男网友有玉树临风、英俊潇洒的姿态,今日我们就来探索一番吧!爬虫部分我选取了某乎热度非常高的10个问题,男女兼而有之。“帅得惨绝人寰是帅到了哪种程度?”,这样的问题下面该会是什么样的神颜呢,真是期待呢。这里爬取这些问题每一个的前百页回答(毕竟百页之后很少出现高赞回答)中的所有图片,毕竟这些问题都是一图胜千言的经典问题。爬虫的逻辑非常简单,...
原创
706阅读
0评论
0点赞
发布博客于 1 年前

导入Keras、TensorFlow 时出现报错:Failed to load the native TensorFlow runtime.

因为某些原因需要在cpu的环境下安装tensorflow,但是出现了Failed to load the native TensorFlow runtime的报错,下面是我的解决办法使用如下命令升级所有的包conda upgrade --all 使用如下命令安装tensorflowconda install tensorflow虽然pip install tensorfl...
原创
433阅读
1评论
0点赞
发布博客于 1 年前

Python找寻最美最帅之人

都说某乎卧虎藏龙,女网友有倾国倾城、闭月羞花之容貌,男网友有玉树临风、英俊潇洒的姿态,今日我们就来探索一番吧!爬虫部分我选取了某乎热度非常高的10个问题,男女兼而有之。“帅得惨绝人寰是帅...
原创
42阅读
0评论
0点赞
发布博客于 1 年前

手把手教你给项目添加文档

大家一定见过这样的文档吧?这种黑白色调看起来非常舒服,整个界面干净简洁却显得很有档次。而这文档主要是由Read the Docs这个在线文档托管、Sphinx这个基于Python的文档生成项目以及我们常用的版本控制工具GitHub实现的,下面我们就来梳理一下如何生成文档。创建仓库首先,我们需要在GitHub上创建仓库并将该仓库克隆到本地,当然你也可以直接在原有仓库上进行操作。注册账号并...
原创
287阅读
0评论
0点赞
发布博客于 1 年前

给女朋友每日定时推送睡前小故事

这篇文章是去年我在博客上写的一篇基础爬虫,利用了简单的Python爬虫、邮件发送以及定时任务实现了每天定时发送睡前小故事的功能,是一篇步骤详尽的文章。经过测试,该程序仍能正常运行。最近,...
原创
116阅读
1评论
0点赞
发布博客于 1 年前

B站数据解读「回形针」

前一阵子,一段视频《关于新冠肺炎的一切》火爆全网,视频的制作者正是本文的主角「回形针」,我爬取了其B站发布的视频数据,接下来让我们一起通过数据来了解回形针吧!作为当代生活说明书的回形针发布的视频以科普类为主,截至目前总计发布的视频共有135个,其中标题含有问号的正好占八成。视频的描述也很有意思,近九成包含2个问号,还有3%的视频描述涵盖了3个问号。脑袋秃顶还有救吗?如何科学高效的处理几...
原创
1184阅读
0评论
0点赞
发布博客于 1 年前

一眼看清股市状况之用Python绘制K线图

前几天美股熔断,据悉这次熔断是自美股有熔断机制30年来第二次,成了头条新闻。对股票一窍不通的我也在此情此景进行了一波学习,股市的变化瞬息万千,有一种图可以用来清晰地反应一段时间内股市的变化情况,它就是K线图。今天我们用Python基于两种不同的方式来绘制K线图,它们都是Python可视化的好帮手——Matplotlib、Pyecharts。K线图这种图表源处于日本德川幕府时代,被当时日本米市...
原创
1621阅读
0评论
1点赞
发布博客于 1 年前

洞悉股市,从绘制K线图开始!

前几天美股熔断,据悉这次熔断是自美股有熔断机制30年来第二次,成了头条新闻。令人始料未及的是,昨晚美股又熔断了。对股票一窍不通的我也在此情此景进行了一波学习充电,股市的变化瞬息万千,有一...
原创
38阅读
0评论
0点赞
发布博客于 1 年前

GitHub仓库统计工具

今天的主题是做一个简单的GitHub的仓库统计工具,目标是输入GitHub用户名获取其所有仓库的star以及fork数目,可以看作是一个简单的爬虫实战。我们利用requests爬取GitHub所提供的仓库数据api,该api的格式如下,https://api.github.com/users/<GitHub user name>/repos这些json格式的数据是很方便解析的,我...
原创
945阅读
0评论
1点赞
发布博客于 1 年前

做一个GitHub仓库统计工具

今天的主题是做一个简单的GitHub的仓库统计工具,目标是输入GitHub用户名获取其所有仓库的star以及fork数目,可以看作是一个简单的爬虫实战。我们利用requests爬取Git...
原创
80阅读
0评论
0点赞
发布博客于 1 年前

给你的README整一些花里胡哨的图片

在浏览人类精华宝库GitHub时,我们会注意到有些项目的README文件中会展示其Star以及Fork的数目,如下图所示还有一些项目的README则是展示另外一番酷炫效果,好一番乱花渐欲迷人眼~那么如何在markdown文件中写入这些花里胡哨的图片呢?“聪明“的我去阅读了这些仓库的README文件,发现是这个样子的![GitHub stars](https://img.shields.i...
原创
167阅读
0评论
0点赞
发布博客于 1 年前

如何加速一个简单的for循环?

我们先来看一段非常简单的代码for i in range(10000): x[i] = x[i] + 10看到这代码,肯定有小伙伴会有疑问,这么简单的代码你告诉我竟然可以优化???不急不急,且听我慢慢分析:首先我们要意识到,这个循环体循环了10000次。那么加速的其中一个关键就是减少循环次数,因为每次循环结束之后本质上都是一个分支指令的判断,判断这次循环是否结束。如果是则跳出循环,...
原创
1308阅读
1评论
0点赞
发布博客于 1 年前

Truffle DApp pet-shop网页无法显示图片

在index.html中,因为国内无法访问谷歌,所以使用百度替换,将<script src="https://ajax.googleapis.com/ajax/libs/jquery/1.12.4/jquery.min.js">中的地址替换为<script src="https://libs.baidu.com/jquery/1.9.0/jquery.min.js"&g...
原创
206阅读
0评论
0点赞
发布博客于 1 年前

从两个数据角度来看全国复工情况

转眼时间马上要来到三月份,随着疫情形势不断出现积极变化,全国各地复工复产的脚步已悄悄加快。那么目前的复工情况如何呢?我找到了清华大学信息技术研究院“智库2861”项目组研发的AI大数据平台——DaaS实时数据库,本文的所有数据均来源于该数据库。DaaS实时数据库平台由我国全域网格(即划分到每1平方公里共计960万个空间网格)2.2亿个采集点实时产生的互联网活动信息数据库,辅以三千多个分类数据库...
原创
142阅读
0评论
1点赞
发布博客于 1 年前

快乐游戏,解放双手

上回说到这个PyUserInput这个库能够模拟鼠标和键盘点击(没看过的朋友底部有传送门),今天老肥再来实战一波游戏脚本制作。此游戏以爆肝著称,不如写个简单的小脚本解放一下双手。我们的目...
原创
23阅读
0评论
0点赞
发布博客于 1 年前

阴阳师自动御魂觉醒超鬼王脚本

上回说到这个PyUserInput这个库能够模拟鼠标和键盘点击,今天老肥再来实战一波游戏脚本制作。此游戏以爆肝著称,不如写个简单的小脚本解放一下双手。我们的目标就是为了能够在该点击某个按键的时候点击,以达成自动完成任务的目标。关于如何确定点击位置,可以采取如下两种方式。手动确定对应按键位置;通过收集按键图像素材,与当前屏幕截图进行对比,从而定位按键位置。第一种方法具有显而易见的缺...
原创
994阅读
0评论
1点赞
发布博客于 1 年前

换个姿势「模拟登录」

今天老肥给大家介绍Python一个非常有意思的库PyUserInput,它集成了PyMouse和PyKeyboard这俩模块,能够模拟鼠标和键盘的操作,可以说是轻量级的按键精灵。我们可以用这个库来进行一些机械的重复操作,也可以作为小游戏的脚本。俗话说得好,工欲善其事,必先利其器,我们需要先将PyUserInput安装。模块安装不同的操作系统需要安装不同的依赖:Linux - XlibMa...
原创
804阅读
0评论
1点赞
发布博客于 1 年前

斐波那契额小李→秃头老肥

细心的旁友们可能已经发现了,本公众号于2020年2月19日上午10点36分更改了名字,由 原来的「算法与数据之美」更新为现在的「老肥码码码」。对,我还是原来的斐波那契小李。这个名呢,取自...
原创
25阅读
0评论
0点赞
发布博客于 1 年前

我用Python撸了一个激活码自助提取器

我们在使用JetBrains的各种IDE时,例如IntelliJ IDEA、PyCharm、WebStorm、PhpStorm等等,免不了需要激活码来获取长时间的使用权。不然会出现三十分钟自动关闭的尴尬场面,打开IDE,泡上一杯茶,建好项目,开始coding,导入几个包之后,啪唧IDE自动关闭了。为解决此类烦恼,我用Python写了一个JetBrains全家桶激活码提取器,方便大家随时获...
原创
1822阅读
2评论
0点赞
发布博客于 1 年前

truffle init error,unbox Downloading报错问题

这个问题困扰了我整整三天。在成功安装node.js,成功安装truffle后,使用truffle init 命令出现如下报错C:\Users\Administrator
ew>truffle initStarting unbox…√ Preparing to download box× DownloadingUnbox failed!RequestError: Error: ...
原创
3934阅读
7评论
1点赞
发布博客于 1 年前

做一个时光回忆录当作情人节礼物

受疫情影响,很多情侣即使相隔一个小区也无法见面,快递也迟迟未启动。在这情人节到来之际,宅在家中不妨自己动手做一个小软件来当作情人节礼物。我做了这样一个“时光回忆录”,主要分为以下四部分,...
原创
46阅读
0评论
0点赞
发布博客于 1 年前

做一个时光回忆录小软件当作情人节礼物

受疫情影响,很多情侣即使相隔一个小区也无法见面,快递也迟迟未启动。在这情人节到来之际,宅在家中不妨自己动手做一个小软件来当作情人节礼物。我做了这样一个“时光回忆录”,主要分为以下四部分,登录界面的设计,倒数日模块,照片模块以及甜言蜜语模块。登录界面因为照片,情话这种较为隐私的东西,我决定设计一定的登录门槛。但是与此同时,我给出了love、you这两个菜单栏作为账号密码的提示,通过entr...
原创
384阅读
0评论
1点赞
发布博客于 1 年前

像20200202这种完全对称的公历日期,真的是千年一遇吗?

2020年2月2日这个日子是无数人心中迈入婚姻殿堂的好日子,因为其对称,正着读和反过来读是完全一样的,并且20还有谐音“爱你”的意思。但实际上,这传说中的千年对称日其实并非千年一遇,我运用简单的Python编程计算了未来千年内的所有对称日。显然这是一个判断字符串是否回文的问题,只不过该字符串为日期。直接利用暴力求解的方法,遍历这一千年里每一个日期是否回文。import datetimes...
原创
901阅读
0评论
1点赞
发布博客于 1 年前

像20200202这种完全对称的公历日期,真的是千年一遇吗

2020年2月2日这个日子是无数人心中迈入婚姻殿堂的好日子,因为其对称,正着读和反过来读是完全一样的,并且20还有谐音“爱你”的意思。但实际上,这传说中的千年对称日其实并非千年一遇,我运...
原创
85阅读
0评论
0点赞
发布博客于 1 年前

用Python做一个久坐提醒小助手

不论是日常的工作还是学习,现代年轻人在电脑屏幕时长数据能让人惊掉下巴,继而引发一系列身体不适的现象。小李也是久坐族中的一员,为了时刻提醒自己起来活动活动,我开发了一款基于PythonGUI编程的久坐提醒小助手。整体设计整体的构思类似于一个番茄时钟,提供一个倒计时功能并且在完成计时时发出警告。主要分为如下几个模块,一是时间选择模块,二是按钮模块,控制计时开始、暂停以及恢复,三是倒计时显示模块...
原创
193阅读
0评论
0点赞
发布博客于 1 年前

一行命令实现视频、音频倍速

最近小李看了一部悬疑爱情电视剧 《想见你》,看过的朋友估计都已经被伍佰的一首《last dance》洗了脑,相当上头。由于我是二倍速观看的视频,里面播放的歌曲也是二倍速。脱离开视频,我下载了这首歌试听之后,感觉截然不同,整体节奏放缓,不够洗脑,不符合新时代快节奏的生活,简而言之,没那味了。于是我便想要将此歌倍速播放,掏出了法宝FFmpeg。改变音频速率改变音频速率最简单的方法是直接调整音频的...
原创
1809阅读
0评论
1点赞
发布博客于 1 年前

吃我一记彩虹屁

昨日午后的黄昏,某乎一条推送迎面而来,其真可谓集推荐算法之大成,精准之程度令人咋舌。并列为“世界十大难题”之一的“如何哄女朋友开心”终于有解决方案了?没错,高赞回答给我们指了一条明路,它...
原创
48阅读
1评论
0点赞
发布博客于 1 年前

用Python做自己的2020专属Flag动图

2020年的开头并不顺利,有不少朋友希望能够重启2020。然而时光不可倒流,我们都应该学会积极的向前看。我们可以给自己的2020年立下Flag,或者说给自己在这剩下的11个月里定下小目标,并不断为之努力。今天我们就用这万能的Python来做自己的2020专属Flag动图。整个动图制作可以分为如下几步,将愿望写入图片,循环播放图片形成gif的效果或者直接合成图片生成动图。图片制作我找了一张...
原创
1025阅读
0评论
2点赞
发布博客于 1 年前

闲得我把魔爪伸向了Ta

最近小李宅在家中,无所事事。网友们甚至都已经做起了网络包工头,半夜不睡觉在看火神山雷神山的建设直播。而我则打起了公众号开发的主意,因为本号是非认证的订阅号,因而可供开发的功能较少,只能满足几项基本需求。在这个前提下,我对本公众号做了一些基于werobot框架的基础开发。文字数据查询最近全国上下都关注着新型肺炎的动态,我用爬虫做了一个简单的查询器,在后台输入“数据”,“新闻”即可...
原创
1150阅读
2评论
1点赞
发布博客于 1 年前

二十种编程语言齐送鼠年祝福

在这新春佳节到来之际,小李在此给大家送上最诚挚的祝福,祝大家都有Pythonprint("Happy Year of the Rat !")Javapublic class HappyNewYear { public static void main(String[] args) { System.out.println("Happy Year of ...
原创
156阅读
0评论
1点赞
发布博客于 1 年前

微博之夜数据大盘点

北京时间2020年1月11日,一年一度的“微博之夜“在北京顺利举行。许多大家耳熟能详的明星都出席了本次活动,如下图的三杨同框,更是看点十足。你们以为小李今天是在写娱乐版新闻报导吗,非也非也。我们撸圈超人气选手Uzi以4亿8678万的超高票数力压娱乐圈明星王一博,成功斩获年度人物第一。但在投票期间,两位超人气明星的票数差距非常小,王一博的票数也几度超越Uzi。我是怎么知道的?当然我从投票...
原创
925阅读
0评论
1点赞
发布博客于 1 年前

三十行代码实现自动戴口罩

自1月20日钟南山院士肯定此次新型肺炎存在着人传人的现象起,到今日的武汉封城,我们人民群众也需要提高对此次疫情的重视程度,做好自身的防范工作,平平安安,过个好年。尽量少去人群密集的场所,如果非要出门一定要戴上口罩,勤用肥皂和清水或含有酒精的洗手液洗手也是非常有必要的。在网络世界中,我们可以通过给头像戴口罩,来呼吁广大群众积极保护自身安全。在这里,我们运用Python简单的几十行代码来实现在社交...
原创
4187阅读
0评论
4点赞
发布博客于 1 年前

微博年度之夜数据大盘点

本文预计阅读时间:5分钟北京时间2020年1月11日,一年一度的“微博之夜”...
原创
99阅读
0评论
0点赞
发布博客于 1 年前

还单身?不如来看看AI脱单神器!

今天小李在逛人类知识宝库时发现一个非常有意思的项目,“CoupleGenerator”, 可以理解为伴侣生成器。哦也不对,单身的小伙伴不要想太多,国家不会分配,AI自然目前也是没法大变活人,给你分配对象的。那这个项目是做什么的呢,准确的说是生成伴侣的样貌图片,通过一定夫妻合照的数据集进行训练,你只要输入你的照片便可以通过生成对抗网络训练出一个和你最为般配的你的“爱人”的图片。下图是模型训练了...
原创
939阅读
0评论
1点赞
发布博客于 1 年前

还单身?不如来看看脱单神器!

点击上方“算法与数据之美”,选择“置顶公众号”更多精彩等你来!今天小李在逛人类知识宝库时发现一个非常有意思的目,“CoupleGenerator”, 可以理解为伴侣生成器。哦也不对,单身...
原创
45阅读
0评论
0点赞
发布博客于 1 年前

Leetcode上最南的是哪道题?

大家伙想要找份好工作,刷题是一道绕不过的坎,Leetcode大家都很熟悉了,很多公司面试的时候会用上面的原题,今天我们就来看看这Leetcode上的题!首先依然通过利索的爬虫获取了Leetcode官网题库的所有题的数据,包括点赞、踩、提交数、AC率等等数据,有了这些数据,我们就可以对这些题目做一个简单的数据分析,从而作为自己刷题参考的一个依据。经统计,Leetcode上点赞最多的题,依次是...
原创
827阅读
0评论
1点赞
发布博客于 1 年前

Nice, 我用AI给表情包分门别类

实战背景之前有写过爬取大量表情包以供广大网友斗图使用,有部分网友反映这样的表情包太乱太杂,量确实是足够的,但没有分门别类,熊猫头、杰尼龟、脆皮鹦鹉等等热门表情包都是一锅乱炖,今天我们就来做做这件事!那这第一个想法显然是利用深度神经网络其极强的非线性拟合能力来完成对表情包的分类,但是很可惜,我没有能够用于训练的带标签的表情包,用人工做标注费时费力,难以令人接受。于是,这小脑袋瓜一转我就想到了...
原创
1189阅读
3评论
3点赞
发布博客于 1 年前

Nice,我用AI给表情包分门别类!

点击上方“算法与数据之美”,选择“置顶公众号”更多精彩等你来!实战背景之前有写过爬取大量表情包以供广大网友斗图使用,有部分网友反映这样的表情包太乱太杂,量确实是足够的,但没有分门别类,熊...
原创
50阅读
0评论
0点赞
发布博客于 1 年前

我的2019年度代码报告

不知从何时起,年度报告总能在旧年将近、新年伊始的时候掀起朋友圈的热潮。近日,网易云音乐、知乎等各大流行app也如期放出了其用户2019年的年度报告,我突发奇想,为何不为自己生成一个GitHub的年度代码报告?绿油油的GitHub仿佛在诉说着咱们coder的岁岁年年。本报告的数据来源于我的 GitHub 2019年全年的代码提交数据,经简单的Python网络爬虫与数据分析获得。...
原创
584阅读
0评论
5点赞
发布博客于 1 年前

普通快排和随机快排的世纪大战

算法一直是计算机学科中一个非常核心的内容,学习大黑书可以让我们年轻人得到充沛的力量(也就是少点头发),在程序的海洋里快乐徜徉。排序算法是算法之中一个既基础又核心的内容,而快速排序则是比较排序中的佼佼者。今天我们就一起来探究一下快速排序。普通快速排序快速排序是一个经典的分治算法,解决分治问题的三个步骤就是 分解、解决、合并。拆开来看看快速排序的基本思想:分解 :将输入数组A[l..r]...
原创
824阅读
0评论
0点赞
发布博客于 2 年前

普通快排与随机快排的世纪大战

点击上方“算法与数据之美”,选择“置顶公众号”更多精彩等你来!算法一直是计算机学科中一个非常核心的内容,学习大黑书可以让我们年轻人得到充沛的力量(也就是少点头发),在程序的海洋里快乐徜徉...
原创
18阅读
0评论
0点赞
发布博客于 2 年前

自动化篇 | 模糊匹配助力自动答题

前几天的一篇文章给大家分享了利用 Selenium 自动刷课的脚本,时光飞逝,挂脚本刷完时长,又到了要考试的日子。对于这种 “无关紧要” 的考试,我打算继续使用 聪明 的自动化工具帮我完成考试~爬取题库想要完成作答,免不了需要题库的支撑。考试的题目也都是源于题库,甚至原封不动从题库中抽取题目进行测试。爬虫那可是咱的拿手好戏,说干咱就干!加入必要的 params 参数,构造简单的 reque...
原创
1733阅读
5评论
2点赞
发布博客于 2 年前

数据可视化 | 2019中国最好学科排名

近日,软科发布了2019年“中国最好学科排名”,包含96个国内一级学科的排名榜单,与2018年相比增加了系统科学、兵器科学与技术、风景园林学这三个一级学科。软科世界大学学术排名与泰晤士高等教育世界大学排名、QS世界大学排名、USNews世界大学排名是公认的四大权威大学世界排名。可以说软科发布的排名,具有广泛的公信力。今天,我们就来看看这些排名情况吧!我们需要先来大致了解一下排名方...
原创
687阅读
1评论
2点赞
发布博客于 2 年前

资深抱佛脚玩家的自我修养

随着课程的结束,期末考试的脚步也近了。作为“资深抱佛脚玩家”,在得知准确的考试安排后我便可以及时做好预习准备,从而在 deadline 的压力之下,迸发出惊人的力量,强化自己的学习能力!而期末考试的通知是第一时间发布在培养办的网站上,即该网站是最快获取考试信息的渠道。由于经常手动访问该网站会造成自己的焦虑并且浪费宝贵的时间,我决定用我的好帮手「 网络爬虫 」来帮我自动化监测网站,并且当培养办的...
原创
815阅读
0评论
2点赞
发布博客于 2 年前

B站视频之CC字幕抓取

出于某些不可告人的特殊原因,我需要得到某个B站视频的 「 字幕 」,自己手动记录字幕实在过于繁琐,每几秒都会有字幕不断地更新,一个1小时的视频字幕的收集便是一个浩大的工程~因此我再次召唤我的好帮手 网络爬虫 ,来帮我采集字幕并且以 srt 文件的格式保存。这个 srt 的全称是SubRip Text,这是一种非常流行的文本字幕,包含一行时间,一行字幕,制作规范非常简单。如上图所示,这个字幕是...
原创
2332阅读
0评论
0点赞
发布博客于 2 年前

15年前,一则公路旁的Google的招聘广告

最近小李在看吴军博士的《浪潮之巅》一书,下册书中讲到了Google公司的发展故事,作者用了其14个不为人知或被公众忽略的侧面来描述这个传奇的公司。而在对Google公司的介绍中,一张插图引起了我的注意,这张插图是Google在101号高速公路旁打的大幅招聘广告。这15年前的招聘广告竟如此有创意,现在火热得不可开交的表情包等结合高等数学令人耳目一新的创意来源可能就是来源于此吧~真是江山代有人...
原创
1995阅读
1评论
0点赞
发布博客于 2 年前

经典算法之八皇后问题

八皇后问题是一个古老而又著名的问题,是学习回溯算法的一个经典案例。今天我们就一起来探究一下吧!时间退回到1848年,国际西洋棋棋手马克斯·贝瑟尔提出了这样的一个问题,在8×8格的国际象棋上摆放八个皇后,使其不能互相攻击,即任意两个皇后都不能处于同一行、同一列或同一斜线上,问一共有多少种摆法。后面陆续有不同的学者提出自己的见解。大数学家高斯认为一共有76种摆法,1854年在柏林的象棋...
原创
794阅读
0评论
0点赞
发布博客于 2 年前

S2云顶夺魁助手一键配置!

点击上方“算法与数据之美”,选择“置顶公众号”更多精彩等你来!各位驰骋游戏界的兄弟一定对今年刚出的新游戏云顶之奕不会陌生,小李在毕业后也很少玩英雄联盟了,而云顶之奕的出现又给我挖了个坑。...
原创
26阅读
0评论
0点赞
发布博客于 2 年前

来斗图吧 骚年!

之前有介绍过GitHub上的表情包仓库,但感觉数量太少,不能满足经常斗图的需求,于是我决定从无所不有的互联网中挖掘表情包资源。这次的爬取目标是人均年薪百万的某乎,里面有关表情包的问答,几乎每个回答都给出了大量的表情包,来自五湖四海的网友在某乎以表情包会友,那我就来把你们发的全部都收集起来~首先我们先把所有回答展开,查看全部回答。打开开发者工具,找到回答所在页面,将Requests Head...
原创
459阅读
0评论
0点赞
发布博客于 2 年前

身份证号码的那些事

身份证对我们来说可谓是息息相关的。身份证就是身份的证明,不论是出行坐船、坐火车、坐飞机,还是出门办事情都离不开这个“宝贝”。我们都知道身份证是由18位数字(或者最后一位是X)构成的,那么具体这些数字每一位是如何设置的呢?身份证号码组成下面这个表给出了各位数字的由来。首先是前六位,这六位是地址码,就是户口所在地的对应编号,如下图 110105 就是北京朝阳区的编号;中间的八位是出生日期码,对...
原创
1012阅读
0评论
1点赞
发布博客于 2 年前

你朋友圈发的假图被我发现了!

我们常用的搜索引擎百度,它的搜索框内有一个小相机,不知道大家有没有注意,我们将照片上传可以找到相似图片以及图片的出处。比方我上传一张Ng的图片,百度就会给出它的搜索答案。这件事是如何做到的呢?相似的图片是如何比对找到的呢?其中有一个最基础的算法:“感知哈希”。这个算法的原理是非常直观且易于理解的,它的作用是对每张图片生成一个"指纹",然后比较不同图片的指纹。如果结果接近,就说明图片相...
原创
912阅读
0评论
0点赞
发布博客于 2 年前

花式照片墙之脆皮鹦鹉

观众老爷们,小李今天给大家展示一下我“精湛”的厨艺。如题所示,花式照片墙这道小菜马上给大家端上来,大家吃好喝好。原材料准备:Python3,图片(最好是某一类图片,一家人整整齐齐)这里我使用的是“脆皮鹦鹉”表情包,高糊却又不失档次。佐料:pillow模块,以及一些Python自带的模块原材料处理:咱先来处理一下原材料。把这些图片的大小尺寸给整齐划一了,方便...
原创
913阅读
0评论
0点赞
发布博客于 2 年前

赏心悦目的Print

点击上方“算法与数据之美”,选择“置顶公众号”更多精彩等你来!我们在用Python编程时,经常会用到 print 这个函数,利用 print 大法我们可以作为一种交互,让我们能够随时观察...
原创
15阅读
0评论
0点赞
发布博客于 2 年前

非 “典型” 研究生的一天

点击上方“算法与数据之美”,选择“置顶公众号”更多精彩等你来!早上八点左右睁眼,打开微信,母亲大人一发拼多多三连,牧场、果园、农场,全都安排上!完事之后打开知乎,看看有没有沙雕网友给我点...
原创
35阅读
0评论
0点赞
发布博客于 2 年前

震惊!他竟然用回归分析做这种事

点击上方“算法与数据之美”,选择“置顶公众号”更多精彩等你来!今年的双十一已然过去,之前文章里有提到过我预测了天猫的成交额为2675.55亿元,和真实值的数据非常地相近,有朋友就问我是如...
原创
30阅读
0评论
0点赞
发布博客于 2 年前

数说天猫双十一

点击上方“算法与数据之美”,选择“置顶公众号”更多精彩等你来!又是一年一度的双十一,这个盛大的购物狂欢节如期而至。随着人们生活水平的不断提高,消费能力的大大提升,天猫双十一每一年都在不断...
原创
40阅读
0评论
0点赞
发布博客于 2 年前

深度学习 | 双重注意力机制之CBAM

点击上方“算法与数据之美”,选择“置顶公众号”更多精彩等你来!之前我们分享了2017年的冠军图像分类模型SENet,今天给大家带来的这篇2018年发表在ECCV上的论文不仅考虑到了不同特...
原创
1122阅读
2评论
1点赞
发布博客于 2 年前

深度学习 | SENet

点击上方“算法与数据之美”,选择“置顶公众号”更多精彩等你来!今天给大家分享的是2017年ImageNet的冠军模型 SENet 。WMW团队以极大的优势获得了最后一届ImageNet ...
原创
45阅读
0评论
0点赞
发布博客于 2 年前

GitHub最有毒的仓库

点击上方“算法与数据之美”,选择“置顶公众号”更多精彩等你来!最近在GitHub上发现了一个颇有意思的仓库,它给自己的标签是GitHub最有毒的仓库,我们一起来看看这葫芦里究竟卖的是什么...
原创
44阅读
0评论
0点赞
发布博客于 2 年前

学计算机的男生发这个给我看是什么意思?

点击上方“算法与数据之美”,选择“置顶公众号”更多精彩等你来!今天知乎热榜上出现了一个非常有意思的话题,某个女生收到了男生的一个用Python程序打印出来的爱心,问是何意思。 ...
原创
48阅读
0评论
0点赞
发布博客于 2 年前

知乎微博热榜爬取

点击上方“算法与数据之美”,选择“置顶公众号”更多精彩等你来!热榜是当下互联网上按受关注程度由高到低进行的排行,指热门的排行榜。了解热榜,便可时刻掌握最新潮流动态。百度有风云榜,搜狗有搜...
原创
100阅读
0评论
0点赞
发布博客于 2 年前

全国历史天气图鉴

点击上方“算法与数据之美”,选择“置顶公众号”更多精彩等你来!之前有介绍过新版的pyecharts库,在这国庆到来之际,来实战一下做一做这个全国历史天气图鉴。本文数据全部来源于天气网,利...
原创
61阅读
0评论
0点赞
发布博客于 2 年前

Python爬取英雄联盟职业比赛数据

点击上方“算法与数据之美”,选择“置顶公众号”更多精彩等你来!英雄联盟全球总决赛的脚步近了,代表LPL出征S9的三支战队也已蓄势待发,经常看英雄联盟比赛的我也是非常期待 FPX、RNG、...
原创
387阅读
1评论
1点赞
发布博客于 2 年前

Pyecharts新版本食用指南

pyecharts是我们用来做数据可视化,且非常实用的Python的第三方库。Echarts 是一个由百度开源的数据可视化,凭借着良好的交互性,精巧的图表设计,得到了众多开发者的认可。而...
原创
46阅读
0评论
0点赞
发布博客于 2 年前

Python抓取海量面经,直面秋招

又到了金九时分,要收获一个满意的offer,免不了花心思好好准备。而参考别人的面经,可以让我们在备战秋招时提供不小的帮助。所谓知己知彼,百战不殆,知晓面试流程使得在面试时更有信心应对面试...
原创
85阅读
0评论
0点赞
发布博客于 2 年前