自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

陆壹佛爷Tong_T

Researcher in Chonnam National University until 2018/6. Now working on Mei Zhai Technology (Beijing)...

原创 学习在Python中使用进度条,介绍4种不同的库(命令行和UI)

进度条很棒 进度条是流程完成所需时间的直观表示。它们使您不必担心进程是否挂起或尝试预测代码的运行情况。您可以直观地实时看到脚本的进展情况! 如果您以前从未考虑过或使用过进度条,则很容易假设它们会给您的代码增加不必要的复杂性,并且难以维护。事实与事实相去甚远。在仅几行代码中,我们将看到如何在我们的命...

2019-12-31 10:22:52

阅读数 48

评论数 0

原创 佛爷带你认识和理解统计学,来自一名Machine Learning工程师Rules

一、基本认识数据和统计概念 数据 定性数据: 性别:男,女 颜色:赤,橙,黄,绿,青,蓝,紫 教育程度:小学,初中,高中,本科,硕士,博士 评价:好评,中评,差评 定量数据: 年份:2019,2018,2017,2016, 2015 温度:10,15,20,25,30,35,40, 45 身高:1...

2019-12-30 18:16:52

阅读数 80

评论数 0

原创 带装饰器的Python中的简化多进程、多线程并发(装饰并发-Python多线程、进程神器)

多线程、多进程、协程的基本原理概念、以及Python中的基本实现方法。请看笔者之前的写的文章。 传送门-Python中理解进程(Process),线程(Thread)和协程(Coroutines)的感悟 威斯康星大学麦迪逊分校的Alex Sherman和Peter Den Hartog编写了一个...

2019-11-14 11:57:50

阅读数 6793

评论数 0

原创 机器学习引入Streamlit,这是一个为ML构建的Web App框架

Streamlit是一个开源Python库,可轻松构建用于机器学习的漂亮应用程序。 安装Streamlit,将其导入,编写一些代码,然后运行脚本。Streamlit会监视每次保存和更新的更改,并在编码时可视化您的输出。代码从上到下运行,始终从干净状态开始,不需要回调。这是一个简单而强大的应用程序模...

2019-11-08 13:45:20

阅读数 9401

评论数 0

转载 七步完美解决问题python爬虫极验滑动验证码问题

滑动验证码的识别介绍 本节目标: 用程序识别极验滑动验证码的验证,包括分析识别思路、识别缺口位置、生成滑块拖动路径、模拟实现滑块拼合通过验证等步骤。 准备工作: 本次案例我们使用Python库是Selenium,浏览器为Chrome。请确保已安装Selenium库和ChromeDriver浏览器驱...

2019-11-04 16:01:01

阅读数 9584

评论数 0

原创 佛爷带你微信公众号定时推送鸡汤消息,给2019考研人送一点温暖

此脚本用到了2个公共API,1. 微信测试公众号官方接口 2. 爱词霸每日推送接口 微信开发已经活跃了很长时间了,在微信开发中有一个神奇的接口它叫模板消息接口,它可以根据用户的openid从服务端给用户推送自定义的模板消息,正因如此,我们可以利用这个特征在服务器端随时向用户推送消息(前提是该用户关...

2019-10-17 18:58:31

阅读数 12266

评论数 0

原创 佛爷带你使用自动编码器(卷积神经网络CNN)构建一个简单的图像检索系统

在本文中,我们学习了使用自动编码器和最近邻居算法创建一个非常简单的图像检索系统。我们在大型数据集上训练自动编码器,以使其学习有效编码每个图像的视觉内容的方法。然后,我们将查询图像的代码与搜索数据集的代码进行比较,并检索出最接近的5个代码。我们看到,由于我们检索到的5幅图像的视觉内容接近我们的查询图...

2019-10-15 14:39:06

阅读数 12890

评论数 4

翻译 即学即用的30段Python实用代码

原标题 | 30 Helpful Python Snippets That You Can Learn in 30 Seconds or Less 作 者 | Fatos Morina 翻 译 | 陆壹佛爷 Python是目前最流行的语言之一,它在数据科学、机器学习、web开发、脚本编写、自动化...

2019-09-29 15:49:14

阅读数 13738

评论数 0

原创 Python PIL 来制作微信国旗头像,别再@微信官方了

Python3.7 依赖库: PIL 提供功能: 在指定图像右下角添加圆形小图标; 添加指定文字logo到图像右下角; 保存融合图像 from PIL import Image, ImageDraw, ImageFont import logging class AvatarTagger(...

2019-09-26 12:26:35

阅读数 14414

评论数 2

原创 惊为天人,NumPy 手写全部主流机器学习模型,代码超 3 万行

用 NumPy 手写所有主流 ML 模型,普林斯顿博士后 David Bourgin 最近开源了一个非常剽悍的项目。超过 3 万行代码、30 多个模型,这也许能打造「最强」的机器学习基石? NumPy 作为 Python 生态中最受欢迎的科学计算包,很多读者已经非常熟悉它了。它为 Python ...

2019-07-08 16:28:53

阅读数 46008

评论数 0

转载 佛爷带你在系统架构中关注缓存——先写DB还是「缓存」?

本文转载自: 【系统架构】缓存关注点——先写DB还是「缓存」? 一个程序可以没有缓存,但是一定要有数据库。这是大家的普遍观点,所以数据库的重要性在你的潜意识里总是被放在了第一位。 先DB再缓存 如果不细想的话你可能会觉得,数据库操作失败了,自然缓存也不用操作了;数据库操作成功了,再操作缓存,没毛病...

2019-07-08 16:11:45

阅读数 45945

评论数 0

原创 完整总结高效的 PyCharm 使用技巧

今天先从 PyCharm 入手,写一些可以明显改善开发效率的使用技巧,一旦学会,受用一生。以下代码演示是在 Mac 环境下,Windows 也类似,Command 键 相当于 Windows 上的 Control 键。1. 代码排版,自动PEP8pep8 是Python 语言的一个代码编写规范。如...

2019-07-04 15:09:21

阅读数 52516

评论数 0

转载 Haishoku -- 基于 python3 开发的获取图片主色调及主要配色的库

在平时工作和生活中经常看到一些颜色很好看的图片,就我个人而言,很想有这样一个工具能够获取到任意一张图片的配色以及主色调,之前看到有人分享过自己开发的 iOS 端的取配色工具,但个人觉得这种工具在 pc 上的需求更大,于是便尝试用 python 写了这样一个库。以下: Haishoku Haisho...

2019-06-18 16:59:35

阅读数 52997

评论数 0

原创 Python来做图像处理以及视音频文件分离和合成

一、简介 Imageio是一个Python库,提供了一个简单的界面来读取和写入各种图像数据,包括动画图像,视频,体积数据和科学格式。它是跨平台的,运行在Python 2.7和3.4+上,易于安装。 作为用户,您只需要记住一些功能: imread()和imwrite() - 用于单个图像 mimr...

2019-06-18 15:50:30

阅读数 54913

评论数 0

原创 佛爷带你放弃Selenium,转向更高效的自动化测试利器Pyppeteer

提起selenium想必大家都不陌生,作为一款知名的Web自动化测试框架,selenium支持多款主流浏览器,提供了功能丰富的API接口,经常被我们用作爬虫工具来使用。但是selenium的缺点也很明显,比如速度太慢、对版本配置要求严苛,最麻烦是经常要更新对应的驱动。 web自动化测试工具Pypp...

2019-06-18 12:29:45

阅读数 53104

评论数 0

原创 在Python和Surprise,Collaborative Filtering的帮助下学习如何构建自己的推荐引擎

推荐系统是数据科学中最常用和易于理解的应用之一。由于互联网的快速发展和信息过载问题,在这个领域已经做了很多工作,这方面的兴趣和需求仍然很高。在线企业必须帮助用户处理信息过载并向他们提供个性化的推荐,内容和服务。 接近推荐系统的两种最流行的方法是协同过滤和基于内容的推荐。在这篇文章中,我们将重点关注...

2019-05-08 13:58:50

阅读数 52851

评论数 0

原创 佛爷带你利用知晓云构建在线数据库增删改查接口实现(Python)

知晓云介绍 官方文档介绍: 知晓云是个好用、顺手的小程序开发工具。它免去了小程序开发中服务器搭建、域名备案、数据接口实现等繁琐流程。让您专注于业务逻辑的实现,使用知晓云开发小程序,门槛更低,效率更高。 其他定义: 「知晓云」是国内第一个专注于微信小程序开发的 MBaaS(后端即服务)服务平台。 只...

2019-05-01 20:49:47

阅读数 53052

评论数 0

原创 用20 newsgroups数据来进行NLP处理之文本分类

数据集介绍 20 newsgroups数据集18000篇新闻文章,一共涉及到20种话题,所以称作20 newsgroups text dataset,分文两部分:训练集和测试集,通常用来做文本分类. sklearn提供了该数据的接口:sklearn.datasets.fetch_20newsgro...

2019-05-01 12:07:54

阅读数 53197

评论数 0

转载 从青铜到王者,进阶数据可视化2.0的五个Python库!

数据可视化的工具和程序库已经极大丰盛,当你习惯其中一种或数种时,你会干得很出色,但是如果你因此而沾沾自喜,就会错失从青铜到王者的新工具和程序库。如果你仍然坚持使用Matplotlib(这太神奇了),Seaborn(这也很神奇),Pandas(基本,简单的可视化)和Bokeh,那么你真的需要停下来了...

2019-03-17 19:42:14

阅读数 52911

评论数 0

原创 9个冷门的用于数据科学的Python库,但是的确很强大

超越pandas,scikit-learn和matplotlib,学习一些在Python中进行数据科学的新技巧。 Python是一种很棒的语言。事实上,它是世界上发展最快的编程语言之一。它一次又一次证明了它在开发人员工作角色和跨行业的数据科学职位中的实用性。整个Python及其库的生态系统使其成为...

2019-03-12 17:21:11

阅读数 52888

评论数 0

原创 佛爷芸:机器学习算法面试知识点无序总结(不定期更新)

1.请简要介绍下SVM。 SVM,全称是support vector machine,中文名叫支持向量机。SVM是一个面向数据的分类算法,它的目标是为确定一个分类超平面,从而将不同的数据分隔开。 扩展: 支持向量机学习方法包括构建由简至繁的模型:线性可分支持向量机、线性支持向量机及非线性支持向量机...

2019-03-12 14:48:15

阅读数 52948

评论数 0

原创 深度学习之卷积神经网络(Convolutional Neural Network)系列理论详解和实现

一、卷积神经网络(CNN)历史简述 CNN最早可以追溯到1968Hubel和Wiesel的论文,这篇论文讲述猫和猴的视觉皮层含有对视野的小区域单独反应的神经元,如果眼睛没有移动,则视觉刺激影响单个神经元的视觉空间区域被称为其感受野(Receptive Field)。相邻细胞具有相似和重叠的感受野。...

2019-03-03 12:52:20

阅读数 55250

评论数 0

原创 佛爷带你玩被火速封杀的Deepfake黑科技,用FakeApp深度换脸

介绍 Deepfake是一种人工智能基础的人物图像合成技术。它用于使用称为“ 生成对抗性网络 ”(GAN)的机器学习技术将现有图像和视频组合并叠加到源图像或视频上。现有视频和源视频的组合产生假视频,该视频显示在现实中从未发生过的事件中执行动作的一个或多个人。 例如,可以创建这样的假视频,以显示执行...

2019-02-23 12:33:09

阅读数 109265

评论数 3

原创 Python用遗传算法求复杂函数在一个区间内的最大值(优化目标函数方法)

Geatpy是一个高性能的Python遗传算法库以及开放式进化算法框架,由华南理工大学、华南农业大学、德州奥斯汀公立大学学生联合团队开发。 Website (including documentation): http://www.geatpy.com Source: https://githu...

2019-01-16 17:42:24

阅读数 55017

评论数 12

原创 佛爷用Flask搭建前后端全栈网站(Machine Learning 数据标注工具)步骤详解

一、Flask Flask是一个使用 Python 编写的轻量级 Web 应用框架。其 WSGI 工具箱采用 Werkzeug ,模板引擎则使用 Jinja2 。Flask使用 BSD 授权。 简单点说就是后端开发框架。简单分析下Python做Web开发的几个常用框架: Django:是一个重武...

2018-12-07 10:42:23

阅读数 53128

评论数 0

转载 深度学习之图像中文字的定位和识别

---- (转自 小白笑苍) 复杂的图片文字识别与定位传统OCR以及opencv做的效果好很难,现在一般使用深度学习来做,网上也有不少开源的: 1. 图片文字的定位:https://github.com/tianzhi0549/CTPN 2. 图片文字识别: https://github....

2018-11-19 15:20:22

阅读数 55993

评论数 9

翻译 如何使用Keras网格搜索Python中的深度学习模型的超参数

原文:How to Grid Search Hyperparameters for Deep Learning Models in Python With Keras 作者:Jason Brownlee 翻译:陆壹佛爷 超参数优化是深度学习的重要组成部分。 原因是神奇网络的配置非常困难,并且需...

2018-10-16 11:51:47

阅读数 53808

评论数 5

原创 Python自定义批量合并拼接图像、批量裁剪图像

笔者在工作的时候,往往可视化很多算法结果,但是做分析的时候就有点头疼,超级多图,可能要两两比较或者几几比较,一张张翻图并不是最优的方式。根据所需拼接图片,然后再分析是一个很高效的事儿。于是基于Python3,就有了如下的代码,可以加一层GUI代码封装成.exe应用,但是对于我来说就没有必要了。大家...

2018-10-15 13:02:46

阅读数 56641

评论数 0

原创 Python3操作AutoCAD:利用pyautocad库能够自动化地进行CAD画图

笔者其实是一名机器学习算法工程师,工作中最痛苦的事儿就是标注数据。而我遇到的不仅仅是标注类别、标签之类的,我需要标注户型图中餐厅和客厅的分区多边形,这个就需要我读取户型图数据(也就是坐标点),然后画图画出来,分析后进行分区画框(其实就是找出分区坐标点)。这个项目工作任务量还是很大,难度也不低,标注...

2018-10-12 16:52:58

阅读数 68647

评论数 31

原创 佛爷带你用Python写一个USB病毒(自动复制U盘所有内容到指定本地磁盘地址)

致力想当一名骇客的笔者闲着无聊,做一个小工具玩玩,代码量不大,用Python写一个脚本检测U盘的插入和复制U盘内容到本地计算机上(大家可以扩展为上传到具体某个服务器上或者什么)。然后打包成可执行文件(后台运行、有窗口运行),并且添加到电脑开机启动进程里。 Windows版本 直接上代码,代...

2018-08-21 15:07:43

阅读数 56034

评论数 0

原创 随机给定四个坐标点,判断是否可以组成矩形,如果可以,输出逆时针坐标点排序

题目:随机给定四个坐标点,判断是否可以组成矩形,如果可以,输出逆时针坐标点排序 完成这个算法,分为两个步骤。一就是判断是否为矩形。这个可以用矩形的定义,也可以找到一些特定的相等关系。这里求解的办法有很多,但是很多都是依赖四个坐标点顺序排列,笔者思考的这个求解方法,适用于随机四个点: 二就是...

2018-08-21 14:35:21

阅读数 55269

评论数 0

原创 全栈工程师养成攻略之零散小Tips(不定期更新)

调侃描述: 全栈工程师 = 屌丝战斗机 = 系统+网络+dba+架构+安全 = 没女朋友,拿一份工资做三份事情的典型、每个站长都是一个全栈工程师,每个站群的站长都是超级全栈工程师。 专业描述: 全栈开发 = 前端+后端+系统+…….. 项目如何书写 项目书写原则与框架 ·项...

2018-08-21 10:05:10

阅读数 52966

评论数 0

转载 如何在Python中实现这五类强大的概率分布

如何在Python中实现这五类强大的概率分布 <!-- BEGIN .entry-header --> <!-- BEGIN .entry-met...

2018-08-08 11:52:03

阅读数 54133

评论数 0

转载 使用sklearn做单机特征工程

目录 1 特征工程是什么?2 数据预处理  2.1 无量纲化    2.1.1 标准化    2.1.2 区间缩放法    2.1.3 标准化与归一化的区别  2.2 对定量特征二值化  2.3 对定性特征哑编码  2.4 缺失值计算  2.5 数据变换  2.6 回顾3 特征选择  3.1 Fi...

2018-08-08 11:20:18

阅读数 52854

评论数 0

原创 黑客小攻略 -- 使用Python通过带有GPS信息的照片进行监控定位

EXIF 可交换图像文件常被简称为EXIF(Exchangeable image file format),是专门为数码相机的照片设定的,可以记录数码照片的属性信息和拍摄数据。 EXIF信息以0xFFE1作为开头标记,后两个字节表示EXIF信息的长度。所以EXIF信息最大为64 kB,而内部采...

2018-06-20 20:36:50

阅读数 56043

评论数 0

原创 python-nmap做端口扫描器教程

NMap,也就是Network Mapper,最早是Linux下的网络扫描和嗅探工具包。 nmap是一个网络连接端扫描软件,用来扫描网上电脑开放的网络连接端。确定哪些服务运行在哪些连接端,并且推断计算机运行哪个操作系统(这是亦称 fingerprinting)。它是网络管理员必用的软件之一,以及...

2018-06-07 01:05:32

阅读数 55563

评论数 5

原创 佛爷带你用Python可视化分析 ”绝地求生1800万游戏数据“,稳稳吃鸡!

98k消音,了解一下~ 经常玩吃鸡游戏,我们现在来分析一下过去一年 1800万条游戏数据,看看有什么套路帮我们吃到鸡。

2018-05-19 22:06:33

阅读数 55728

评论数 1

原创 Python小微坑填坑系列

Python3.6.3版本下运行,不定期更新,寻找坑位中 坑位1: from random import shuffle l = [1, 3, 4, 5] new_l = [] for _ in range(5): shuffle(l) new_l.append(...

2018-05-18 17:09:39

阅读数 52946

评论数 0

原创 网易云音乐推荐系统简单实现系列(2)

1. 歌曲序列建模 我们来分析一下现在的场景,我们实际是需要计算user或者item的相似度,协同过滤等neighborhood的方法是其中的一种。 关于相似度这个问题,我们不是第一次遇见,我们在NLP的机器学习问题中,需要把词映射成词向量,最简单的方式是one-hot,而为了达到更好的效果,...

2018-05-18 16:34:03

阅读数 56952

评论数 0

原创 网易云音乐推荐系统简单实现系列(1)

笔者最近面试到了网易新闻推荐部门,考了一点推荐系统的知识,算是被虐惨了。于是乎自己怒补了一些知识。记录一点关于推荐系统的知识和实现。 音乐推荐系统,这里的简单指的是数据量级才2万条,之后会详细解释。 1. 推荐系统工程师人才成长RoadMap 2. 1. 数据的获取 ...

2018-05-17 17:49:28

阅读数 63136

评论数 11

提示
确定要删除当前文章?
取消 删除