python
文章平均质量分 73
阿三先生
好学 积极 上进 乐观
展开
-
Python实现Excel转Html和读取Pdf为Text文本
一、Excel -> Html需求如下:对现有excel文档做分类处理,处理了结果以邮件形式发送!分析:因为是excel文件处理,处理的结果需要展示在邮件中。截图实现:打开处理的excel结果文件,截图,添加截图。因excel无法展示放弃。文件转换:将excel结果文件转为邮件源码Html代码进行展示。代码实现:import openpyxlfrom dominate.tags import *import dominatedef e...原创 2021-09-18 23:59:33 · 849 阅读 · 0 评论 -
最新puppeteer爬虫boss直聘招聘公司及职位信息
失踪人口回归了!由于一直在爬虫,遇到的坑比较多,先大致汇报下1、获取全国所有企业2、通过企查查补充企业信息3、爬虫boss直聘获取公司及职位信息本次先说爬虫boss直聘目的:获取指定城市下的指定行业的招聘公司及招聘职位信息一、试错阶段尝试使用了requests,selenium,pyppeteer,发现都不能正常访问boss直聘,厉害了我的老板...原创 2020-03-17 16:26:16 · 1411 阅读 · 4 评论 -
python爬虫另辟蹊径绕过企查查的登录验证,我太冇财了
从企查查爬取企业信息,如果没有登录直接检索,邮箱、电话都被隐藏了点击详情,部分信息同样会被隐藏毕竟只是打工的,没钱不能任性!想要查看更完整的企业信息,只有登录了。但登录需要滑块验证,有时可能还会有图片验证码但我干不过他们,老大不提供资金支持,那就只能另辟蹊径了。突然看到右下角有三小只,不禁有点想法了是不是可以通...原创 2020-01-14 13:58:02 · 4131 阅读 · 6 评论 -
Python微信公众号后台开发<005>:集成智能聊天机器人
给公众号集成一个智能聊天机器人一、前述ChatterBot是一个基于机器学习的聊天机器人引擎,构建在python上,主要特点是可以自可以从已有的对话中进行学(jiyi)习(pipei)。二、具体1、安装是的,安装超级简单,用pip就可以啦pip install chatterbot2、流程大家已经知道chatterbot的聊天逻辑和输入输出以及存储,是由各种ad...原创 2020-01-10 10:04:49 · 521 阅读 · 0 评论 -
Python微信公众号后台开发<004>:图片上传及返回
你绝对在朋友群看到过类似这样的图片信息:虽然大家都知道是假的,但就是爱玩,同时也给公众号引来了大量粉丝。对于公众号,有时我们会需要返回图片,那么今天就说说怎么成功的返回图片呢?主要流程获取图片图片处理,上传返回图片首先我们需要获取图片的信息,通过@robot.image获取用户图片信息# 用户发送图片@robot.imagedef blog(messag...原创 2020-01-06 15:23:19 · 1469 阅读 · 0 评论 -
Python微信公众号后台开发<003>:自定义菜单
有同学问道微信公众号后台开发的自定义菜单怎么实现?这个问题本来想放到后面的,因为的确对公众号的影响挺明显的,因为开启后台服务,公众号的自定义菜单就不见了,很影响使用,也有同学问这个问题,就提前了,后面如果有进展会进行更新。开发文档:https://developers.weixin.qq.com/doc/offiaccount/Getting_Started/Exp...原创 2020-01-03 11:31:33 · 882 阅读 · 0 评论 -
Python微信公众号后台开发教程<002>
这次实现公众的基本功能:被关注回复、关键词回复、收到消息回复# 订阅后的回复@robot.subscribedef subscribe(): return "***欢迎关注公众号[愉快][愉快][愉快]***\n" \ "***输入任意内容开始与我聊天!\n" \ "***输入'博客'关注我的博客!\n" \ ...原创 2020-01-02 09:40:51 · 289 阅读 · 0 评论 -
Python微信公众号后台开发教程<001>
本篇文章开启Python开发微信公众号后台准备:云服务平台:(我用的是京东云的)公众号:自己注册一个就行Git:代码管理平台了解平台进入公众号后台,查看开发相关项基本配置(服务器配置等):开发者工具(包括开发文档,测试工具等):基本功能code开发使用的是平台提供的werobot框架# -*- coding: utf...原创 2019-12-30 15:22:21 · 1414 阅读 · 3 评论 -
用Python给头像加上圣诞帽或圣诞老人小图标
随着圣诞的到来,想给给自己的头像加上一顶圣诞帽。如果不是头像,就加一个圣诞老人陪伴。用Python给头像加上圣诞帽,看了下大概也都是来自2017年大神的文章:https://zhuanlan.zhihu.com/p/32283641主要流程素材准备人脸检测与人脸关键点检测调整大小,添加帽子用dlib的正脸检测器进行人脸检测,用dlib提供的模型提取人脸的五个关...原创 2019-12-24 15:48:29 · 1469 阅读 · 0 评论 -
python爬虫公众号所有信息,并批量下载公众号视频
之前写过一篇类似的文章:python爬取公众号,用最简单的方式爬虫还有同学一直在问,可能中间有一些小细节不明确,这次彻底明确一下细节。本篇添加一个批量下载公众号内视频的功能,可以实现完全复制一个公众号,危险动作,请不要操作!谢谢主要功能如何简单爬虫微信公众号获取信息:标题、摘要、封面、文章地址自动批量下载公众号内的视频本次选取的公众号:熊孩子与萌宠...原创 2019-12-10 08:54:49 · 2063 阅读 · 1 评论 -
nlp自然语言处理中句子相似度计算
在做自然语言处理的过程中,现在智能对话比较火,例如智能客服,智能家电,智能音箱等,我们需要获取用户说话的意图,方便做出正确的回答,这里面就涉及到句子相似度计算的问题,那么本节就来了解一下怎么样来用 Python 实现句子相似度的计算。句子相似度常用的几种方法:1、编辑距离2、杰卡德系数计算3、Word2Vec 计算编辑距离,英文叫做 Edit Distance,又称 Levensht...原创 2019-11-28 14:21:15 · 1462 阅读 · 0 评论 -
别再裸奔了,你的项目代码安全吗,再不加密就out了
在工作中,有时候我们需要部署自己的Python应用 或进行私有化部署时,尤其现在都是通过docker镜像部署,我们并不希望别人能够看到自己的Python源程序。加密Python源代码的方式,是将.py文件转化为.so文件,这样加密的可靠性非常高,无法破解,也就很好地保护了源代码。加密过程中会产生很多多余文件,加密后可以删除,我这里用了脚本一步完成加密流程 1、项目文件...原创 2019-11-25 10:26:50 · 826 阅读 · 2 评论 -
Python使用RMF聚类分析客户价值
投资机构或电商企业等积累的客户交易数据繁杂。需要根据用户的以往消费记录分析出不同用户群体的特征与价值,再针对不同群体提供不同的营销策略。用户分析指标根据美国数据库营销研究所Arthur Hughes的研究,客户数据库中有三个神奇的要素,这三个要素构成了数据分析最好的指标R-最近一次消费(Recency)F-消费频率(Frequency)M-消费金额(Monetary)...原创 2019-11-14 17:25:34 · 1347 阅读 · 1 评论 -
pyecharts的V1.5绘画优美地图
版本:pyecharts 分为 v0.5.X 和 v1 两个大版本,v0.5.X 和 v1 间不兼容,v1 是一个全新的版本v0.5.X支持 Python2.7,3.4+经开发团队决定,0.5.x 版本将不再进行维护v1仅支持 Python3.6+新版本系列将从 v1.0.0 开始因之前的版本是低于0.5的,许多同学使用中带来很多问题,所以现在升级代码版本注意:这...原创 2019-10-30 09:33:19 · 3279 阅读 · 4 评论 -
Python的接口的单元测试并自动将结果发至邮件
流程介绍:1、搭建一个服务2、编写接口单元测试3、将单元测试生成报告并自动发送邮箱1、简单的服务2、单元测试:已test开头,与server同级目录配置参数文件api.py,内容如下:class URL(object): #测试环境的接口地址 base_test_url ="http://127.0.0.1:8000" #生产环境的接口地址...原创 2019-10-28 10:16:52 · 349 阅读 · 0 评论 -
docker:如果提示gpg: 找不到有效的 OpenPGP 数据。先添加pgp key
安装curl获取并安装dockersudo curl -fsSL https://get.docker.com/| sh如果提示gpg: 找不到有效的 OpenPGP 数据。先添加pgp keysudocurl -fsSL https://get.docker.com/gpg | sudo apt-key add -再执行获取包的命令,在国内网络问题可能安装失败,因为已经添加过源列表,可以直接执行...原创 2018-07-05 00:08:10 · 12215 阅读 · 2 评论 -
python:pyecharts地图功能,并解决显示不全或只显示南海诸岛问题解决
from pyecharts import Geo, Map province_distribution = {'河南': 45, '北京': 97, '河北': 21, '辽宁': 12, '江西': 6, '上海': 20, '安徽': 10, '江苏': 16, '湖南': 9, '浙江': 13, '海南': 2, '广东': 22, '湖北': 8, '黑龙江': 11, '澳...原创 2018-07-05 00:09:52 · 11761 阅读 · 6 评论 -
python爬取公众号,用最简单的方式爬虫
目标公众号:吃鸡搞笑视频设备:python集成工具--pyCharm之所以称之为最近单方式,是因为--代码少,效果好 这里只爬了公众号的标题和链接,先上效果效果图操作步骤:1、先自己申请一个公众号,链接:https://mp.weixin.qq.com/2、登录自己的账号,新建文章图文,点击超链接image.png 3、弹出搜索框,搜索自己需要的公...原创 2018-07-25 10:14:00 · 11289 阅读 · 4 评论 -
python面试题:python计算股票收益最大化
思路:计算差值: 后一天的价格 - 前一天的价格如果是正数,说明股票上涨,连续为正则为持续上涨,仍然是赚的如果是负数,股票下跌,不持有该股,不管我们的事代码:import randomlistOne = []for i in range(10): temp = random.randint(10,100) listOne.append(temp)# 测试数据 股票价格p...原创 2018-07-14 11:59:43 · 5287 阅读 · 0 评论 -
python最全画地图,可视化数据
注意:这里的版本是 pyecharts-0.1.9.4注意:这里的版本是 pyecharts-0.1.9.4注意:这里的版本是 pyecharts-0.1.9.4新版本我会更新,并附上新文章有时我们会很希望把数据展示在地图上,来做数据可视化,使数据更加清晰明了,可谓一图胜百文。先说说我用地图做什么了:微信好友全国分布,显示票房省份数据,全国评分显示等等,我这个语言能力很是头疼啊,进入正...原创 2018-08-17 18:56:23 · 107758 阅读 · 53 评论 -
python处理wav音频文件:音频信息,读取内容,获取时长,切割音频,pcm与wav互转
因为工作中用到了wav格式的音频,所以就搜集了一些关于wav音频的处理。主要包括:音频信息,读取内容,获取时长,切割音频,pcm与wav互转获取音频信息:with wave.open(wav_path, "rb") as f: f = wave.open(wav_path) print(f.getparams())返回内容为:声道,采样宽度,帧速率,帧数,唯一标识...原创 2018-12-22 22:27:22 · 33436 阅读 · 7 评论 -
我是怎么从30个并发平均每个2000毫秒 到 300个并发平均每个178毫秒的
最近一个多月一直在做服务器的性能优化,老大的要求是要做到300个并发,控制在200毫秒以内,就说说我最近做的内容吧。从30个并发平均每个2000毫秒 到 300个并发平均每个178毫秒简单介绍一下做了那些优化:01、减少log日志的打印02、减少redis的交互03、耗时操作的处理04、大文件信息的存储05、python的缓存机制06、异步处理非返回操作一、定位耗时操作 -- ...原创 2019-01-03 15:27:39 · 1947 阅读 · 0 评论 -
Python:TTS语音合成技术,市场各大平台对比以及实现
前景提要:在线的实时合成TTS技术,巴拉巴拉... 此处省略3千字市场的TTS平台:讯飞科技,百度智能语音开放平台,阿里云,腾讯云,思必驰,捷通华声(灵云TTS的合成简单来说就三大步:1️⃣创建应用2️⃣发起请求3️⃣解析音频数据,合成音频文件咱们废话不说一个一个来:一、讯飞,音频届的老大哥支持多种语言开发,选择适合自己的,我这里选的是WebAPI:01、创建应用...原创 2019-03-05 09:30:47 · 5676 阅读 · 0 评论 -
python pickle 模块的使用以及2种典型报错处理
用于序列化的两个模块 json:用于字符串和Python数据类型间进行转换 pickle: 用于python特有的类型和python的数据类型间进行转换 json提供四个功能:dumps,dump,loads,load pickle提供四个功能:dumps,dump,loads,loadpickle可以存储什么类型的数据呢?所有python支持的原生类型:布尔值,整数,浮点数...原创 2019-05-10 12:09:45 · 3931 阅读 · 0 评论 -
用Python调教微信,实现自动回复 和 微信好友分布,好友性别图,好友标签
官方华丽的术语---略一个自动回复机器人微信自上线以来,一直没有自动回复的功能,想必是有他们的理念。但是有些人群,确实对此功能有一定需求,我举两个栗子:不愿时刻被消息打扰的人消息需要批量处理的人们(比如微商)设计了几个功能:[x] 收到消息立即自动回复[x] 收到消息延迟指定时间回复[x] 对不同好友定制不同的回复内容[x] 在手机端随时进行控制itchat的原理是通过扫码进行远程微信网页端的登录...原创 2018-07-05 00:05:46 · 1165 阅读 · 0 评论