- 博客(62)
- 资源 (4)
- 问答 (1)
- 收藏
- 关注
原创 Python 原生调试器 debug快捷命令简介
源代码:模块定义了一个交互式源代码调试器,用于 Python 程序。它支持在源码行间设置(有条件的)断点和单步执行,检视堆栈帧,列出源码列表,以及在任何堆栈帧的上下文中运行任意 Python 代码。它还支持事后调试,可以在程序控制下调用。调试器是可扩展的——调试器实际被定义为类。该类目前没有文档,但通过阅读源码很容易理解它。扩展接口使用了和模块。
2023-02-02 13:41:20 714 1
原创 Chrome DevTools 中键盘快捷键的参考。
此文章是 Chrome DevTools 中键盘快捷键的参考。将鼠标悬停在 DevTools 的 UI 元素上以显示其工具提示。如果元素有快捷方式,工具提示会包含它。用于打开 DevTools 的键盘快捷键要打开 DevTools,请在光标聚焦在浏览器视口上时按以下键盘快捷键:行动 苹果电脑 视窗/Linux 打开您上次使用的任何面板 Command+Option+I F12或Control+Shift+I 打开控制台面板 Command+Opt...
2021-07-08 13:57:48 928
原创 程序中遇到乱码怎么办?这里有篇乱码恢复指北
tl;dr:需要恢复乱码的访客可使用此类服务,或参考下面的例子与您需要恢复的乱码进行对照。本文尝试对各种乱码的特征进行描述,并给出在各种编码中转换的一些方案。记得原来看到过一张很简明的关于乱码的解释图,不过找不到了。有那张图的同学希望能告诉我一下。2020/02 更新:Misaka00251 有找到那张图发在群组里,这里把它转译为文本放在末尾了。什么编码?这里我们讨论最常见的几个:Windows-1252(CP-1252)、GBK(以及 GB2312。GBK 范围稍大且兼容 GB2312
2021-04-21 17:00:20 8250
原创 常见正则表达式全集
表达式全集字符 描述 \ 将下一个字符标记为一个特殊字符、或一个原义字符、或一个向后引用、或一个八进制转义符。例如,“n”匹配字符“n”。“\n”匹配一个换行符。串行“\\”匹配“\”而“\(”则匹配“(”。 ^ 匹配输入字符串的开始位置。如果设置了RegExp对象的Multiline属性,^也匹配“\n”或“\r”之后的位置。 $ 匹配输入字符串的结束位置。如果设置了RegExp对象的Multiline属性,$也匹配“\n”或“\r”之前的位置。 * 匹配
2021-02-07 10:45:19 290
原创 正则表达式中 常见构造与用法
大写表示“非”,d表示digit数字。非数字就是\D, w表示word,非单词就是\W 元字符 描述 \ 将下一个字符标记符、或一个向后引用、或一个八进制转义符。例如,“\\n”匹配\n。“\n”匹配换行符。序列“\\”匹配“\”而“\(”则匹配“(”。即相当于多种编程语言中都有的“转义字符”的概念。 ^ 匹配输入字符串的开始位置。如果设置了RegExp对象的Multiline属性,^也匹配.
2021-02-05 10:07:18 280
原创 python-docx处理word文档功能详细说明
前言全网找了一番,用python创建和更新word(.docx)文档,还是python-docx包比较好用。依赖Python 2.6, 2.7, 3.3, or 3.4 lxml >= 2.3.2安装模块由于python-docx已经提交给PyPI仓库,所以可以使用pip安装,如下: pip install python-docx 如果同时安装了python2和python3那么pip可能不能用,可以使用pip3来安装,如下: pi...
2020-12-25 13:55:41 5360 1
原创 linux 命令行中对光标常用操作 移动快捷键
有几个常用的快捷键。ctrl+左右键:在单词之间跳转ctrl+a:跳到本行的行首ctrl+e:跳到页尾Ctrl+u:删除当前光标前面的文字 (还有剪切功能)ctrl+k:删除当前光标后面的文字(还有剪切功能)Ctrl+L:进行清屏操作Ctrl+y:粘贴Ctrl+u或ctrl+k剪切的内容Ctrl+w:删除光标前面的单词的字符Alt – d :由光标位置开始,往右删除单词。往行尾删Linux命令行快捷键涉及在linux命令行下进行快速移动光标、命令编辑、编辑后执行历史命令、Bang
2020-10-30 11:14:35 1593
原创 ChromeDriver与Chrome版本对应参照表及ChromeDriver下载链接
ChromeDriver Version Chrome Version 83.0.4103.39 83 83.0.4103.14 83 81.0.4044.138 81 81.0.4044.69 81 81.0.4044.20 81 80.0.3987.106 80 80.0.3987.16 80 79.0.3945.36 79 79.0.3945.16 79 78.0.3904.105 78 78
2020-09-28 17:56:39 863 1
原创 如何用Python快速开发一个企业微信群机器人?
背景企业微信是微信官方推出的用于工作沟通的工具,相较于阿里系的钉钉,拥有可以直接对接微信好友的良好生态闭环,在沟通使用上更具优势,但仍存在一定的不足,在使用体验上来说还是逊色于钉钉。但好在长板足够长,可以接受一些不足。同时,因为企业微信开放了机器人这个接口,在需求定制这个环节上带来了较好的体验,今天就开放api这个环节提供一个快速的参与群内回复机器人的实现。微信官方api介绍1,创建群机器人2,获取机器人token在机器人的属性上,有一个webhook地址链接,格式为.
2020-07-07 11:09:21 4971 1
原创 739. 每日温度
请根据每日气温列表,重新生成一个列表。对应位置的输出为:要想观测到更高的气温,至少需要等待的天数。如果气温在这之后都不会升高,请在该位置用0来代替。例如,给定一个列表temperatures = [73, 74, 75, 71, 69, 72, 76, 73],你的输出应该是[1, 1, 4, 2, 1, 1, 0, 0]。提示:气温列表长度的范围是[1, 30000]。每个气温的值的均为华氏度,都是在[30, 100]范围内的整数。对于题目的理解:1,对于每一个元...
2020-06-23 13:49:55 246
原创 3. 无重复字符的最长子串
给定一个字符串,请你找出其中不含有重复字符的最长子串的长度。示例1:输入: "abcabcbb"输出: 3 解释: 因为无重复字符的最长子串是 "abc",所以其长度为 3。示例 2:输入: "bbbbb"输出: 1解释: 因为无重复字符的最长子串是 "b",所以其长度为 1。示例 3:输入: "pwwkew"输出: 3解释: 因为无重复字符的最长子串是"wke",所以其长度为 3。 请注意,你的答案必须是 子串 的长度,"pwke"是一个子...
2020-06-23 13:42:35 203
原创 Python下对信号的捕获以及优雅的处理
使用任务队列有助于松耦合的设计。有时我们不得不重启服务(比如发新版),但不能打断队列中正在进行的任务。正确的做法是handle sigterm信号,具体代码如下:import signalimport asyncioclass GracefulKiller: is_kill_now = False def __init__(self): signal.signal(signal.SIGINT, self.exit_gracefully) si
2020-06-16 11:37:48 4816 1
原创 LINUX下各个信号以及对应解释说明
信号名优先级解释ACTIONSSIGHUP1/* Hangup (POSIX). */终止进程 终端线路挂断SIGINT2/* Interrupt (ANSI). */终止进程 中断进程 Ctrl+CSIGQUIT3/* Quit (POSIX). */建立CORE文件终止进程,并且生成core文件 Ctrl+\SIGILL4/* Illegal instruction (ANSI). */建立CORE文件,非法指令...
2020-06-16 11:32:47 1378
原创 python库itchat介绍(自动登录微信,自动回复消息)
itchatitchat是一个开源的微信个人号接口,使用python调用微信从未如此简单。使用不到三十行的代码,你就可以完成一个能够处理所有信息的微信机器人。当然,该api的使用远不止一个机器人,更多的功能等着你来发现,比如这些。该接口与公众号接口itchatmp共享类似的操作方式,学习一次掌握两个工具。如今微信已经成为了个人社交的很大一部分,希望这个项目能够帮助你扩展你的个人...
2020-01-16 10:58:27 16074 11
原创 从零开始快速入门google开源BERT模型
什么是BERT?BERT是Google为预训练语言表示而开发的NLP模型。它利用了在网络上公开提供的大量纯文本数据,并且以无人监督的方式进行了培训。对于每种语言,预训练BERT模型是一个相当昂贵但一次性的过程。幸运的是,Google发布了一些经过预先训练的模型,您可以从此处下载。Sentence Encoding/Embedding是许多NLP应用程序所需的上游任务,例如,情绪分析,文...
2020-01-15 10:46:45 1370
原创 mitmproxy 使用教程 从安装到基本操作实现零距离
简介mitmproxy是一个交互式的、支持SSL/TLS的拦截代理,是一款用于HTTP /1,HTTP /2和WebSockets的抓包工具mitmdump是mitmproxy的命令行版本。与tcpdump类似mitmweb是mitmproxy的基于Web的界面的版本。...
2020-01-03 13:26:28 6802
原创 Spark SQL常用函数 函数分类及其简介
Spark SQL函数一、概述1、来源:本文总结自spark 2.3.1 API文档 org.apache.spark.sql:object functions;2、使用:org.apache.spark.sql.functions中提供了约两百多个函数,大部分函数与Hive中类似,除UDF函数,均可在SparkSQL中直接使用;如果想要用于Dataframe 和 Data...
2019-11-27 15:11:06 9192
原创 如何用gradle配置国内阿里云镜像源
使用阿里云国内镜像对单个项目生效,在项目中的build.gradle修改内容buildscript { repositories { maven { url 'http://maven.aliyun.com/nexus/content/groups/public/' } maven{ url 'http://maven.aliyun...
2019-07-23 10:18:07 5524
原创 快速了解Spark语法中 join、leftOuterJoin、rightOuterJoin及fullOuterJoin 的用法以及各自的区别
Spark的join与mysql的join类似,mysql的join是将表与表之间连接查询,spark中join是将RDD数据集进行连接,Spark主要有join、leftOuterJoin、rightOuterJoin及fullOuterJoin这4种连接join:相当于mysql的INNER JOIN,当join左右两边的数据集都存在时才返回leftOuterJoin:相当于mysql...
2019-07-18 15:58:50 10415
原创 Spark学习笔记--超全,所有知识点全覆盖总结
Spark架构,运行原理,任务调度和资源调度分析,内存管理分析,SparkSQL,SparkSreaming与kafaka,数据倾斜的解决,调优。Spark简介Spark是美国加州大学伯克利分校的AMP实验室(主要创始人lester和Matei)开发的通用的大数据处理框架。Apache Spark™ is a fast and general engine for large-s...
2019-06-14 14:08:49 1922
原创 将本地代码上传github完整流程
建立本地仓库1.首先进入目标文件夹cd 目标文件夹/2.执行指令:git init执行git init初始化成功后你会发现项目里多了一个隐藏文件夹.git隐藏的文件夹3.执行指令:git add .将所有文件添加到仓库执行git add .4.执行指令:git commit -m "提交文件"双引号内是提交注释。提交文件2.5...
2019-06-13 15:25:42 436 1
原创 python下的Pandas中DataFrame基本操作,基本函数整理
简介pandas作者Wes McKinney 在【PYTHON FOR DATA ANALYSIS】中对pandas的方方面面都有了一个权威简明的入门级的介绍,但在实际使用过程中,我发现书中的内容还只是冰山一角。谈到pandas数据的行更新、表合并等操作,一般用到的方法有concat、join、merge。但这三种方法对于很多新手来说,都不太好分清使用的场合与用途。构造函数方法 ...
2019-06-13 14:29:59 12208
原创 Linux下使用wc命令快速统计所有文件的行数
语法:wc [选项] 文件…说明:该命令统计给定文件中的字节数、字数、行数。如果没有给出文件名,则从标准输入读取。wc同时也给出所有指定文件的总统计数。字是由空格字符区分开的最大字符串。该命令各选项含义如下: - c 统计字节数。 - l 统计行数。 - w 统计字数。这些选项可以组合使用。输出列的顺序和数目不受选项的顺序和数目的影响。总是按下述顺序显示并且每...
2019-06-13 09:47:53 5927
原创 Python生成器最简单解释
# 本文利用一个标准的生产消费模型,解释了一个最基本的生成器模型.# coding=utf-8import timedef consumer(): abc = None while True: if abc is not None: print('consumer: {}'.format(abc)) abc = yi...
2019-06-05 15:36:26 173
原创 unix中fg、bg、jobs 命令让你的进程在前后台之间切换
Linux下的fg和bg命令是进程的前后台调度命令,即将指定号码(非进程号)的命令进程放到前台或后台运行。比如一个需要长时间运行的命令,我们就希望把它放入后台,这样就不会阻塞当前的操作;而一些服务型的命令进程我们则希望能把它们长期运行于后台。进程前后台操作用到以下命令或按键:Ctrl+C终止并退出前台命令的执行,回到SHELLCtrl+Z暂停前台命令的执行,将该进程放入后台,回...
2019-06-05 14:36:11 711
原创 关于 Python 装饰器,你应该知道的知识
Python 装饰器是一个强大的概念,允许我们使用一个函数 「 包装 」 另一个函数除了正常的职责之外,装饰器的另类使用想法是抽象出你想要一个功能或类做的东西,这可能有很多原因,例如代码重用和坚持科里原则通过学习如何编写自己的装饰器,我们可以显着提高自己代码的可读性,因为它们可以更改函数的行为方式,而无需实际更改代码 ( 例如添加日志记录行 )它们是Python中相当常...
2019-04-26 10:45:13 163
原创 Python格式化字符串f-string f"{}{}{}"详细介绍
简介f-string,亦称为格式化字符串常量(formatted string literals),是Python3.6新引入的一种字符串格式化方法,该方法源于PEP 498 – Literal String Interpolation,主要目的是使格式化字符串的操作更加简便。f-string在形式上是以f或F修饰符引领的字符串(f'xxx'或F'xxx'),以大括号{}标明被替...
2019-04-26 09:12:00 38545 8
原创 linux下的find文件查找命令与grep文件内容查找命令 二者详细区别
在使用linux时,经常需要进行文件查找。其中查找的命令主要有find和grep。两个命令是有区别的。 区别:(1)find命令是根据文件的属性进行查找,如文件名,文件大小,所有者,所属组,是否为空,访问时间,修改时间等。 (2)grep是根据文件的内容进行查找,会对文件的每一行按照给定的模式(patter)进行匹配查找。 一.find命令 ...
2019-04-25 09:53:59 2855
原创 ubuntu系统中修改hosts配置
最近在使用ubuntu开发,难免需要配置hosts,下面介绍以下使用命令进行配置的操作流程。ubuntu下配置host的方法:打开终端输入命令: sudo vim /etc/hosts,在vim中进入插入模式(需要点击insert按键),插入要配置的host地址,模仿已有的配置,比如0.0.0.0 account.jetbrains.com空格前为IP地址,...
2019-04-23 16:41:23 8092
原创 git 常用命令 使用流程 git commit,git status
上传代码步骤:git status git add . git commit -m “ti jiao dai ma”,如果是多行log,则为如下命令: git commit -m 'ti jiao dai ma 注意多行时对应的是单引号 git push origin HEAD:refs/for/master ,git push origin master切换分支查看远程分支...
2019-04-18 17:11:51 830
原创 ubuntu下解压rar文件
安装ubuntu 下rar解压工具安装方法:压缩功能sudo apt-get install rar解压功能sudo apt-get install unrar使用可以直接在UI界面使用了 rar x test.rar
2019-04-16 09:20:26 3938
原创 pandas to_dict 的用法 读取excel时转置每一行为一个dict对象
简介:pandas 中的to_dict 可以对DataFrame类型的数据进行转换可以选择六种的转换类型,分别对应于参数 ‘dict’, ‘list’, ‘series’, ‘split’, ‘records’, ‘index’,下面逐一介绍每种的用法Help on method to_dict in module pandas.core.frame:to_dict(orient='...
2019-04-15 11:13:40 5239
原创 Python将excel文件从xls转换为xlsx
本文使用场景:将一个xls格式Excel文件转换为xlsx文件格式。接下来将一步一步演示该操作。你也可以对代码进行修改使其适用于你所需的场景。安装Python3首先需要安装Python,我这里安装的是Python3.6.4(注意:Python3和2版本语法有改动)到官网进行下载安装。选择对应版本的安装包即可,因为我这台电脑是Win10 64位,所以选择Windows x86-6...
2019-04-12 10:53:19 13320 7
原创 Python之xlsx文件与csv文件相互转换 使用xlrd pands xlwt等库
Python之xlsx文件与csv文件相互转换在Python中,可以使用xlrd和csv模块来处理Excel文件和csv文件。xlsx文件转csv文件import xlrdimport csvdef xlsx_to_csv(): workbook = xlrd.open_workbook('1.xlsx') table = workbook.sheet_by_i...
2019-04-11 11:03:15 1305
原创 Elasticsearch 集群调优建议 yml配置、jvm设定、写入性能优化
生产环境集群搭建建议1.ES设置尽量简洁elasticsearch.yml中尽量只写必备的参数,其他可以通过api动态设置的参数都通过api来设定动态设定的参数有transient和persistent两种设置,前者在集群重启后会丢失,后者不会,但两种设定都会覆盖elasticsearch.yml中的配置。PUT /_cluster/settings{ "persistent"...
2019-04-03 09:19:24 1769
原创 Airflow安装详细介绍以及入门Demo
Airflow 是什么Airflow 是 Airbnb 开发的用于工作流管理的开源项目,自带 web UI 和调度。现在 Apache 下做孵化,地址是https://github.com/apache/airflowairflowAirflow 解决什么问题Airflow 主要解决的问题可以参考 Airbnb 官方的博客:airflow-a-workflow-...
2019-04-01 11:07:37 3903 1
原创 scrapy常用settings.py内设置详情
scrapy常用设置参考手册内置设置参考以下是所有可用Scrapy设置的列表,按字母顺序排列,以及它们的默认值和适用范围。范围(如果可用)显示设置的使用位置,如果它与任何特定组件相关联。在那种情况下,将显示该组件的模块,通常是扩展,中间件或管道。它还意味着必须启用该组件才能使设置产生任何效果。AWS_ACCESS_KEY_ID默认:None需要访问Amazo...
2019-03-29 09:19:26 1107
原创 阿里Canal安装和代码示例 监测mysql数据变化
Canal的简单使用canal可以用来监控数据库数据的变化,从而获得新增数据,或者修改的数据,用于实际工作中,比较实用,特此记录一下Canal简介canal是应阿里巴巴存在杭州和美国的双机房部署,存在跨机房同步的业务需求而提出的。阿里系公司开始逐步的尝试基于数据库的日志解析,获取增量变更进行同步,由此衍生出了增量订阅&消费的业务基于日志增量订阅&消费支持...
2019-03-20 18:50:06 954
原创 scrapy代理proxy的配置方式
根据最新的scrapy官方文档,scrapy爬虫框架的代理配置有以下两种方法:一.使用中间件DownloaderMiddleware进行配置使用Scrapy默认方法scrapy startproject创建项目后项目目录结构如下,spider中的crawler是已经写好的爬虫程序:settings.py文件其中的DOWNLOADER_MIDDLEWARES用于配置scrapy的中间件...
2019-03-15 14:30:34 9951
原创 elasticsearch painless 脚本使用说明(附demo及painless API)
Kibana 提供了一些强大的方法,用于搜索和可视化 Elasticsearch 中存储的数据。为了实现可视化,Kibana 会搜索 Elasticsearch mapping 中定义的 field,并以图表的形式将它们作为选项呈现给用户。但是,如果你忘记在 schema 中将一个重要的值定义为单独的 field 会怎么样呢?或者,如果你想把两个 field 合并到一起该怎么办呢?这时就可以使用 ...
2019-03-06 17:05:36 4014
2023-04-23最新手机号段归属地数据库 496699条
2023-04-23
最新 2023年更新 全国行政区划结构及其行政编码
2023-03-24
yanagishima-22.0-编译后.zip
2020-05-19
全中国180w+邮政编码
2018-08-20
2017年最新手机号段数据库,2017手机号码归属地数据库
2017-11-24
这是一个算法优化题,思路有但是解不出来
2017-08-04
TA创建的收藏夹 TA关注的收藏夹
TA关注的人