是杰夫呀
码龄7年
  • 2,853,670
    被访问
  • 364
    原创
  • 873,621
    排名
  • 35,328
    粉丝
关注
提问 私信

个人简介:记录学习的点点滴滴。

  • 加入CSDN时间: 2015-03-23
博客简介:

给我一点温度

博客描述:
金融科技FinTech~用来记录问题与解决方案的笔记本。代码仓库:https://github.com/xiaoshuwen1995
查看详细资料
个人成就
  • 获得1,808次点赞
  • 内容获得560次评论
  • 获得6,352次收藏
创作历程
  • 3篇
    2021年
  • 98篇
    2020年
  • 264篇
    2019年
成就勋章
TA的专栏
  • 推荐系统 RecommenderSystem
    24篇
  • 算法 Algorithm
    21篇
  • 自然语言处理 NLP
    26篇
  • Python
    89篇
  • 面试笔记 Interview
    24篇
  • 监控
    2篇
  • Linux
    11篇
  • 数据结构 Data Structure
  • 深度学习 DeepLearning
    2篇
  • PyCharm
    14篇
  • Tensorflow
    6篇
  • HBase
    1篇
  • Git
    1篇
  • 特征工程 FeatureEngineering
    7篇
  • Pytorch
    2篇
  • Pandas
    30篇
  • 剑指Offer
    7篇
  • 洛谷 Luogu
    25篇
  • 中台 Platform
    4篇
  • 博士 Doctor
    2篇
  • ElasticSearch
    2篇
  • 系统架构 Structure
    7篇
  • Java
    6篇
  • Excel
    4篇
  • 网课 Course
    5篇
  • Windows
    12篇
  • SQL
    18篇
  • Hive
    7篇
  • PySpark
    16篇
  • 数据库 Database
    12篇
  • Notepad++
    1篇
  • 云 Cloud
    1篇
  • Hadoop
    5篇
  • Spark
    13篇
  • 最近
  • 文章
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

Python 二进制、八进制、十进制、十六进制的相互转换

转为十进制(int)使用 int() 函数的结果是十进制。第一个参数是字符串,第二个参数是说明字符串本身是几进制的数。int('100',2) #4int('13',8) #11int("oxf",16) #15转为二进制(bin)bin(10) #0b1010bin(int('ff',16)) #十六进制->十进制->二进制。结果是0b11111111bin(int('17',8)) #八进制->十进制->二进制。结果是0b1111转
原创
发布博客 2021.04.07 ·
535 阅读 ·
0 点赞 ·
1 评论

Python 二维列表(list)的初始化

Python初始化一个m * n的二维list:list = [[0] * m for _ in range(n)]不能直接用:b = [[0] * 5] * 5因为这样相当于把[0]*5这个一维列表复制了5次,因此更改[0]*5中的任意一个元素,都会同时修改其他四个复制的列表。...
原创
发布博客 2021.04.05 ·
898 阅读 ·
0 点赞 ·
0 评论

MySQL中的UTF8和UTF8mb4编码的详细区别

一、区别MySQL在5.5.3之后增加了这个utf8mb4的编码,mb4就是most bytes 4的意思,专门用来兼容四字节的unicode。好在utf8mb4是utf8的超集,除了将编码改为utf8mb4外不需要做其他转换。utf8mb4占用的存储空间会略大一些。二、原因描述那上面说了既然UTF-8能够存下大部分中文汉字,那为什么还要使用utf8mb4呢? 原来mysql支持的 utf8 编码最大字符长度为 3 字节,如果遇到 4 字节的宽字符就会插入异常了。三个字节的 UTF-8 最大能编
原创
发布博客 2021.03.05 ·
257 阅读 ·
1 点赞 ·
0 评论

百度NLP工具LAC初体验:分词,词性标注,命名实体识别

输入:from LAC import LAC# 装载LAC模型lac = LAC(mode='lac')# 单个样本输入,输入为Unicode编码的字符串text = u"LAC是个优秀的分词工具"lac_result = lac.run(text)print(lac_result)# 批量样本输入, 输入为多个句子组成的list,平均速率更快texts = [u"LAC是个优秀的分词工具", u"百度是一家高科技公司"]lac_result = lac.run(texts)
原创
发布博客 2020.12.07 ·
2627 阅读 ·
1 点赞 ·
0 评论

微服务之服务监控

监控微服务服务监控在微服务改造过程中的重要性不言而喻,没有强大的监控能力,改造成微服务架构后,就无法掌控各个不同服务的情况,在遇到调用失败时,如果不能快速发现系统的问题,对于业务来说就是一场灾难。监控微服务调用前,首先你要搞清楚三个问题:监控的对象是什么?具体监控哪些指标?从哪些维度进行监控?下面就从这三个问题开始,一起来看看如何监控微服务调用。监控对象既然要监控,那么要监控哪些对象呢?根据我的实践经验,对于微服务系统来说,监控对象可以分为四个层次,由上到下可归纳为:...
原创
发布博客 2020.12.07 ·
1138 阅读 ·
0 点赞 ·
0 评论

微服务之服务监控稳定性

最近一直在忙 618 大促的全链路压测 & 稳定性保障相关工作,结果 618 还未开始,生产环境就出了几次生产故障,且大多都是和系统稳定性、性能相关的 bad case。生产全链路压测终于告一段落,抽出时间将个人收集的稳定性相关资料整理 review 了一遍,顺带从不同的维度,谈谈稳定性相关的 “务虚” 认知和思考。。。一、SLA在开始谈稳定性保障之前,我们先来聊聊业内经常提及的一个 Topic:SLA!业内喜欢用 SLA (服务等级协议,全称:service level a...
原创
发布博客 2020.12.02 ·
1542 阅读 ·
1 点赞 ·
0 评论

数据一致性 一文读懂

数据不一致产生的原因互联网的工程开发,与传统软件相比,往往要面临非常复杂多变的业务场景,这是老生常谈的问题了。虽然在工程开发与协同领域已经有了比较多的实践案例,但对于比较底层的一些技术框架的协同,由于选型的原因,往往是比较多元化的,这也就导致了一些基础框架之间的协同会出现一些问题。举个例子,在搜索领域,往往会采用ES这一类的全文检索引擎进行加速,但由于搜索往往还要带有广告、推荐等信息,很多时候还需要读取具备ACID的RDMS数据库,或者是一些NoSQL数据库,多种数据库组合在一起,才能满足业务上的需
原创
发布博客 2020.11.02 ·
337 阅读 ·
0 点赞 ·
2 评论

Jmeter测试接口返回结果和postman不一致

测试人员突然告诉我,说jmeter返回的结果和postman不一样。我很慌!搜索发现,原因是没有设置报文的编码。设置为utf-8之后,测试人员反馈成功!!
原创
发布博客 2020.10.23 ·
1749 阅读 ·
1 点赞 ·
0 评论

通俗易懂的讲解 网关是什么

通俗一点的讲:网关就是要去别的网络的时候,把报文首先发送到的那台设备。稍微专业一点的术语,网关就是当前主机的默认路由。网关一般就是一台路由器,或者是“防火墙”又或者是“(三层)交换机”。有点像“一个小区中的一个菜鸟驿站”,小区里面的住户互相是知道怎么走,但是要向外地投递东西就不知道了,怎么办?把地址写好送到本小区的快递点就好了。那么,如何区分是“本小区”和“外地小区”的呢?区分是根据IP地址 + 掩码。如果是在一个范围内的,就是本小区(局域网内部),如果掩不住的,就是外地的(局域网外部)。例
原创
发布博客 2020.10.19 ·
7235 阅读 ·
15 点赞 ·
0 评论

Error parsing XML: not well-formed (invalid token)的解决方法

https://blog.csdn.net/nocol123/article/details/53504329报文一直报错,但也查不出原理。上面那篇文章里的问题,都没有涉及到。终于发现,问题出在XML报文的字符限制上。XML文件中不允许出现的字符左边一列是不能在XML中直接使用的5个特殊字符,中间一列是在XML中代替它们的字符串,右边一列是特殊的原因。:特殊字符 代替符号 特殊原因 & & 每一个代表符号的开头字符 >..
原创
发布博客 2020.10.16 ·
5063 阅读 ·
3 点赞 ·
0 评论

Linux安装python3并设置成系统默认python环境

1、环境说明  系统版本:Linux安装的python版本:3.6.52、编译环境准备(如果出现文件解压错误,wget命令无法下载等各种小意外,先把下面的环境安装一遍)  yum install zlib-devel bzip2-devel openssl-devel ncurses-devel gcc-c++ gcc xz -y3、下载python安装包 可以根据自己的喜好去官网自行下载wget https://www.python.org/ftp/python/3.8.0
原创
发布博客 2020.09.24 ·
1963 阅读 ·
1 点赞 ·
0 评论

Linux 离线编译安装Python 3.6.5

1、下载 Python-3.6.5 安装包  在 Python 官网(https://www.python.org/downloads/)下载对应的安装包,我们这里选择 3.6.5 的 linux 版本,如下图:2、将安装包上传至 Linux 服务器  在 Linux 服务器根目录下创建目录 package,并将安装包上传至该目录下3、解压 Python-3.6.5.tgz  [root@xiaoxiaojiang/]# cd /package/  [root@xia..
原创
发布博客 2020.09.24 ·
1367 阅读 ·
0 点赞 ·
2 评论

并发虚拟用户、RPS、TPS的解读

背景在做性能测试的时候,传统方式都是用并发虚拟用户数来衡量系统的性能(站在客户端视角),一般适用于一些网页站点例如首页、H5 的压测;而 RPS(Requests per second)模式主要是为了方便直接衡量系统的吞吐能力 TPS(Transaction Per Second, 每秒事务数)而设计的(站在服务端视角),按照被压测端需要达到 TPS 等量设置相应的 RPS,应用场景主要是一些动态的接口 API,例如登录、提交订单等等。VU(虚拟用户)和 TPS 之间也有其逻辑关系,具体请参见本
原创
发布博客 2020.09.10 ·
1392 阅读 ·
0 点赞 ·
0 评论

什么是表示学习(representation learning)表征学习 表达学习

机器学习算法的成功与否不仅仅取决于算法本身,也取决于数据的表示。数据的不同表示可能会导致有效信息的隐藏或是曝露,这也决定了算法是不是能直截了当地解决问题。表征学习的目的是对复杂的原始数据化繁为简,把原始数据的无效信息剔除,把有效信息更有效地进行提炼,形成特征,这也应和了机器学习的一大任务——可解释性。 也正是因为特征的有效提取,使得今后的机器学习任务简单并且精确许多。在我们接触机器学习、深度学习之初,我们就知道有一类任务也是提炼数据的,那就是特征工程。与表征学习不同的是,特征工程是人为地处理数据,也是我们常
原创
发布博客 2020.09.01 ·
8953 阅读 ·
11 点赞 ·
0 评论

系统吞吐量 TPS介绍及计算方法

因为要上线新需求,需要评估目前的系统性能。计算的主流方法就是TPS,学习一下~TPS:Transactions Per Second(每秒处理的事务处理数量),即服务器每秒处理的事务数。TPS包括一条消息入和一条消息出,加上一次用户数据库访问。(业务TPS = CAPS × 每个呼叫平均TPS)。例如,用户每分钟执行6个事务,TPS为6/ 60s= 0.10 TPS。同时我们会知道事务的响应时间(或节拍),以此例,60秒完成6个事务也同时代表每个事务的响应时间或节拍为10秒。TPS是软件测试..
原创
发布博客 2020.08.31 ·
3966 阅读 ·
1 点赞 ·
0 评论

HTTP 方法:GET 和 POST 的区别对比

两种最常用的 HTTP 方法是:GET 和 POST。因为讨论到接口发送json报文的方法,说 POST 方法无长度限制,而我对此一无所知,所以学习一下请求发送的两种方法。(这里重点讨论接口的get和post方法,不介绍浏览器的这两种方法。)没学过计算机原理,伤不起呀~比较 GET 与 POST下面的表格比较了两种 HTTP 方法:GET 和 POST。 GET POST 后退按钮/刷新 无害 数据会被重新提交(浏览器应该告知用户数据会被重新提交)。 书.
原创
发布博客 2020.08.31 ·
199 阅读 ·
0 点赞 ·
0 评论

回车与换行符号,\r,^M符号

原文作者:阮一峰今天,我总算搞清楚"回车"(carriage return)和"换行"(line feed)这两个概念的来历和区别了。在计算机还没有出现之前,有一种叫做电传打字机(Teletype Model 33)的玩意,每秒钟可以打10个字符。但是它有一个问题,就是打完一行换行的时候,要用去0.2秒,正好可以打两个字符。要是在这0.2秒里面,又有新的字符传过来,那么这个字符将丢失。于是,研制人员想了个办法解决这个问题,就是在每行后面加两个表示结束的字符。一个叫做"回车",告诉打字机把打印.
原创
发布博客 2020.08.18 ·
3500 阅读 ·
1 点赞 ·
0 评论

Python isinstance()定义,以及isinstance() 与 type() 区别

isinstance() 函数来判断一个对象是否是一个已知的类型,类似 type()。isinstance() 与 type() 区别: type() 不会认为子类是一种父类类型,不考虑继承关系。 isinstance() 会认为子类是一种父类类型,考虑继承关系。 如果要判断两个类型是否相同推荐使用 isinstance()。...
原创
发布博客 2020.08.11 ·
488 阅读 ·
0 点赞 ·
0 评论

写博客一年多,终于有了自己的10w+

发布动态 2020.08.06

Python Flask入门

1. 首先写以下代码,命名为test.py:# -*- coding: utf-8 -*-# @Time : 2020/7/29 19:42# @Author : QUENTINNE# @File : test.py# @Software: PyCharmfrom flask import Flaskapp = Flask(__name__)@app.route('/')def hello_world(): return 'Hello, World!'2.
原创
发布博客 2020.08.04 ·
317 阅读 ·
0 点赞 ·
0 评论
加载更多