自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(82)
  • 收藏
  • 关注

原创 Explaining predictive models: the Evidence Counterfactual

Imagine being targeted with an advertisement for this blog. You’d like to know: why did the AI model predict you’d be interested in the Faculty of Business and Economics’ blog, based on the hundreds o...

2023-06-03 17:58:37 379

原创 Matplotlib 两个 y 轴

import numpy as npimport matplotlib.pyplot as pltx = np.arange(10)y1 = 2*xy2 = x**2fig = plt.figure()ax = fig.add_subplot(111)ax.plot(x, y1, 'b', label="y1")ax.set_ylabel("label 1")# 新建一个有...

2023-05-14 16:31:02 159

原创 Product bundling

产品捆绑销售是一种常见的销售策略。如图所示,商品A的售价是20,商品B的售价是30;我们也可以将A和B捆绑销售,设置价格为40.product bundling 可能使利润增加,也可能使利润减少。without product bundlingwith product bundling...

2022-09-08 11:33:49 123

原创 Matplotlib 如何输出各种字体

matplotlib 默认输出的是无衬线字体,因此,修改无衬线字体的配置即可正确输出中文:import matplotlib.pyplot as pltplt.rcParams["font.sans-serif"] = ["STSong"]一般来说, matplotlib 会将字体的配置保存在 ~/.matplotlib/fontlist.json 里,比如随便找一个 entry 是这样结...

2022-08-20 20:50:14 817

原创 Mac 下 matplotlib 的中文问题

在 Windows 下的 matplotlib 可以使用以下方法设置中文:import numpy as npimport matplotlib.pyplot as pltplt.rcParams["font.sans-serif"] = ["SimHei"]但是 Mac 不一定有 SimHei 字体。在终端输入 fc-list :lang=zh 可以查看支持中文的字体类别。可以用以下代...

2022-07-02 23:15:00 914

原创 networkx (1)

# Python program to create an undirected# graph and add nodes and edges to a graph# To import packageimport networkx as nx# To create an empty undirected graphG = nx.Graph()# To add a nodeG....

2022-05-11 13:10:43 169

原创 利用经纬度计算距离

https://pypi.org/project/haversine/from haversine import haversine, Unitlyon = (45.7597, 4.8422) # (lat, lon)paris = (48.8567, 2.3508)haversine(lyon, paris)>> 392.2172595594006 # in kilo...

2022-03-06 21:49:12 173

原创 最短路问题的线性规划表达

A Linear Programming Formulation for the Shortest Path Problem给定一个有向图 (V,A)(V, A)(V,A),边 (i,j)(i, j)(i,j) 的权重 wijw_{ij}wij​,从 sss 到 ttt 的最短路问题可以规划成:min⁡x  ∑(i,j)∈Awijxijs.t. for all   i,    ∑jxij−∑jxji={1, if i=s−1, if&nbsp

2022-03-04 13:50:09 1495 2

原创 Large scale linear optimization

同步发文在 知乎本文介绍大规模线性规划问题的求解思想。内容主要来源自 《Introduction to Linear Optimization》Chapter 6.Delayed column generation考虑一个非退化的线性规划的标准问题:min⁡cTxs.t.Ax=b,x≥0(1)\begin{array}{cl} \min & c^T x \\ \text{s.t.} & Ax = b, x \geq 0\end{array}\tag{1}mins.t.​c

2022-01-25 19:27:16 221

原创 《将博客搬至CSDN》

《将博客搬至CSDN》

2021-12-09 20:24:16 70

原创 Convex Optimization Problem

凸集和凸函数,都是为了解决凸优化问题做的铺垫。当然,在这之前,我们还应当对整个优化问题的概念体系有一个大致的了解。优化问题一个标准的优化问题,通常都由:优化变量、目标函数、不等式约束、等式约束组成:minimize⁡f0(x)subject to fi(x)≤0,i=1,…,mhi(x)=0,i=1,…,p(1)\begin{array}{ll}\operatorname{minimize} & f_{0}(x) \\\text {subject to } &

2021-10-22 13:46:20 473

原创 Convex Function

说完了凸集,下一个要将的肯定就是凸函数啦~凸函数的相关性质在优化中的地位不言而喻~!凸函数f:Rn→Rf: \mathrm{R}^n \to \mathrm{R}f:Rn→R 是凸函数,如果 fff 的定义域是凸集,并且 ∀x,y,θ∈[0,1]\forall x, y, \theta \in [0, 1]∀x,y,θ∈[0,1] 成立:f(θx+(1−θ)y)≤θf(x)+(1−θ)f(y)f(\theta x+(1-\theta )y) \leq \theta f(x) + (1-\theta

2021-10-22 09:16:33 756

原创 Social Chioce

如果所有人都认为A比B好,WWW 选择了这个序,那么 WWW 就是有效的。Arrow 定理告诉我们,满足有效和IIA的社会福利函数 WWW 只能是独裁的。想要设计出好的社会福利函数,我们必须舍弃PE、IIA的其中一个性质。...

2021-10-18 14:59:14 63

原创 backlog 和 backorder

BacklogYour company's backlog is the total number of the orders your customers have sent that have not yet been shipped out. Ideally, this is a large number because you have many customers who have g...

2021-09-19 20:25:20 763

原创 Julia 性能tips

使用数组的视图而不是拷贝julia> fcopy(x) = sum(x[2:end-1]);julia> @views fview(x) = sum(x[2:end-1]);julia> x = rand(10^6);julia> @time fcopy(x); 0.003051 seconds (3 allocations: 7.629 MB)jul...

2021-08-10 15:54:07 141

原创 2021-06-30

拜占庭容错:https://zhuanlan.zhihu.com/p/107439021零知识证明:https://zhuanlan.zhihu.com/p/34072069https://zhuanlan.zhihu.com/p/38205067

2021-06-30 21:10:02 49

原创 半监督学习

半监督学习(semi-supervised learning)是一种介于无监督和监督学习之间的学习方式。无监督学习只利用未标记的样本集,而监督学习则只利用标记的样本集进行学习。但在很多实际问题中,因为对数据进行标记的代价有时很高,所以我们通常只能拿到少量标记数据和大量的无标记数据。标记可能是类别的准确信息,也可能是聚类中的类簇信息(在同一类或不在同一类)。一般来说,半监督学习侧重在有监督的分类...

2021-02-01 14:59:24 605

原创 Break

下方:Stephen Boyd 的《convex optimization》除去Introduction一共10个章节。上方:DRO处理优化问题有四大理论工具:投影定理凸集分离定理对偶微分

2020-11-29 09:56:21 52

原创 C3 linearization

在计算机科学中,C3 linearization 是一种算法,主要用于在存在多重继承的情况下获得方法的继承顺序。换句话说,C3 linearization的输出是一个确定的Method Resolution Order(MRO)。Python的MRO用的就是 C3 linearization 这个算法。执行这样的一段代码:class A: def foo(self): ...

2020-11-23 11:31:23 389

原创 Clique

Clique,团,是一个无向图的完全子图。如果一个无向图的某几个顶点两两相邻,就说这几个顶点构成了一个“团”(clique)。图的最大团,顾名思义,就是包含顶点数最多的团。这个数字叫做这个图的 clique number。团这一结构在网络分析和生物信息学中被广泛使用,但是找到一个图的最大子团这一问题是 NP-complete 的。解决最大团问题有两个算法:Bron–Kerbosch a...

2020-11-16 16:03:14 723

原创 String metric

字符串度量(string metric, a.k.a a string similarity metric or string distance function)是度量两个文本字符串之间的距离的度量,用于近似字符串匹配或比较以及模糊字符串搜索。字符串度量的一个要求是满足三角形不等式。以下介绍一些常用的字符串度量:Levenshtein distance:也称编辑距离(edit dista...

2020-11-12 10:17:17 204

原创 Best-first search

最佳优先搜索最佳优先搜索可被认为是广度优先搜索的贪婪形式,本质上它是一种贪心算法。A*算法和B*算法是广泛使用的最短路搜索算法。Dijkstra算法本质上是一种基于动态规划的BFS,如果我们能够对两个点之间的距离进行比较准确的“估计”,那么就可以使用A*算法来改进!广度优先搜索是朝向四面八方,而我们往往可以预先知道往哪一个方向最有可能路径较短。如果我们下从 A 点移动到 B 点,但是这两...

2020-11-10 17:06:49 2566

原创 Stable marriage problem

稳定婚姻问题在数学、经济学和计算机科学中,稳定婚姻问题(又称稳定匹配问题或SMP)是指在给定每个元素的偏好顺序的情况下,在两个大小相等的元素集之间寻找稳定匹配的问题。匹配是从一个集合的元素到另一个集合的元素的双射。匹配不稳定,如果:There is an element A of the first matched set which prefers some given element B...

2020-11-09 10:57:00 353

原创 2020-10-26

Linux 环境变量Shell 中,我们可以使用whoami命令查看自己登陆的用户名(或者直接用id查看自己的用户信息。)Linux 读取环境变量的方法:export命令显示当前系统定义的所有环境变量(或者env)echo $PATH命令输出当前的PATH环境变量的值使用export命令可以直接修改PATH的值,比如配置MySQL进入环境变量的方法:export PATH=$P...

2020-10-26 17:06:13 35

原创 2020-10-25

Shell 字符串在 bash shell 中,每一个变量的值都是字符串,无论你给变量赋值时有没有使用引号,值都会以字符串的形式存储。这意味着,shell 在默认情况下不会区分变量类型,即使你将整数和小数赋值给变量,它们也会被视为字符串,这一点和大部分的编程语言不同。Shell 支持以下三种定义变量的方式:variable=valuevariable='value'variable...

2020-10-25 20:20:22 270

原创 2020-10-12

Python pdf的相关操作把单张图片转换成pdf首先依次使用pip安装PyMuPDF和fitz库。以下代码将图片转为pdfimport fitzimgdoc = fitz.open(img_file)# imgdoc = fitz.open('png', img_bytes)pdfbytes = imgdoc.convertToPDF()with open(pdf_file, ...

2020-10-12 15:46:24 178

原创 Linux 下的压缩和解压

解压对于.tar.gz的文件,用tar -xzvf *.tar.gz进行解压unzip命令用于解压.zip文件:unzip -q [-P <密码>][.zip文件][文件][-d <目录>]-q 执行时不显示任何信息。[-P <密码>] 输入解压密码(如果有的话)[.zip文件] 指定.zip压缩文件。[文件] 指定要处理.zip压缩文件中的哪些...

2020-10-01 20:32:38 321

原创 2020-08-26

PyTorch中有两种Dataset:map-style:实现了__getitem__()和__len__()方法的iter-style:实现了__iter__()方法的,由用户确定数据载入的顺序,适用于数据非常大的时候。dataloader的作用,对于第一种类型的数据:for indices in batch_sampler: yield collate_fn([data...

2020-08-26 21:34:26 142

原创 2020-08-25

Bert for 文本分类需要先安装pytorch, transformers[torch], pytorch_transformers。from pytorch_transformers import BertTokenizer, BertForSequenceClassificationtokenizer = BertTokenizer.from_pretrained('bert-ba...

2020-08-25 10:37:23 167

原创 2020-08-22

Pytorch的model.train()与model.eval()model.train(): model设置成训练模式,此时网络中的Dropout和Batch Normalization层在训练过程中起到防止网络过拟合的作用。model.eval():model设置成评估模式,此时Dropout和BN层不起作用。...

2020-08-22 12:35:20 1331

原创 2020-08-08

度量空间度量空间是泛函分析的第一部分内容,当我们说到度量空间的时候,我们会怎么去认识它呢?从度量空间的定义开始,我认为可以从三个方面进一步认识度量空间:度量空间中的点集的性质。基本的诸如内点、开集、闭集、导集、闭包等,还有稀疏集、稠密集、完美集、连通集等等。关于集合,还会讨论“紧、列紧、全有界、有界”这些概念。各类集合之间的依赖与推导是研究的重点。各种类型的集合有各种类型的性质,集...

2020-08-09 17:03:16 445

原创 2020-07-29

LSAlatent sementic analysis 隐含语义分析https://www.bilibili.com/video/BV1ha4y1x7hN?p=48https://www.jianshu.com/p/a1e7c5951bae

2020-07-29 17:52:07 31

原创 2020-07-27

pip 清理下载缓存https://stackoverflow.com/questions/9510474/removing-pips-cache缓存一清,几百M的内存就出来了!

2020-07-27 21:11:50 56

原创 2020-07-13

稀疏矩阵的操作以下列出一些scipy.sparse里面对于稀疏矩阵的一些方法:对于一个sparse.spmatrix(抽象基类),可以用.tocoo, tocsr等方法来进行存储方式的转换。todense()方法将稀疏矩阵变成稠密矩阵,注意转换后的内存消耗。sparse.save_npz函数将稀疏矩阵序列化,sparse.load_npz反序列化。sparse.hstack和sp...

2020-07-13 20:56:10 201

原创 2020-07-11

Keras 如何创建一个 Model ?第一次学耍keras还是在18年9月份,一晃两年已经过去了,当时把keras官网的API文档刷了好几遍,现在回去看官网(keras.io)已经建的有模有样了,随着DL、RL的发展还新增了许多API。现在的keras,貌似已经跟tensorflow深度集成了,连官网上tutorials里导包的方式都从import keras变成from tensorflo...

2020-07-13 11:36:55 382

原创 2020-07-10

日语分词工具MeCab的安装和使用可以使用python的pip直接安装使用pip install mecab-python3还是比较推荐在Linux系统上安装这个。这个库的pypi主页是:https://pypi.org/project/mecab-python3/它的基本使用也很简单:>>> import MeCab>>> wakati = Me...

2020-07-10 10:46:45 539

原创 2020-07-05

最大熵原理随机量的概率分布是很难测定的,一般只能测得其各种均值(如数学期望、方差等)或已知某些限定条件下的值(如峰值、取值个数等),符合测得这些值的分布可有多种、以至无穷多种。通常,其中有一种分布的熵最大。选用这种具有最大熵的分布作为该随机变量的分布,是一种有效的处理方法和准则。这种方法虽有一定的主观性,但可以认为是最符合客观情况的一种选择。我们常说,不要把所有的鸡蛋放在一个篮子里,其实就是最...

2020-07-06 11:51:56 296

原创 2020-07-01

julia 的部分运算符跟python不一样,比如^表示乘方,用⊻来表示XOR(这个符号怎么打)。//用来表示有理数(类比python的decimal)全局常数变量 im 用来表示根号 -1。julia 跟MATLAB一样,索引是从1开始的!julia 对数字具有像静态语言一样的性质,默认float64和Int64,会overflow和underflow。数字与变量相乘默认乘法(好评)...

2020-07-01 12:13:54 178

原创 分析8 多元函数

多元函数多元函数的极限:重极限、累次极限。两者没有必然联系。多元函数的连续性由重极限定义。向量值函数的连续性由每个坐标函数的连续性决定。多元函数微分的定义。可偏导未必连续;可微必定连续且可偏导;偏导连续即可微。多元函数的导数:梯度;多元向量值函数的导数:Jacobi矩阵。梯度的反方向是函数值减少最快的方向。多元复合函数的链导发则。多元函数的中值定理和Taylor公式。隐函数定理...

2020-06-18 16:23:12 321

原创 分析5 中值定理与Taylor公式

中值定理与Taylor公式Fermat引理:可导的极值点是驻点。Riemann函数的有理点都是它的极大值点,无理点都是极小值点。Rollo中值定理、Lagrange中值定理、Cauchy中值定理。曲线拐点两侧的凸性相反。导函数具有介值性,因此不存在第一类间断点(跳跃间断点)。通过导数判断一元函数的极值点。几个常见函数的麦克劳林公式:...

2020-05-29 21:35:54 110

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除