落落小方地发卡-CSDN博客

原创 Mac 电脑上如何重建索引

感觉每次 Mac 电脑大版本更新之后都会出现索引失效的情况。重置 Mac 索引，在终端中依次输入：sudo -imdutil -Eamdutil -ai offmdutil -ai on即可

2024-02-01 23:00:33 86

原创 Julia Optim 求函数的最小值

Julia 的 Optim.jl 提供了类似于 scipy.optimize.minimize 类似的功能。using Optimf(x) = (1.0 - x[1])^2 + 100.0 * (x[2] - x[1]^2)^2x0 = [2.0, 0.0]r = optimize(f, x0)Optim.minimizer(r) # 获取最小值点obj_val = Optim...

2024-01-22 20:33:26 96

Single-attribute choices – such as choosing the apartment with the lowest rent – are relatively simple. However, most of the decisions consumers make are based on multiple attributes which complicates...

2023-11-07 19:59:25 11

原创 Python 的海象算子

Python 在 3.8 版本之后引入了海象算子，它主要有三种用法使用在 if语句中if (n := len(a)) > 10: print(f"List is too long ({n} elements, expected <= 10)")用在 while 语句中while (block := f.read(256)) != '': process(...

2023-10-12 20:34:24 20

原创 Julia 禁用 stdout

# 创建一个空的I/O流fakeio = open("11.txt", "w")# 重定向输出到空的I/O流redirect_stdout(fakeio) do # 在这里写你的代码 println("111111")end

2023-09-14 15:42:28 14

原创 Explaining predictive models: the Evidence Counterfactual

Imagine being targeted with an advertisement for this blog. You’d like to know: why did the AI model predict you’d be interested in the Faculty of Business and Economics’ blog, based on the hundreds o...

2023-06-03 17:58:37 403

原创如何解决GitHub的“Remote Host Identification Has Changed”问题

GitHub 修改了它的 SSH host key，于是在连接 GitHub repo 的时候，会出现As explained in an official statement, GitHub has recently replaced its RSA SSH host key.To fix the problem, you need to update your SSH known_ho...

2023-05-19 21:48:16 18

原创 Matplotlib 两个 y 轴

import numpy as npimport matplotlib.pyplot as pltx = np.arange(10)y1 = 2*xy2 = x**2fig = plt.figure()ax = fig.add_subplot(111)ax.plot(x, y1, 'b', label="y1")ax.set_ylabel("label 1")# 新建一个有...

2023-05-14 16:31:02 202

原创 Product bundling

产品捆绑销售是一种常见的销售策略。如图所示，商品A的售价是20，商品B的售价是30；我们也可以将A和B捆绑销售，设置价格为40.product bundling 可能使利润增加，也可能使利润减少。without product bundlingwith product bundling...

2022-09-08 11:33:49 152

原创 Matplotlib 如何输出各种字体

matplotlib 默认输出的是无衬线字体，因此，修改无衬线字体的配置即可正确输出中文：import matplotlib.pyplot as pltplt.rcParams["font.sans-serif"] = ["STSong"]一般来说， matplotlib 会将字体的配置保存在 ~/.matplotlib/fontlist.json 里，比如随便找一个 entry 是这样结...

2022-08-20 20:50:14 862

原创 Mac 下 matplotlib 的中文问题

在 Windows 下的 matplotlib 可以使用以下方法设置中文：import numpy as npimport matplotlib.pyplot as pltplt.rcParams["font.sans-serif"] = ["SimHei"]但是 Mac 不一定有 SimHei 字体。在终端输入 fc-list :lang=zh 可以查看支持中文的字体类别。可以用以下代...

2022-07-02 23:15:00 962

原创 networkx (1)

# Python program to create an undirected# graph and add nodes and edges to a graph# To import packageimport networkx as nx# To create an empty undirected graphG = nx.Graph()# To add a nodeG....

2022-05-11 13:10:43 181

原创利用经纬度计算距离

https://pypi.org/project/haversine/from haversine import haversine, Unitlyon = (45.7597, 4.8422) # (lat, lon)paris = (48.8567, 2.3508)haversine(lyon, paris)>> 392.2172595594006 # in kilo...

2022-03-06 21:49:12 200

原创最短路问题的线性规划表达

A Linear Programming Formulation for the Shortest Path Problem给定一个有向图 (V,A)(V, A)(V,A)，边 (i,j)(i, j)(i,j) 的权重 wijw_{ij}wij，从 sss 到 ttt 的最短路问题可以规划成：min⁡x ∑(i,j)∈Awijxijs.t. for all i, ∑jxij−∑jxji={1, if i=s−1, if&nbsp

2022-03-04 13:50:09 1573 2

原创 Large scale linear optimization

同步发文在知乎本文介绍大规模线性规划问题的求解思想。内容主要来源自《Introduction to Linear Optimization》Chapter 6.Delayed column generation考虑一个非退化的线性规划的标准问题：min⁡cTxs.t.Ax=b,x≥0(1)\begin{array}{cl} \min & c^T x \\ \text{s.t.} & Ax = b, x \geq 0\end{array}\tag{1}mins.t.c

2022-01-25 19:27:16 263

原创《将博客搬至CSDN》

《将博客搬至CSDN》

2021-12-09 20:24:16 82

原创 Convex Optimization Problem

凸集和凸函数，都是为了解决凸优化问题做的铺垫。当然，在这之前，我们还应当对整个优化问题的概念体系有一个大致的了解。优化问题一个标准的优化问题，通常都由：优化变量、目标函数、不等式约束、等式约束组成：minimize⁡f0(x)subject to fi(x)≤0,i=1,…,mhi(x)=0,i=1,…,p(1)\begin{array}{ll}\operatorname{minimize} & f_{0}(x) \\\text {subject to } &

2021-10-22 13:46:20 488

原创 Convex Function

说完了凸集，下一个要将的肯定就是凸函数啦~凸函数的相关性质在优化中的地位不言而喻~！凸函数f:Rn→Rf: \mathrm{R}^n \to \mathrm{R}f:Rn→R 是凸函数，如果 fff 的定义域是凸集，并且 ∀x,y,θ∈[0,1]\forall x, y, \theta \in [0, 1]∀x,y,θ∈[0,1] 成立：f(θx+(1−θ)y)≤θf(x)+(1−θ)f(y)f(\theta x+(1-\theta )y) \leq \theta f(x) + (1-\theta

2021-10-22 09:16:33 796

原创 Social Chioce

如果所有人都认为A比B好，WWW 选择了这个序，那么 WWW 就是有效的。Arrow 定理告诉我们，满足有效和IIA的社会福利函数 WWW 只能是独裁的。想要设计出好的社会福利函数，我们必须舍弃PE、IIA的其中一个性质。...

2021-10-18 14:59:14 73

原创 backlog 和 backorder

BacklogYour company's backlog is the total number of the orders your customers have sent that have not yet been shipped out. Ideally, this is a large number because you have many customers who have g...

2021-09-19 20:25:20 807

原创 Julia 性能tips

使用数组的视图而不是拷贝julia> fcopy(x) = sum(x[2:end-1]);julia> @views fview(x) = sum(x[2:end-1]);julia> x = rand(10^6);julia> @time fcopy(x); 0.003051 seconds (3 allocations: 7.629 MB)jul...

2021-08-10 15:54:07 165

原创 2021-06-30

拜占庭容错：https://zhuanlan.zhihu.com/p/107439021零知识证明：https://zhuanlan.zhihu.com/p/34072069https://zhuanlan.zhihu.com/p/38205067

2021-06-30 21:10:02 58

原创半监督学习

半监督学习(semi-supervised learning)是一种介于无监督和监督学习之间的学习方式。无监督学习只利用未标记的样本集，而监督学习则只利用标记的样本集进行学习。但在很多实际问题中，因为对数据进行标记的代价有时很高，所以我们通常只能拿到少量标记数据和大量的无标记数据。标记可能是类别的准确信息，也可能是聚类中的类簇信息(在同一类或不在同一类)。一般来说，半监督学习侧重在有监督的分类...

2021-02-01 14:59:24 614

原创 Break

下方：Stephen Boyd 的《convex optimization》除去Introduction一共10个章节。上方：DRO处理优化问题有四大理论工具：投影定理凸集分离定理对偶微分

2020-11-29 09:56:21 63

原创 C3 linearization

在计算机科学中，C3 linearization 是一种算法，主要用于在存在多重继承的情况下获得方法的继承顺序。换句话说，C3 linearization的输出是一个确定的Method Resolution Order(MRO)。Python的MRO用的就是 C3 linearization 这个算法。执行这样的一段代码：class A: def foo(self): ...

2020-11-23 11:31:23 409

原创 Clique

Clique，团，是一个无向图的完全子图。如果一个无向图的某几个顶点两两相邻，就说这几个顶点构成了一个“团”(clique)。图的最大团，顾名思义，就是包含顶点数最多的团。这个数字叫做这个图的 clique number。团这一结构在网络分析和生物信息学中被广泛使用，但是找到一个图的最大子团这一问题是 NP-complete 的。解决最大团问题有两个算法：Bron–Kerbosch a...

2020-11-16 16:03:14 794

原创 String metric

字符串度量(string metric, a.k.a a string similarity metric or string distance function)是度量两个文本字符串之间的距离的度量，用于近似字符串匹配或比较以及模糊字符串搜索。字符串度量的一个要求是满足三角形不等式。以下介绍一些常用的字符串度量：Levenshtein distance：也称编辑距离(edit dista...

2020-11-12 10:17:17 220

原创 Best-first search

最佳优先搜索最佳优先搜索可被认为是广度优先搜索的贪婪形式，本质上它是一种贪心算法。A*算法和B*算法是广泛使用的最短路搜索算法。Dijkstra算法本质上是一种基于动态规划的BFS，如果我们能够对两个点之间的距离进行比较准确的“估计”，那么就可以使用A*算法来改进！广度优先搜索是朝向四面八方，而我们往往可以预先知道往哪一个方向最有可能路径较短。如果我们下从 A 点移动到 B 点，但是这两...

2020-11-10 17:06:49 2585

原创 Stable marriage problem

稳定婚姻问题在数学、经济学和计算机科学中，稳定婚姻问题(又称稳定匹配问题或SMP)是指在给定每个元素的偏好顺序的情况下，在两个大小相等的元素集之间寻找稳定匹配的问题。匹配是从一个集合的元素到另一个集合的元素的双射。匹配不稳定，如果：There is an element A of the first matched set which prefers some given element B...

2020-11-09 10:57:00 367

原创 2020-10-26

Linux 环境变量Shell 中，我们可以使用whoami命令查看自己登陆的用户名(或者直接用id查看自己的用户信息。)Linux 读取环境变量的方法：export命令显示当前系统定义的所有环境变量(或者env)echo $PATH命令输出当前的PATH环境变量的值使用export命令可以直接修改PATH的值，比如配置MySQL进入环境变量的方法:export PATH=$P...

2020-10-26 17:06:13 43

原创 2020-10-25

Shell 字符串在 bash shell 中，每一个变量的值都是字符串，无论你给变量赋值时有没有使用引号，值都会以字符串的形式存储。这意味着，shell 在默认情况下不会区分变量类型，即使你将整数和小数赋值给变量，它们也会被视为字符串，这一点和大部分的编程语言不同。Shell 支持以下三种定义变量的方式：variable=valuevariable='value'variable...

2020-10-25 20:20:22 278

原创 2020-10-12

Python pdf的相关操作把单张图片转换成pdf首先依次使用pip安装PyMuPDF和fitz库。以下代码将图片转为pdfimport fitzimgdoc = fitz.open(img_file)# imgdoc = fitz.open('png', img_bytes)pdfbytes = imgdoc.convertToPDF()with open(pdf_file, ...

2020-10-12 15:46:24 183

原创 Linux 下的压缩和解压

解压对于.tar.gz的文件，用tar -xzvf *.tar.gz进行解压unzip命令用于解压.zip文件：unzip -q [-P <密码>][.zip文件][文件][-d <目录>]-q 执行时不显示任何信息。[-P <密码>] 输入解压密码(如果有的话)[.zip文件] 指定.zip压缩文件。[文件] 指定要处理.zip压缩文件中的哪些...

2020-10-01 20:32:38 328

原创 2020-08-26

PyTorch中有两种Dataset：map-style：实现了__getitem__()和__len__()方法的iter-style：实现了__iter__()方法的，由用户确定数据载入的顺序，适用于数据非常大的时候。dataloader的作用，对于第一种类型的数据：for indices in batch_sampler: yield collate_fn([data...

2020-08-26 21:34:26 150

原创 2020-08-25

Bert for 文本分类需要先安装pytorch, transformers[torch], pytorch_transformers。from pytorch_transformers import BertTokenizer, BertForSequenceClassificationtokenizer = BertTokenizer.from_pretrained('bert-ba...

2020-08-25 10:37:23 171

原创 2020-08-22

Pytorch的model.train()与model.eval()model.train()： model设置成训练模式，此时网络中的Dropout和Batch Normalization层在训练过程中起到防止网络过拟合的作用。model.eval()：model设置成评估模式，此时Dropout和BN层不起作用。...

2020-08-22 12:35:20 1335

原创 2020-08-08

度量空间度量空间是泛函分析的第一部分内容，当我们说到度量空间的时候，我们会怎么去认识它呢？从度量空间的定义开始，我认为可以从三个方面进一步认识度量空间：度量空间中的点集的性质。基本的诸如内点、开集、闭集、导集、闭包等，还有稀疏集、稠密集、完美集、连通集等等。关于集合，还会讨论“紧、列紧、全有界、有界”这些概念。各类集合之间的依赖与推导是研究的重点。各种类型的集合有各种类型的性质，集...

2020-08-09 17:03:16 459

原创 2020-07-29

LSAlatent sementic analysis 隐含语义分析https://www.bilibili.com/video/BV1ha4y1x7hN?p=48https://www.jianshu.com/p/a1e7c5951bae

2020-07-29 17:52:07 39

原创 2020-07-27

pip 清理下载缓存https://stackoverflow.com/questions/9510474/removing-pips-cache缓存一清，几百M的内存就出来了！

2020-07-27 21:11:50 61

原创 2020-07-13

稀疏矩阵的操作以下列出一些scipy.sparse里面对于稀疏矩阵的一些方法：对于一个sparse.spmatrix(抽象基类)，可以用.tocoo, tocsr等方法来进行存储方式的转换。todense()方法将稀疏矩阵变成稠密矩阵，注意转换后的内存消耗。sparse.save_npz函数将稀疏矩阵序列化，sparse.load_npz反序列化。sparse.hstack和sp...

2020-07-13 20:56:10 206

空空如也

空空如也