- 博客(292)
- 收藏
- 关注
转载 用性能分析工具找到程序效率的瓶颈
R的性能分析工具可以按较高频率(如每隔几毫秒)抽查正在被调用的函数, 因为函数可以嵌套调用, 所以会记录下来正在嵌套调用的各个函数。因为抽查的速度很快, 所以会得到大量的被调用函数的抽样数据, 这样就可以进行概括, 得知哪些函数被调用最频繁, 调用的途径是怎样的。但是, 对比较复杂的程序, 应该将要分析的程序保存为一个R源文件, 并用source()的方法将要运行的函数载入, 并用profvis()函数调用该函数并显示运行后性能分析结果。例18.6 以18.4的程序为例。
2024-06-13 22:45:34
28
原创 sklearn.pipeline的用法介绍
调用Pipeline时,输入中元组构成的列表,每个元组第一个值为变量名,元组第二个元素是sklearn中的transfomer或Esimator,注意中间每一步是transformer,即它们必须包含。下面是一个简单的例子,展示了如何使用 Pipelne 对训练集和测试集进行如下操作: 先用 Siandardscaler对数据集每一列做标准化处理(是。),再用PCA将原始的30维度特征压缩到2维度, 最后再用模型,LogisticRegression(是。
2024-06-04 15:52:30
279
原创 具有固定宽度的盒子:\makebox, \parbox
是 LaTeX 中的一个命令,用于创建一个具有固定宽度的盒子,并在该盒子内放置内容。这个命令可以用于控制文本或对象的位置和对齐。您可以使用 \makebox 命令来控制文本或对象在页面中的位置和对齐方式,以满足特定的布局需求。
2024-05-28 22:05:26
864
原创 提升(或降低)插入的内容的位置:\raisebox
是 LaTeX 中的一个命令,用于提升(或降低)插入的内容(如文本、图像等)的位置。该命令可以用于调整垂直位置,使内容相对于周围内容上下移动。可以根据需要使用 \raisebox 命令来调整文本或图像的垂直位置,使其与周围内容对齐或居中。
2024-05-28 21:47:40
314
原创 为表格添加背景色:\rowcolor, \columncolor,\cellcolor
是 LaTeX 中用于设置表格行的背景色的命令。它可以使表格更加美观和易于阅读。rowcolor 命令通常与宏包一起使用。其中 表示要设置的背景色,可以是预定义的颜色名称(如 red、blue)、RGB 值(如 RGB(255,0,0))、HTML 颜色代码(如 #FF0000)等。例如,\rowcolor{gray} 将设置当前行的背景色为灰色。可以在表格的每行中使用 \rowcolor 命令来交替设置行的背景色,以提高表格的可读性。
2024-05-28 21:29:55
1565
原创 调整图片和表格尺寸的命令:resizebox
例如,\resizebox{0.5\textwidth}{!}{内容} 将内容调整为宽度的一半,高度根据宽度比例自动调整。请注意,使用 \resizebox 可能会导致内容失真或变形,因此建议谨慎使用。是 LaTeX 中的一个命令,用于调整插入的内容(如图像、表格、文本等)的大小。
2024-05-28 21:17:21
1445
原创 GED(Generalized Error Distribution)广义误差分布
广义误差分布(GED)是指一类以整个实数轴为支撑集的连续分布,是由Box和Tiao在1973年提出的(他们称该分布为the exponential power distribution), Harvey在1981年又提出了该分布并命名为GED.该分布包含三个参数μ∈Ra0b0, 概率密度函数为fx2αΓ1/ββe−∣x−μ∣/αβ特别地,当β1时为拉普拉斯分布,当β2时为正态分布,当β→∞时逐点收敛于μ−αμα上的连续分布。
2024-02-03 13:11:33
1634
原创 深度学习笔记
文章目录循环神经网络(RNN)长短期记忆网络(LSTM&Bi-LSTM)门控循环网络(GRU & Bi-GRU)时间卷积网络(TCN)卷积神经网络(CNN)图卷积神经网络(GCN)图注意力神经网络(GAT)循环神经网络(RNN)长短期记忆网络(LSTM&Bi-LSTM)门控循环网络(GRU & Bi-GRU)时间卷积网络(TCN)卷积神经网络(CNN)图卷积神经网络(GCN)图注意力神经网络(GAT)
2024-01-14 20:53:57
492
原创 TF-IDF(词频-逆文档频率)
利用关键词提取可以弥补这一不足,关键词提取是一种自动化的文本处理技术,它可以从一篇文章中自动抽取出最能代表文章主题和内容的若干个词语或短语。TF-IDF (Term Frequency - Inverse Document Frequency,词频-逆文档频率)是信息检索中衡量一个词语重要程度的统计指标,广泛应用于文本分析领域。,而 IDF 是这个词语在所有文档中出现的频率,然后取对数,就得到这个词语的 IDF 值。注:当单词A在一个文章中出现的频率很高的时候,我们倾向于认为A是一个重要的词汇。
2024-01-13 20:51:08
762
原创 自然语言处理笔记
中文分词的工具有:jieba(核心算法是张华平的Nshort算法), SnowNLP, NLPIR汉语分词系统, THULAC, PkuSeg等。中文的情感词典有:NTUSD, 正文褒贬词典TSING, 知网HowNet等。英文的情感词典有:LIWC, SentiWordNet等。
2024-01-13 20:31:19
604
原创 关于tex中的表格设置
将下面的代码放在table环境内,放在tabular环境外== 调整表格宽度和高度==: %12可随机设置,调整到适合自己的大小为止调整列间距:%7可随机设置,调整到适合自己的大小为止上面的代码实现的效果往往不好,实现的是一种图片性质的缩放。改变行高的方法是:\renewcommand\arraystretch{1}(在array宏包中)arraystretch默认定义为1,可以重定义得到制定倍数的表格行距。例如:利用array宏包,并配合命令即可实现tex中多表格排列subcaptio
2024-01-13 10:26:10
1510
原创 R语言中的函数28:Reduce(), Filter(), Find(), Map(), Negate(), Position()
R语言中的Reduce(), Filter(), Find(), Map(), Negate(), Position()是base包中的一些高级函数。随后,很多包也给这些函数提供了更多的扩展。
2023-12-23 23:49:08
1049
原创 tex中的边框
left=1cm, right=1cm, top=0.5cm可以设置文本与文字之间的距离。width=5cm, height=3cm,可以设置边框的宽和高。利用empheq宏包。
2023-12-04 22:09:48
339
原创 R语言中的函数27:polynom::polynomial(), deriv(),integral(),solve()多式处理函数
R语言中多项式处理函数
2023-11-05 12:19:04
789
原创 R语言中的函数26:polyroot多项式求根函数
R语言中的base::polyroot()可以用于对多项式求根,求根的多项式可以是复数域上的。
2023-11-05 10:58:26
684
原创 R语言中的数据重塑
tidyverse系列包中的函数操作都是针对简洁数据框进行的,对于不是简洁的数据,实现需要进行数据重塑。数据重塑主要包括长宽表的转换、拆分/合并列、方形化。长宽表转化最初使用的是reshape2包的melt()和cast()函数,后来又发展到早起tidyr包的gather()和spread()函数,现在tidyr 1.0之后又提供了更加易用的pivot_longer()和pivot_wider()函数。
2023-09-28 23:03:53
1007
原创 TeX中如何对bib文件中的条目注释
如bib文件中参考文献条目中的一些项注释,可以通过改变项名来实现,因为tex对于编译时会忽略无意义的项。因为XTitle和XYear是无意义的项。
2023-04-22 21:40:53
1718
原创 ggplot中的注释图层annotate
ggplot作图包中除了常见的geom图层外,还有一个annotate的注释图层,实现对作图对象的额外添加,其添加要素不在ggplot()所接受的数据框中。
2023-04-22 19:03:21
403
原创 tex中enumitem 宏包对itemize环境的调整
利用宏包enumitem 可以对tex的列表环境itemize进行一些调整,实现更好的展示。
2023-04-18 18:57:00
633
原创 anaconda配置环境变量的方法
anaconda配置环境变量主要是将一下几个地址添加到环境变量的path中:X\Anaconda3X\Anaconda3\ScriptsX\Anaconda3\Library\binX\Anaconda3\Library\mingw-w64\binX\Anaconda3\Library\usr\bin具体操作可参考:https://blog.csdn.net/weixin_67806873/article/details/128218184
2023-04-05 22:22:42
174
原创 Python中的闭包,nonlocal以及global
通常情况下,我们在函数中引用变量,如果该变量在该函数的作用域内重新定义了,就会用重新定义的变量。如果在该函数作用域内没有重新定义,就会自从向上层函数找同名变量。按照1的规则程序一般不会出现问题,但是出现赋值和引用同时进行的语句时,例如x=x+y,python认为等号左边x是inside函数的作用域内重新定义的变量,等号右边x是outside函数的变量,这时就出现了矛盾,就报错了。为了处理这种情况,python出现了关键字nonlocal和global.
2023-04-03 18:39:31
366
原创 K-center聚类的python实现
K-center聚类和K-means聚类类似,都是通过迭代类中心点直至收敛,不同的是K-center的中心点必须是一个真实的样本点,而K-means并不需要。
2022-12-30 14:47:12
833
原创 DBSCAN聚类的python实现
DBSCAN是一种基于密度的聚类算法,python中的sklearn.cluster库可以实现DBSCAN聚类。参数介绍1.eps:对象半径;2.min_samples:一个核心对象应该拥有的最少样本数;3.metric:计算样本之间距离的公式,默认metric=‘euclidean’,即欧式距离;4.algorithm:用来找最近邻样本点算法{‘auto’,‘ball_tree’,‘ke_tree’}5.leaf_size:kd_tree或ball_tree中的叶子节点数;决定了搜索快慢。
2022-12-30 11:56:36
3025
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人