自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(40)
  • 资源 (1)
  • 收藏
  • 关注

原创 搜索算法之内容质量评估:如何对作者和文章进行质量评价

对于搜索引擎而言,用户算法的核心价值是用户体验,包括搜索内容的相关性、内容质量及时效性等,其中内容质量是前置步骤,既可以用于优质内容源筛选,又可以作为搜索召回结果排序因素,是决定高质量搜索结果前提。

2023-08-30 08:57:22 367

原创 algo算法实验平台代码分享

作为一名算法爱好者,一直以来希望有一个算法试验及结果展示与测评的管理平台或工具,能够将实际需要用到的算法及功能通过页面展示出来,然后通过不断改进以更好的实现工程需求,但寻找了很多都没有合适,加上平时忙也没有时间去开发,于是乎就将平时自己零零碎碎写的和在一块,“硬凑”成了一个前端由VUE、后台API由Python开发的“实验性平台”,希望能抛砖引玉额、给一些需要的朋友提供一定的参考,当然也可以更加自己需要进行二次开发。

2023-07-11 16:21:36 205

原创 paperclub今日分享:一键体验Stable Diffusion 和清晰度修复

Stable Diffusion简称SD,是一个文本到图像的潜在扩散模型,说到SD就得提下Diffusion,简单来讲主要利用CLIP语言向量结合UNET的注意力机制生成noise predictor(噪声预测器),然后反推得到结果,这个过程非常耗时,因此SD应运而生....图像清晰度修复同样采用深度学习完成,之前分享过(感兴趣的同学可以看看之前的分享),今天再来一波, 直接看效果。今天分享一下SD和清晰度修复,并在文末附带源代码。SD可以文生图,还可以图生图。

2023-05-26 13:04:36 735

原创 如何计算变量的字节大小呢?paperclub分享一下思路,超级简单

今天做embedding 召回时遇到一个问题,看了下可能是文件流太大了,于是就像看看 计算一下变量大小、先做一个过滤,用来避免这种请。print("大小: ", inputs_bytes, " ===>> ", formatter(inputs_bytes))return "%.2f %s" % (text, units[i]) # 返回值保留小数点后两位。:return: 返回字节大小对应单位的数值。大小: 127952 ===>> 124.95 KB。:text: 文件字节。

2023-05-19 15:36:36 765

原创 如何将中英文混合短文拆分成单个词和文字

遇到一个小需求,需将文本转换为单个文字(词)的列表,就是中文按照每个汉字分为一个词,英文每个词为一个文字,进行分享一个paperclub的处理方式,仅供大家参考。

2023-01-29 10:04:28 347

原创 如何根据template.html生成静态 HTML报告

苦恼好几天了,不知道如何根据模板template.html优雅的生成美观的静态 HTML,无奈最后选择 Jinja2进行后端渲染,只能凑合用吧?这里为了演示,就简单也一个意思一下, 大家根据根据需要编写自己的逻辑。app.py 和template.html放在同一目录下, 运行后输出 result.html文件。2. Jinja2后端渲染。1. 编辑前端模板页面。

2023-01-27 17:27:38 290

原创 tensorflow 读取一次模型、多次推理

tensorflow 读取一次模型、多次推理,兼容tf1.x、tf2.x

2022-12-28 14:21:47 480

原创 【无标题】

r字段eg = '([\d|一|二|三|四|五|六|七|八|九|十|壹|贰|叁|弎|仨|肆|伍|陆|柒|捌|玖|俩|两|零|百|千|万|亿|兆|拾|佰|仟|萬|億]+)': => is_numerical: True, value: 2023。电话119: => is_numerical: True, value: 119。今天星期三: => is_numerical: True, value: 三。10000+㎡, res = > 10000+平方米。8,200平方米, res = > 8200平方米。

2022-12-19 11:33:37 323

原创 PDF转Word/Excel/Html 在线免费工具

免费在线pdf转word/html/excel

2022-12-05 16:50:20 144

原创 从e阅读到paperClub线上工具矩阵

(1)由于所有前台页面设计、前端开发、后端接口、文图算法等全有作者一人开发,难免有不少问题和考虑不周的地方,欢迎各位提出建议和想法,沟通方式:[email protected], 微信公众号paperClub留言都可以;我们将持续分享各类、好玩且有趣的算法应用及工程和项目,欢迎分享和转发。

2022-11-27 19:53:02 118

原创 将一篇文章分割成多条完成的句子(中文英文兼容)

第 5 句:(2)需要固定图像的长和宽,同时保存图片不变形,如将原来 600 x 800的图片调整为宽 300, 高300,同时保持图片不变形和扭曲,这情况主要见于证件照缩放等应用场景。(2)需要固定图像的长和宽,同时保存图片不变形,如将原来 600 x 800的图片调整为宽 300, 高300,同时保持图片不变形和扭曲,这情况主要见于证件照缩放等应用场景。sentences = re.sub('(\.{6})([^”’])', r"\1\n\2", sentences)# 英文省略号。

2022-10-27 18:15:41 198

原创 将一篇文章分割成多条完成的句子(中文英文兼容)

第 5 句:(2)需要固定图像的长和宽,同时保存图片不变形,如将原来 600 x 800的图片调整为宽 300, 高300,同时保持图片不变形和扭曲,这情况主要见于证件照缩放等应用场景。(2)需要固定图像的长和宽,同时保存图片不变形,如将原来 600 x 800的图片调整为宽 300, 高300,同时保持图片不变形和扭曲,这情况主要见于证件照缩放等应用场景。sentences = re.sub('(\.{6})([^”’])', r"\1\n\2", sentences)# 英文省略号。

2022-10-27 18:07:42 179

原创 当 “厨房,美女,海景“ 放在一起会怎么样?#paperClub

paperClub:爱阅读、爱技术、爱分享的学习型青年,持续分享实用、好玩、有趣的人工智能技术。(8)t-SNE(t分布-随机近邻嵌入)(2)LLE(局部线性嵌入)(3)LDA(线性判别分析)

2022-10-08 12:44:51 558

原创 秋高气爽好读书,算法大数据、财富管理等30类,总有一本适合您

paperClub分享:350本电子书包括200+计算机编程和150+综合类精选书籍,涉及算法、大数据、微服务、财富管理、职场社交和名人传记小说等30余类,总有一本适合您。获取:关注微信公众号paperClub,回复关键词【电子书】即可。

2022-10-08 12:39:37 319

原创 一键完成老照片颜色修复,超级简单。

paperClub分享:一键完成老照片颜色修复,超级简单。

2022-10-08 12:32:15 224

原创 短文重复性检测综述,谷歌文本重复性检测: Detect duplicate content like Google

文本重复性检测一直是NLP等领域非常重要的一项研究工作,今天 #paperClub# 给大家了解一下"Detect duplicate content like Google"。

2022-10-08 12:21:28 754

原创 支持50+语言的NLP停止词

支持50+语言的NLP停止词,免费下载

2022-10-03 13:21:37 55

原创 一款免费的强大办公工具。

2)需要固定图像的长和宽,同时保存图片不变形,如将原来 600 x 800的图片调整为宽 300, 高300,同时保持图片不变形和扭曲,这情况主要见于证件照缩放等应用场景。我们开发了一款简单的办公小工具,paperBox,下面给大家演示一下他的功能。(1)图片直接进行等比缩放,图片缩放为原来的0.5倍,或 缩放为原来的2倍;(3)将PDF拆分为每 x 页一个的PDF小文件。示例:将图像文件大小压缩至 10 k。(2)删除或保留PDF某些指定的页面。(1)删除PDF的奇数、偶数页面。...

2022-08-07 19:18:52 94

原创 这22个绘图(可视化)方法很重要,值得收藏!

这22个绘图(可视化)方法很重要,值得收藏!

2022-07-24 08:58:08 459

原创 8个非常重要的公式,请务必转给你身边的人

原创 paperClub paperClub 2022-07-05 23:58 发表于江苏这18个非常重要的公式,请务必转给你的好朋友。1. 方差: 组内差异,一般为一维数据标准差(均方差、均方根差)【总方差】: 反映检测值与样本平均值间的偏差,为有偏估计。在实际情况中,总体均值很难得到,往往通过抽样来计算,于是有样本方差S(无偏估计)2. 数学期望E(xi)数学期望:离散型随机变量 xi 和对应概率的乘积。公式如下:应用场景3.协方差:组间差异,描述多维数据概率论和统计学中用于衡量两个变量的总体误差。而方

2022-07-06 00:06:45 278

原创 光流与Lucas-Kanade 光流法

光流optical flow是指空间运动物体在观察成像平面上的像素运动瞬时速度,即由于目标对象或者摄像机移动造成、图像对象在连续两帧图像中的移动。光流是一个 2D 向量场,如下图所示,可以显示一个点从第一帧图像到第二 帧图像之间的移动: 关于光流的假设:目标对象在连续的两帧图像之间像素灰度值不改变,并且这些相邻像素都具有相同的运动。根据这一假设,Lucas-Kanade 利用一个 3x3 邻域中的 9 具有相同运动的这一点获得空间尺度上的光流。OpenCV 函数cv2.calcOpticalFlowPyrL

2022-07-05 22:42:28 220

原创 怎么提取图片里的颜色?图像颜色特征提取

图像的颜色一直是研究和关注的热点,也是特征工程不可或缺的feature,今天就简单介绍一种非常基础的颜色的rgb特征。我们希望图片的rgb特征转化成一个可衡量的指标,例如人的身高、体重 这样的指标173cm, 60kg,用于后续工作。那么怎么转化呢?首先我们需要定一个标准,这里是从图片中提取了8种颜色(红、橙、黄....)用来反映图片的RGB指标, 就好比表述一个人的健康指标,可能回身高、体重、血常规等等。2.颜色提取:首先我们可以在网上找到hex颜色和对应名称的网页,如下:通过html解析,我们就可以获得

2022-07-05 22:39:49 7403

原创 你还记得吗,超重要的3大抽样分布?

你还记得吗,超重要的3大抽样分布?原创2022-07-03 21:07·爱阅读三大抽样统计分布是指卡方分布(χ2分布),t分布和F分布,是来自正态总体的三个常用的分布。1、卡方分布卡方分布是指符合标准正态分布的样本总体,每个样本的平方和构成的新随机变量称为卡方分布,记为χ2∼χ2(n)。(1)卡方分布概率密度函数:你还记得吗,超重要的3大抽样分布?(2)卡方分布的期望和方差:E(X)=n,D(X)=2n(3)概率分布质量函数:### 卡方分布def chi_ditribution(): x = np.

2022-07-03 21:47:38 884

原创 你还记得吗?这几种超级重要的统计学分布

今天就总结一下这几个重要的统计学分布。伯利分布它是一个单词试验,结果只有0 和 1两种情况,1代表成功、0代表失败,例如:女朋友生气、你打电话‘’安慰‘’,她接电话 vs 不接电话,今天下雨 vs 不下雨, 买彩票中奖 vs 未中奖等都属于两种结果的分布,因此也被称为两点分布,概率图像如下:(1)伯努利概率: 伯努利概率分布图(2)伯努利期望和方差: (3)条件:伯努利分布为离散分布,结果只有两种0 vs 1, 1代表成功,概率为p,0代表失败,概率为 1 - p。多次重复伯努利试验就是二项分布,我们

2022-07-03 21:44:57 1090

原创 关于协方差的相关性

原创2022-06-27 00:24·爱阅读我们都知道协方差 可以用来评判多因素间是否具有一相关性,相关相关性的度量也就是皮尔逊系数,皮尔逊系数: 皮尔逊相关性是两个变量之间的协方差与标准差的商, 那怎么去理解呢?通过公式我们来理解一下,是去中心化后的数学期望标准差的商, 分母非负,我们主要关注分子部分就好了,每个点与组内平均值的差就是归一化的思想,所以我们就是看最后的数学期望对应的向量是不是为正,就可以判断两个变量是不是正相关,为了呈现这个过程,我们来看一个例子。 这是一组数据,total_bill

2022-07-03 21:37:32 3537

原创 你还记得吗?这几个重要的初中公式

2022-06-26 17:06·爱阅读1. 方差: 组内差异,一般为一维数据标准差(均方差、均方根差)【总方差】: 反映检测值与样本平均值间的偏差,为有偏估计。 在实际情况中,总体均值很难得到,往往通过抽样来计算,于是有样本方差S(无偏估计) 2. 数学期望E(xi)数学期望:离散型随机变量 xi 和对应概率的乘积。公式如下: 应用场景3.协方差:组间差异,描述多维数据概率论和统计学中用于衡量两个变量的总体误差。而方差是协方差的一种特殊情况,即当两个变量是相同的情况。 X, Y 协方差为4.

2022-07-03 21:32:31 411

原创 你试过吗?图像(细胞)分割

图像分割

2022-07-03 21:28:06 3568

原创 图像饱和度处理

图像饱和度是指图像色彩的纯洁性程度,也称为颜色的鲜艳程度,是“色彩三属性”之一。我们经常听到浅红色没有深红色颜色红,这种感受就是图像色彩属性的人类最直接感觉。饱和度取决于该色中含色成分和消色成分的比例,其中含色成分越大,那么饱和度就越大,同理,如果消色成分越大,必然饱和度越小。颜色有RGB,HSV,HLS等多种色彩属性模式,本次主要比较几种不同方法的颜色饱和度调整效果。正在上传…重新上传取消调整结果来看,在RGB上效果较差,不稳定,HSL和HSV相当。今天就分享到这里, 我是paperClub。备注:

2022-06-26 07:42:17 785

原创 图像的角点检测

角点就是极值点,也就是在图像当中某方面属性特别突出的点,他们通常是图像中非常重要的特征,通过角点检测,我们可以我们感兴趣的点或区域。由于角点检测具有实时和稳定等优点,因此运动检测、图像匹配、视频跟踪、三维建模等过程中被大量应用。opencv已经集成了多种角点检测的方法,我们先来大致感受一下效果:Harris 角点检测的结果是一个由角点分数构成的灰度图像。opencv角点检测函数:cv2.cornerHarris(): 角点检测方法演示及结果:cv2.cornerSubPix():亚像素级精确度角点检测

2022-06-26 07:02:42 1063

原创 图像像素差异:图像量化和K-Means

图像算法

2022-06-25 17:51:15 1473

原创 图像增强及滤波

图像增强

2022-06-25 17:43:19 698

原创 图像频域及滤波处理

快速傅里叶

2022-06-25 17:40:49 2245

原创 新手如何搭建个人网站

ElementUl是饿了么前端团队推出的桌面端UI框架,具有是简洁、直观、强悍和低学习成本等优势,非常适合初学者使用。因此,本次项目使用ElementUI 框架来完成 个人博客的主体开发,欢迎大家讨论和交流。安装创建项目浏览器打开网址:http://localhost:8080...

2022-06-25 17:34:14 143

原创 怎么调整图片大小会不变形?

通过算法调整图像宽高不变形

2022-06-25 17:23:30 1926

原创 【e悦读】支持PDF转WORD/PPT/Excel等

办公必备工具:PDF转wordPDF转excelPDF转网页....

2022-06-25 16:55:53 143

原创 细分分割及检测

图像分割算法

2022-06-25 15:41:02 436

原创 让颜色更加饱满和有冲击力:图像颜色校正

图像偏色修正

2022-06-25 15:30:49 645

原创 图像算法应用6:半小时快速完成人脸检测及人脸识别

图像算法,人脸检测

2022-06-25 15:08:48 742

原创 文献辅助工具开发1

作为一名研究生,我们每天要都要阅读很多的文献,见到漂亮的插图、重要的表格数据、甚至阅读激发的科研灵感,,我们都想保留下来, but文献绝大多数都是PDF格式的,不方便编辑,图表也不方便单独存下来,更别提建立属于自己的文献知识图谱了 .... 所以,我想自己写个小工具,供大家使用。先看一下GUI效果1. GUI - pyqt5创建界面, 主要采用pyqt5, 参考:从零开始 使用PyQt5_漫天撒花的博客-CSDN博客_pyqt52. 功能:今天只完成了2个小功能,分析如下:...

2021-10-20 17:24:11 64

原创 医学细胞图像分割

项目中经常需要对图像中的细胞核,核心及细胞质轮廓进行分割,然后从中分离出单个细胞的上述信息进行特征提取及描述及细胞分类。然而要拿到分离得到的单个细胞图像有一定的困难和挑战,尤其是从重叠细胞群中分离出单个细胞。因此,将项目中的核心代码中,设计细胞分割部分分享出来,供大家交流和讨论,也希望有高手可以用c++进行重构。交流:[email protected],qq:2259508339。代码下载:h...

2019-08-25 10:33:44 5434 1

SegmentationTest.rar

项目中经常需要对图像中的细胞核,核心及细胞质轮廓进行分割,然后从中分离出单个细胞的上述信息进行特征提取及描述及细胞分类。然而要拿到分离得到的单个细胞图像有一定的困难和挑战,尤其是从重叠细胞群中分离出单个细胞。因此,将项目中的核心代码中,设计细胞分割部分分享出来,供大家讨论,也希望有高手可以用c++进行重构,欢迎交流[email protected],qq:2259508339。说明:imgdir:输入图像,result:结果图像,结果图像说明:红色圆点为细胞核中心点,绿色圈为细胞核轮廓,红色圈为细胞质轮廓。

2019-08-25

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除