自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

写bug的程旭源

算法工程师,留学生博主,分享智能技术与学术

  • 博客(29)
  • 收藏
  • 关注

原创 本硕博都有在马来亚大学读书是一种什么体验?

⊱FIRST⊰马大学生,利益相关。来点实名制的客观的回答,喷子离远点。文章会有点长。只想给大家一个马大的直观印象,在Qs排名和你心中标签以外的印象。本科硕士博士都有马来亚大学的痕迹哈哈。说一下我在马大的时间线。本科去马大交换,商学院。学习方面:学校给交换生开设的课程是全校的学院都可以选课,自由选择,学习了商科,critical thinking, 语言学,舞蹈,选修了很多课程,欧亚文化,艺术研究,医学院,天文学院,所以学院的课程你都可以上,交换短短的时间内收获满满。第一印象是学校...

2020-08-06 18:59:08 2399 2

原创 基于Pytorch2对比 FlashAttention、Memory-Efficient Attention、CausalSelfAttention

本文主要是Pytorch2.0 的小实验,在MacBookPro 上体验一下等优化改进后的Transformer Self Attention的性能,具体的有 FlashAttention、Memory-Efficient Attention、CausalSelfAttention 等。主要是torch.compile(model) 和 scaled_dot_product_attention的使用。Pytorch2.0版本来了,带来了很多的新技术。

2023-03-19 19:51:08 6869 2

原创 自驱力超强的羊驼?斯坦福微调LLaMa

self-instruct是一种任务不可知(task-agnostic)的方法,通过自己生成指令数据(指令、输入和输出样本)并使用它进行引导来提高语言模型的指令遵循能力。大型“指令调优”语言模型在新任务上展现了Zero-shot的卓越能力,但严重依赖于人类编写的指令数据,而这些数据在数量、多样性和创造性方面都是有限的。)作为任务池开始,从任务池中抽取随机任务用于提示语言模型LM(例如GPT3)生成新的指令和实例,再过滤低质量或类似的生成,合格的就添加回任务池。,是在近期Meta开源的。

2023-03-14 17:54:54 2841

原创 构建对话机器人:Rasa3安装和基础入门

在开源对话机器人中,Rasa社区很活跃,在国内很多企业也在使用Rasa做对话机器人,有rasa开发经验的往往是加分项。当年实习的时候接触到了Rasa[1],现在工作中也使用Rasa,因此,写写一些经验文档,有助后来人的入门和研究。本文是Rasa的第一篇,偏基础入门内容,主要是本地和使用docker镜像如何安装rasa,后续会持续更新关于rasa的使用拆解每个文件功能和内部细节、如何修改配置、如何使用中文模型等。目标是使用rasa构建一个自己的对话机器人!Part1rasa安装和使用我们做工程开

2023-02-27 21:23:59 2942 4

原创 Error Microsoft Visual C++ 14.0 is required 最佳解决方法,亲测有效

Error Microsoft Visual C++ 14.0 is required 最佳解决方法

2023-02-09 20:14:58 1348

原创 sklearn GridSearchCV网格搜索和SVM的两个参数 C 和 gamma

GridSearchCV,它存在的意义就是自动调参,只要把参数输进去,就能给出最优化的结果和参数。GridSearchCV用于系统地遍历多种参数组合,通过交叉验证确定最佳效果参数。常用参数解读:estimator:所使用的分类器,如estimator=RandomForestClassifier(min_samples_split=100,min_samples_leaf=20,max_depth=8,max_features=‘sqrt’,random_state=10), 并且传入除需要确定最佳的参

2023-01-12 17:03:46 1736

原创 文本摘要,基于Pytorch和Hugging Face Transformers构建示例,有源码

​文本摘要的常见问题和解决方法概述,以及使用Hugging Face Transformers库构建基于新浪微博数据集的文本摘要示例。作 者丨程旭源学习笔记1 前言简介文本摘要旨在将文本或文本集合转换为包含关键信息的简短文本。主流方法有两种类型,抽取式和生成式。常见问题:抽取式摘要的内容选择错误、语句连贯性差、灵活性差。生成式摘要受未登录词、词语重复等问题影响。文本摘要的分类有很多,比如单文档多文档摘要、多语言摘要、论文生成(摘要、介绍、重点陈述等每个章节的生成)、医学报告生成、情感类摘要(观点

2023-01-09 11:00:44 1306 5

转载 正则表达式大全,常用正则函数,Python代码示例

Python正则表达式,Regex函数,一文全

2022-11-18 13:16:10 2090

转载 pytorch Dataloader Dataset构建自定义数据集,流程和代码模板

pytorch Dataloader和Dataset构建自定义数据集,流程和代码模板

2022-11-18 13:00:46 1729 1

原创 解决Docker运行命令时提示“Got permission denied while trying to connect to the Docker daemon socket“

解决Docker运行命令时提示“Got permission denied while trying to connect to the Docker daemon socket“

2022-10-30 23:09:15 1004

转载 知识图谱构建过程

知识图谱如何构建?

2022-07-19 15:37:16 1728

原创 一次性解决tensorflow-gpu:library:cusolver64_10.dll/ cudart64_101.dll/cublas64_10.dll not found等

错误:Could not load dynamic library ‘cudart64_101.dll‘Could not load dynamic library ‘cublas64_10.dll‘Could not load dynamic library ‘cufft64_10.dll‘Could not load dynamic library ‘curand64_10.dll‘Could not load dynamic library ‘cusolver64_10.dll‘

2021-09-02 21:39:22 489

原创 git报错! [rejected] master -> master (fetch first)解决办法

做git push时出现了如下错误:因为github上的远程库与本地库版本不一致(我对github上的文件做了编辑操作,且未更新到本地,当然也可能还有其他原因…)两种解决方案:通过git pull 先将本地库更新到与远程库一致的版本,但要注意本地库后来做的修改可能被覆盖,最好使用git fetch(不会自动合并),查看更新情况再有选择合并,或者先将本地库修改过的文件备份,git pull后再重新修改,再运行git push即可成功。 git提供了一种强制上传的方式:git push -f.

2021-08-16 17:40:58 1449

原创 安装requests报错,解决ValueError: check_hostname requires server_hostname

python3,安装requests插件,然后写一个简单的代码发送请求,结果发现居然报错了:ValueError: check_hostname requires server_hostnameraise ValueError("check_hostname requires server_hostname")ValueError: check_hostname requires server_hostname原因:跟选用的python版本的关系不大,主要原因是因为使用最新pip ins

2021-07-28 23:18:48 2370

原创 Microsoft Visual C++ 14.0 is required 的解决方案

Pytho安装module时,可能会出现**“error: Microsoft Visual C++ 14.0 is required. Get it with “Microsoft Visual C++ Build Tools”**这样的错误。对于此类问题,提供以下两种解决方案:1 下载所需模块的.whl文件,然后再以pip的形式安装:1)常用模块的.whl文件的下载地址:Unofficial Windows Binaries for Python Extension Packages2)以模

2021-07-07 18:00:36 231 1

原创 python进行数据处理:pandas的drop函数

删除表中的某一行或者某一列更明智的方法是使用drop,它不改变原有的df中的数据,而是返回另一个dataframe来存放删除后的数据。

2021-07-01 12:58:19 3216

原创 解决ModuleNotFoundError: No module named ‘pip‘

pip install -U pip把pip搞没了:报错:‘环境路径\Scripts\pip-script.py' is not present这个错误可以通过两行简单的cmd命令行语句进行改正修复。python -m ensurepippython -m pip install --upgrade pip

2021-06-21 16:33:30 200

原创 pip安装:ProxyError, NewConnectionError

安装pip报错:WARNING: Retrying (Retry(total=4, connect=None, read=None, redirect=None, status=None)) after connection broken by 'ProxyError(‘Cannot connect to proxy.’, NewConnectionError(’<pip._vendor.urllib3.connection.VerifiedHTTPSConnection object at 0x0

2021-02-19 12:43:50 1939

转载 马来亚大学研究生多久毕业?这份问卷调查结果拍了拍你

首先感谢抽空填写问卷的同学们,本次样本数量:博士4份,硕士43份包括A授课型28份,B混合型硕士14份,C研究型硕士1份,共收到47份结果,来自马大不同专业。问卷调查从入学到递交终版论文拿到Senate Letter的马大硕博研究生,本问卷为了还原马来亚大学研究生真实的毕业时长,由于数据量有限大家仅供参考,更重要的是他们给出的建议和影响因素分析,希望对你的留学生涯规划有所帮助,避坑总可以的吧。先从授课型硕士说起,共28份,来自马大不同的15个专业,有一年毕业的、一年半和两年毕业的,...

2020-08-13 13:48:44 1143

原创 马来西亚旅游不可不去的世外桃源

​全马最漂亮的8大冷门“世外桃源”!美到您都不相信这些地方竟然在马来西亚!1)Pulau Besar(柔佛州)情侣来这旅游或蜜月,真的最适合不过了!想要找一个宁静、舒服、温暖的海边度假吗?那么PulauBesar 或许适合你~这里没有其他海边来得吵杂、多活动,不过基本的浮潜还是有的,非常适合小两口到这儿来放轻松。对了,小编想提醒一下各位,由于这里真的比较郊外,网络信号不强,所以来到这儿你就可以真正的远离城市(与手机)的喧哗和辐射,好好享受这一大片的自然美景吧!...

2020-08-06 19:13:44 639

原创 留学生学位学历认证流程

01注册新用户登录留学政务服务平台http://zwfw.cscse.edu.cn/(以下简称“系统”)首页,点击页面上方学历学位认证,选择【在线办理】http://zwfw.cscse.edu.cn/进入用户登录界面,点击个人注册。注册时,申请人需填写真实姓名、国籍、性别、证件类型、证件号码、证件有效期开始时间、有效期结束时间、手机号码、电子邮箱。中国国籍的申请人要求填写中文姓名。外籍学生请输入大写字母并按照护照上的姓名从上到下、从左到右输入。注册时由于要进行实名认证,

2020-08-06 19:07:59 1561

原创 马来西亚留学回国人员证明

点击上方「蓝字」关注我们01关于《留学回国人员证明》《留学回国人员证明》是由驻外使(领)馆教育(文化)处(组)开具的证明材料,共三联,第一联由留学人员自行留存,第二联用于回国海关申报,第三联留使馆存档备查。使馆经相关工作人员签字并在第一、第二联加盖公章方为有效。同时可以申办领事认证,目的是使马来西亚有关学校出具的毕业(学位)证书能被中国有关部门或机构所承认并具有法律效力,使馆认证是对毕业(学位)证书上马外交部门或者认证机构的印章及签字确认属实,证书的真伪由马教育部门负责...

2020-08-06 19:05:43 384

原创 英文原著582本分享和新东方雅思培训视频资料(和学为贵雅思资料)

今天给大家奉献的是悉心整理的英文原著和雅思学习资料,希望能对大家的英文学习有所帮助,如果觉得有用,记得点击文末的“在看”和赞????哦!【操作步骤】复制关键词,点击左上角“美熙大马”蓝字,进入公众号后台,粘贴即可获取想要的资料。♥本文声明:材料来自网络搜集,不收费,仅做学习阅读使用。禁止二次加工和任何商业用途。公众号后台回复【建议复制粘贴】:原著582即可获取:英文原著582本公众号后台回复【建议复制粘贴】:世界名著top100即...

2020-08-06 19:01:06 583

转载 在马来西亚如何回国?

为确保国际旅行健康安全,降低新冠肺炎疫情跨境传播风险,根据7月20日中国民航局、海关总署、外交部发布的相关公告要求,现就在马来西亚实施赴华航班中、外籍乘客凭新冠病毒核酸检测阴性证明登机的具体办法通知如下:一、总体要求自2020年8月20日起,自马来西亚搭乘航班赴华以及经马来西亚中转乘机赴华的中、外籍乘客,须于登机前5天内完成新冠病毒核酸检测,并凭核酸检测阴性证明申领带“HS”标识的绿色健康码或健康状况声明书。航空公司在乘客登机前查验带“HS”标识的绿色健康码或健康状况声明书,不再接受带小飞机标.

2020-08-06 18:54:29 6059

原创 Python代码在命令行如何调试?pdb调试指南

pdb 是 python 自带的一个包,为 python 程序提供了一种交互的源代码调试功能,主要特性包括设置断点、单步调试、进入函数调试、查看当前代码、查看栈片段、动态改变变量的值等。pdb 常用命令调试方法:在代码中想要停驻的地方添加: pdb.set_trace()Python -m pdb (py文件名).py 回车。命令行的命令根据上表输入就可以了。...

2020-06-22 14:17:48 1158

原创 Point Cloud Library点云库PCL 中文使用教程

Point Cloud Library点云库PCL 中文使用教程点云处理技术点云处理技术点云处理技术广泛应用在逆向工程、CAD/CAM、机器人学、激光遥感测量、机器视觉、虚拟现实、人机交互、立体3D影像等诸多领域。在这里插入图片描述https://pan.baidu.com/s/1J6xBftGRue8nhSbp_k0lWA提取码:ex1h祝大家学有长进!...

2020-06-17 17:21:15 1392 1

转载 OTSU大津法图像分割自适应阈值c++实现(亲测可用)

内容参考原文《A Threshold Selection Method from Gray-Level Histograms》最大类间方差是由日本学者大津(Nobuyuki Otsu)于1979年提出,是一种自适应的阈值确定方法。算法假设图像像素能够根据阈值,被分成背景[background]和目标[objects]两部分。然后,计算该最佳阈值来区分这两类像素,使得两类像素区分度最大【用方差表达,具体公式见后】。OTSU的扩展算法,可进行多级阈值处理,称为“Multi Otsu method”【题外话】

2020-06-11 14:01:36 1598

原创 高效率搭建环境:以RTX2080ti为例Windows安装CUDA+cuDNN;清华镜像安装anaconda+TensorFlowGPU+Pytorch。

windows安装使用Nvidia RTX2080ti+anaconda+TensorFlow GPUNvidia RTX2080ti 驱动安装cuDNN选择清华镜像安装anaconda+TensorFlow GPUpip安装TensorFlow GPU安装pytorch1.4写在前面:本篇介绍了windows系统下安装 Nvidia RTX2080ti驱动,安装CUDA tookit,安装cuDNN,安装了anaconda,安装了TensorFlow-GPU 1.X和2.X安装。同时提到可能遇到的问题

2020-06-11 14:00:56 3423

原创 Fisher information解释和数学意义

**Fisher information解释和数学意义在数理统计学,费雪信息 (有时简称为 信息)是一种度量随机变量 X 所含有的关于其自身随机分布函数的未知参数 θ 的信息量。严格地说,它是分数对方差或观测信息的期望值。Fisher信息在最大似然估计量的大样本分布中地位是由统计学家罗纳德*费雪推广的。费雪信息矩阵是可以用来计算最大似然估计量的协方差矩阵。 此外,它还用在一些统计检验量(比如瓦...

2020-04-27 14:54:04 3496

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除