AlphaFinance
拥有15余年算法、数据处理、软件开发和AI应用经验。熟悉Hadoop、Pyspark、GCP等大数据技术和云计算,具备全周期软件开发和MLOps实践经验。精通机器学习、深度学习算法,有强化学习研究背景。熟悉图像处理方法,能开发目标检测和人脸识别系统。擅长NLP应用开发,有Rasa、LLaMA等框架使用经验。能独立开发高精度量化交易模型。具备Java大型系统开发经验,熟悉多线程和并发容器。擅长Python、C#等编程语言,熟悉数据库应用。了解微服务、架构设计等领域。具备高质量文档编写能力,熟悉Markdown语法。具有良好的代码品味和问题解决能力,擅长团队合作与沟通。热衷于学习前沿技术。
展开
-
EfficientNetV2: Smaller Models and Faster Training学习
训练效率对于深度学习非常重要,因为模型规模和训练数据量越来越大。例如,GPT-3(Brown等,2020)拥有更大的模型和更多的训练数据,在少样本学习方面展示了卓越的能力,但它需要数周的训练时间和数千个GPU,这使得重新训练或改进变得困难。"TPU days"指的是使用TPU(Tensor Processing Unit)进行训练所花费的时间,以天为单位进行计量。TPU是由谷歌开发的专用硬件加速器,用于高效地执行深度学习任务。原创 2023-05-20 18:46:51 · 634 阅读 · 0 评论 -
Ink Detection
在字迹检测中,每个backbone的效果取决于具体的应用场景、数据集和任务要求。EfficientNet-B5、MIT-B5和ResNeXt50_32x4d都是在图像分类任务中表现出色的backbone模型,而ResNet3D则主要用于视频分类和动作识别任务。因此,从字迹检测的角度来看,EfficientNet-B5和MIT-B5可能更适合,因为它们在图像分类任务中已经得到了广泛的验证和应用。原创 2023-05-20 16:59:40 · 708 阅读 · 0 评论 -
ChatGPT是不是没有用知识图谱的技术方法
例如,在特定领域的问答任务中,可以将ChatGPT与知识图谱结合起来,利用知识图谱中的实体和关系信息来提供更准确和详细的答案。然而,ChatGPT可以在回答问题和提供信息时利用其广泛的语言知识和上下文理解能力。它可以通过在训练过程中对大量的多领域文本数据进行学习,掌握广泛的知识和常识。这使得ChatGPT在与用户交互时能够提供相对准确和有用的回答。ChatGPT是基于预训练的语言模型,其能力主要来自于在大规模文本数据上的训练。它可以理解和生成文本,但并不直接使用显式的知识图谱来支持其推理和回答问题的能力。原创 2023-05-16 09:52:49 · 388 阅读 · 0 评论 -
手语识别任务精华提炼
因此,如果一个sequence_id对应的所有帧(frames)都是唯一的,那么可以确定该sequence_id对应的手语单词只有一个手势序列,即视频中只包含一个该手语单词的手势。反之,如果一个sequence_id对应的帧(frames)中有重复,那么可以确定该sequence_id对应的手语单词包含多个手势序列,即视频中包含多个该手语单词的手势。如果手语动作只有很少的几个唯一帧,则在训练模型时需要考虑更长的视频序列,以便于提供更多的信息,从而提高模型的准确性和鲁棒性。原创 2023-05-12 20:17:57 · 651 阅读 · 0 评论 -
家装软件相关算法和技术归纳
准确识别从户型图中准确识别房间、墙体、门窗等元素可能受到图像质量、细节丢失和多种表达方式的影响。预处理:在开始识别前,先对户型图进行预处理,以消除噪声、改善图像质量和调整图像尺寸。常用的预处理方法包括滤波(如高斯滤波)、直方图均衡化、缩放等。边缘检测:边缘检测是识别图像中物体边界的关键步骤。它可以帮助检测墙体、门窗等元素的位置。常用的边缘检测算法包括Canny边缘检测、Sobel算子、Laplacian算子等。轮廓提取:在边缘检测的基础上,提取和分析轮廓信息可以帮助识别房间、墙体、门窗等元素。原创 2023-04-29 10:18:29 · 1166 阅读 · 0 评论 -
几个导致DeepFaceLab训练速度较慢的原因
硬件配置:DeepFaceLab 需要较高的计算机配置才能运行,包括较大的内存、高性能的 GPU、快速的存储器等。如果你的计算机配置不够高,可能会导致训练速度较慢。超参数选择:DeepFaceLab 中有许多超参数需要调整,这些参数会影响模型的性能和训练速度。复杂度:DeepFaceLab 的算法和模型较为复杂,需要处理大量数据和计算复杂的数学运算,这可能导致训练速度较慢。数据量:DeepFaceLab 需要大量的训练数据来训练模型,如果你的数据量不够大,可能需要更长的时间来训练模型。原创 2023-04-21 19:06:06 · 2184 阅读 · 0 评论 -
如何通过http://127.0.0.1:5005/和rasa对话
要使用Rasa和HTTP接口进行对话,您需要首先启动Rasa服务并训练您的模型。如果您已经训练了模型,请使用以下命令加载模型:rasa shell --endpoints endpoints.yml。现在,您可以在浏览器中访问http://127.0.0.1:5005/以查看Rasa的API文档。使用以下命令启动Rasa服务:rasa run --enable-api -p 5005。您应该看到Rasa返回的JSON响应,其中包含机器人对用户消息的响应。在终端中,导航到包含您的Rasa项目的目录。原创 2023-03-16 20:11:36 · 966 阅读 · 0 评论 -
练习如何实现Emojify
该demo可以实现自动在对应英文语句后面加上表情。原创 2021-04-11 13:35:49 · 117 阅读 · 0 评论 -
Magenta学习笔记
Magenta旨在探索机器学习在艺术和音乐创作过程中的作用。它基于 TensorFlow 系统,由 Google Brain 团队创立,使用LSTM网络进行机器自动作曲,专门进行基于机器学习的人工智能艺术方面的研究,包括自动作曲、音频生成、图画生成等方面。研究人员称,机器生成的音乐已经存在了许多年,但它们在都缺乏长的叙事艺术。Magenta 试图将故事作为机器生成音乐的重要部分。Google 还公布了一个DEMO(MP3)来展现 Magenta 项目的成果。在它的开源项目中提供了大量模型: ...原创 2021-04-07 11:48:26 · 277 阅读 · 0 评论 -
如何应用NLP序列标注实现快递单地址识别
百度NLP研发工程师将会通过在EasyDL平台上的实际操作,详细展示应用NLP序列标注任务实现对快递单地址识别的过程,带大家深入了解NLP序列标注。https://www.iqiyi.com/playlist1940414402.html课程将分为三个部分:一、什么是NLP序列标注?二、常见序列标注的算法网格介绍三、操作篇:使用EasyDL平台实现快递单地址识别任务...原创 2021-03-25 09:12:04 · 1016 阅读 · 0 评论 -
first-order-model学习笔记(二):运行参数
运行demo.py前需要设置好参数。一、功能大头贴转动画vox-256--config config/vox-256.yaml --driving_video resources/videos/00.mp4 --source_image resources/images/01.jpg --checkpoint checkpoints/vox-cpk.pth.tar --relative --adapt_scalecpu版参数为:--config config/vox-256.yaml -原创 2021-03-21 09:52:56 · 1749 阅读 · 0 评论 -
音视频与文本互转学习笔记(一):相关开源项目
一、视频转文本extract-textual-insights-from-videoIn this code pattern, given a video recording of the virtual meeting or a virtual classroom, we will be extracting audio from video file using open source library FFMPEG, transcribing the audio to get speaker dia原创 2021-03-21 07:46:02 · 211 阅读 · 0 评论 -
zhrtvc学习笔记(一):环境配置
该项目的requirements中的tensorflow用的是1.x,如果已经安装了更高版本的tensorflow,需要对形如下面一行的的代码进行修改:config = tf.compat.v1.ConfigProto()然后就是按部就班地安装phkit等模块。接下来碰到一个大麻烦,执行到下面这句报错,给tensorflow降级并不是好办法,因为python3.8不支持tensorflow 1.15。from tensorflow.contrib.seq2seq import Helper原创 2021-03-19 08:15:25 · 532 阅读 · 0 评论 -
TTS学习笔记(一):Real-Time-Voice-Cloning环境配置
该项目非常难以下载,经常断联。好不容易下载下来以后,安装及更新了几个库以后,运行demo_cli.py遇到了一个错: if not args.no_mp3_support: try: librosa.load("samples/1320_00000.mp3") except NoBackendError: print("Librosa will be unable to open mp3 files if add原创 2021-03-17 15:37:34 · 1250 阅读 · 0 评论 -
first-order-model学习笔记(一):环境配置
由于该项目依赖的库比较旧,下载完源码后,最好建立独立的Interpreter。需要安装的库有face-alignment,numpy版本可以用1.20.1,skimage对应的包名有点难找,叫做scikit-image,可以用0.18.1,笔记本上配置的torch版本可以用1.60+cpu。...原创 2021-03-16 10:13:28 · 1765 阅读 · 2 评论 -
实用音频工具推荐
小熊音频编辑器支持音频切割、放大选择区域、淡出、增加音量。不过加载一些文件时加载不进去,包括Edge和Chrome都是这样。Audio Extractor - 从在线视频中提取音频这个工具需要上传本地视频,并不是提取在线视频。MP3剪切合并大师13.9不支持放大选择区域,也不能最大化软件窗口,导致不方便选择分割点。音频编辑专家比小熊音频编辑器编辑的时候麻烦一点,不过它能加载小熊音频编辑器加载不了的文件。迅捷音频转换器需要购买vip才能正常使用。原创 2021-03-09 08:51:49 · 537 阅读 · 0 评论 -
NLP应用(一):斗鱼弹幕标签分析
<div class="layout-Player-main">标签下控制的界面如下:<div class="layout-Player-aside">标签下控制的界面如下:该标签下有三个子标签:<div class="layout-Player-asideMainTop">,用于控制聊天以上的界面。<div class="layout-Player-chat">,用于控制聊天界面。<div class="layout-P..原创 2021-03-12 12:46:13 · 301 阅读 · 0 评论 -
Rasa学习笔记(六):常用命令整理
rasa run用于启动服务器。rasa train训练。rasa shell利用控制台进行对话。rasa run actions用于启动行为服务器来监听交互过程中的行为。rasa interactive利用控制台对test_stories.yml中的脚本进行测试,并可动态修改各配置文件。...原创 2021-03-14 15:09:05 · 570 阅读 · 0 评论 -
Rasa学习笔记(五):正则表达式
- regex: account_number examples: | - \d{10,12}- intent: check_account_number examples: | - my account number is [1234567891](account_number) - This is my account number [1234567891](account_number)原创 2021-03-14 12:52:59 · 865 阅读 · 0 评论 -
Rasa学习笔记(四):训练模型方法提炼
在nlu.yml中添加意图和相应的训练样本。在rules.yml中为相应的意图添加回答方法。在domain.yml中添加相应的意图和回答方法。如果只修改domain.yml,重新训练的时候速度会很快,提示Core stories/configuration did not change. Only the templates section has been changed. A new model with the updated templates will be created.原创 2021-03-11 06:13:21 · 684 阅读 · 0 评论 -
Rasa学习笔记(三):终端交互
训练的时候,以下配置文件非常值得参考:交互终端可以非cmd的形式,参见:Custom Connectors -https://rasa.com/docs/rasa/next/connectors/custom-connectors/如果暂时只需要用cmd来进行交互,在需要读取命令执行结果时,避免在命令无法退出或进入交互模式的场景应用os.popen; os.popen()无法满足需求时,可以考虑subprocess.Popen()。不过这个方法也并不太容易,并且也非长久之计。推荐阅读:..原创 2021-03-08 15:26:46 · 273 阅读 · 0 评论 -
Rasa学习笔记(二):训练中文对话系统
上一篇文章已经介绍了如何训练问答机器人,然而当训练语料为中文时不再可行。解决方法:在config.yml中加入下面几行后尝试训练。- name: JiebaTokenizer- name: CRFEntityExtractor- name: CountVectorsFeaturizer OOV_token: oov token_pattern: '(?u)\b\w+\b'- name: EmbeddingIntentClassifier然而运行后会报错,错误如下:Compone原创 2021-03-05 13:16:47 · 1224 阅读 · 2 评论 -
Rasa学习笔记(一):定义自己的故事
还没吃透Rasa_NLU_Chi的强大技术,又发现了更加厉害的框架:Rasa,不像Rasa_NLU_Chi已经半年没更新过了,Rasa在最近17个小时内还在更新。在页面https://github.com/RasaHQ中,我们可以看到几个非常好的项目:rasaOpen source machine learning framework to automate text- and voice-based conversations: NLU, dialogue management, connect原创 2021-03-04 16:07:13 · 386 阅读 · 1 评论 -
Rasa_NLU_Chi学习笔记(三):启动服务
利用上一篇文章介绍的方法生成模型后,就可以利用该模型进行服务了。windows下运行参数:-m rasa_nlu.server -c ../sample_configs/config_jieba_mitie_sklearn.yml --path models原创 2021-03-04 06:45:26 · 505 阅读 · 1 评论 -
Rasa_NLU_Chi学习笔记(二):初尝训练之妙趣+安装mitie
准备好文件total_word_feature_extractor_zh.dat,将它放到指定目录。专题中上一篇文章已经提过利用python setup.py install来安装的问题,还是逐一安装感觉更可控。需要安装的包有mitie。原创 2021-03-03 11:06:39 · 568 阅读 · 0 评论 -
Rasa_NLU_Chi学习笔记(一):顺藤摸瓜
本文记录通过批量测试和配置环境来逐渐掌握该项目的过程。通过进行以下实验,可以学会:如何利用py.test进行批量测试;如何在临时文件夹中写文件;如何获取项目根目录路径;如何在github上Commit and push自己的代码;安装缺失包的一种方法;从spaCy1.8.2的源码中可以看到对哪些语言进行过支持;了解如何将.pyx文件转化为可以import的.pyd文件。下面只重点列出测试会报错的几个文件。原创 2021-03-02 21:41:19 · 315 阅读 · 0 评论