技术文章
文章平均质量分 90
Mrrunsen
这个作者很懒,什么都没留下…
展开
-
如何用Tushare获取金融数据
Tushare提供以下股票行情数据:日线行情、周线行情、月线行情、复权行情、复权因子、每日停复牌信息、每日指标、个股资金流向、每日涨跌停价格、沪深港通资金流向、沪深股通十大成交股、港股通十大成交股、港股通每日成交统计、港股通每月成交统计等。Tushare提供的市场参考数据包括:融资融券交易汇总、融资融券交易明细、融资融券标的、前十大股东、前十大流通股东、龙虎榜每日明细、龙虎榜机构明细、股权质押统计数据、股权质押明细、股票回购、限售股解禁、大宗交易、股东人数、股东增减持等。原创 2024-08-10 15:27:53 · 1209 阅读 · 1 评论 -
什么是提示工程师
作为一个提示工程师,创建文本生成任务的提示模板时,主要任务是创建一个具有指导意义的上下文或起始文本,引导模型生成预期的内容。作为一个提示工程师,创建摘要生成任务的提示模板需要提供足够的指示,让模型明白需要从给定的文本中提取主要信息并生成简洁的摘要。作为一个提示工程师,创建问题回答任务的提示模板需要提供清晰的问题及相关上下文,以指导模型产生预期的答案。但这只是一种基本的模板,更复杂的翻译任务中,可能需要进一步优化模板,如对话翻译、古诗词翻译等都需要对模板进行针对性的调整,以便模型能产出更符合期望的结果。原创 2024-08-09 06:44:20 · 966 阅读 · 0 评论 -
神经网络-RoBERTa
为了避免在每轮训练中每个训练实例都使用相同的mask,训练数据被复制了10倍,这样在每个40个训练周期的训练中,每个序列都以10种不同的方式被masked。然而,当建模大量多样化的语料库时,如本工作中考虑的语料库,Unicode字符可以占据这个词汇量的一个相当大的部分。遵循Radford等人(2019)的方法,我们考虑使用一个更大的字节级BPE词汇表来训练BERT,该词汇表包含50K子词单位,而无需对输入进行额外的预处理或分词。这些子词不是预先定义的单词,而是通过分析训练语料库中的统计数据自动提取的。原创 2024-08-09 06:40:06 · 1745 阅读 · 0 评论 -
AutoDis 一文小结
AutoDis 一文小结这篇文章介绍了AutoDis,一个创新的框架,旨在解决推荐系统中点击率(CTR)预测的一个关键问题:如何有效地嵌入数值特征。在现有的CTR预测模型中,数值特征的嵌入通常受限于固定数量的参数,导致模型无法充分捕捉特征之间的复杂交互,或者依赖于无法与模型目标共同优化的硬离散化规则。要解决的问题: 现有模型通常忽视了嵌入模块在处理数值特征时的重要性。 数值特征的传统嵌入方法(如规范化和离散化)存在性能瓶颈,例如低容量问题、两阶段问题(TPP)、相似值原创 2024-08-09 06:38:29 · 750 阅读 · 0 评论