数据科学真奇妙呀真奇妙-CSDN博客

原创脏话词库最全整理

https://github.com/LDNOOBW/List-of-Dirty-Naughty-Obscene-and-Otherwise-Bad-Words很多种语言的脏话词库BTW：在找词库的过程中遇到GitHub打不开的问题，按照这篇文章https://www.jianshu.com/p/bf37776b4bb8暂时解决了，但是后面又出现了打不开的情况，而且换一台电脑也是如此，而且GitHub也根本不需要梯子。最后的解决办法是：不用学校的校园网用流量就行了。垃圾校园网...

2022-02-23 14:33:53 6042 1

原创 A Survey of Transformers

除了模块化的改进之外，还有一些研究对模型整体架构进行改进。作者将这些改进分为5种，轻量化改进方法、增强模块之间的连接、动态调整计算时间、分而治之的方法以及可替代的模型。在轻量化变种中，具有代表性的是2020年提出的Light Transformer模型，在这个研究里作者将transformer的self-attention模块替换为卷积神经网络与注意力机制的组合，卷积神经网络分支专门研究局部上下文建模，注意力机制分支专门研究长距离关系建模。这是light transformer的结构。该架构在模型大小和

2021-11-08 16:10:43 251

原创【论文阅读】

Enhancing Recommender Systems With a Stimulus-Evoked Curiosity Mechanism*摘要：*推荐系统 (RS) 中的经典算法主要强调实现高精度，从而推荐与用户过去选择精确匹配的项目。然而，用户可能会逐渐失去兴趣并渴望一些更鼓舞人心的东西。在心理学中，好奇心是一种批判性的人性，可以有效引导探索行为，因此这种现象可以解释为刺激不足，无法引起对推荐项目的好奇心。受上述启发，这项工作提出了一个好奇心驱动推荐框架 (CdRF)，它结合了高度创新的刺激诱发

2021-11-05 19:29:04 590

原创 HTML网页中中文显示为问号的解决

点击分析按钮进入分析页面时却出现了乱码，明明是把查询页面的HTML代码copy过来的，

2020-06-13 22:12:24 7174

原创对知乎数据进行情感分析

关于编码问题：‘utf-8’ codec can’t decode byte 0xb7 in position 0: invalid start byte参见这篇博文：https://www.cnblogs.com/xiaolan-Lin/p/11653432.html代码来自于这篇博文：https://blog.csdn.net/lom9357bye/article/details/79058946?ops_request_misc=%257B%2522request%255Fid%2522%253A%

2020-05-13 22:42:22 730 2

weixin_46660582的博客

原创脏话词库最全整理

原创 A Survey of Transformers

原创【论文阅读】

原创 HTML网页中中文显示为问号的解决

原创对知乎数据进行情感分析

转载关于python读取excel的时间是浮点型

原创记一些错误

原创 python爬取微博数据

原创运行错误的解决

原创 python爬取热搜神器

大三用过的一些包做个备份

空空如也