
工具&框架
🚧 『Gymnasium』强化学习算法开发与比较的标准API
https://github.com/Farama-Foundation/Gymnasium
Gymnasium 是一个开源的 Python 库,用于开发和比较强化学习算法,它提供了一个标准的 API,用于学习算法和环境之间的交互,以及一套符合该 API 的标准环境。它是 OpenAI 的 Gym 库的维护者的一个分支。


🚧 『h-m-m (hackers mind map)』命令行思维导图工具
https://github.com/nadrad/h-m-m
h-m-m(发音类似于感叹词 “嗯”)是一个简单、快速、以键盘为中心的命令行终端工具,用于快捷处理思维导图。

🚧 『Notes』开源跨平台笔记应用
https://github.com/nuttyartist/notes
Notes 是一个开源跨平台的笔记应用,具备以下特性:
- 本地应用程序(用C++和Qt编写)
- 速度快,内存占用少
- 开放源代码并可以跨平台(Linux、macOS、Windows)
- 完全私密
- 文件夹和标签方便笔记组织
- 支持Markdown
- 支持不同的主题:在浅色、深色和深褐色之间切换
- 支持快捷键


🚧 『OmniEvent』全面的、统一的、模块化的事件抽取工具包
https://github.com/THU-KEG/OmniEvent
https://omnievent.readthedocs.io/en/latest/
OmniEvent是一个强大的事件提取开源工具包,包括事件检测和事件参数提取。我们全面覆盖了各种范式,并在广泛使用的英文和中文数据集上提供公平和一致的评估。模块化的实现使OmniEvent具有高度的可扩展性。

🚧 『pySciSci』科学的科学分析库
https://github.com/SciSciCollective/pyscisci
The Science of Science (SciSci)是基于一种跨学科的方法,使用大型数据集来研究从事科学的基本机制——从研究问题的选择到职业轨迹和领域内的进展。
pySciSci 软件包提供了一个统一的界面,用于分析科学的科学中最常用的文献计量数据库,包括:
- Microsoft Academic Graph (MAG)
- Clarivate Web of Science (WoS)
- DBLP
- American Physical Society (APS)
- PubMed
- OpenAlex

博文&分享
👍 『journey of 66DaysOfData in Machine Learning』66天机器学习之旅
https://github.com/regmi-saugat/66Days_MachineLearning
Repo 作者按照主题对机器学习内容进行了整理分类。可以按天打卡学习!
- Logistic Regression(逻辑回归)
- Gradient Descent(梯度下降)
- Perceptron Algorithm(感知器算法)
- K Nearest Neighbor(K 最近邻)
- Decision Tree(决策树)
- Ensemble Voting Classifier(集成投票分类器)
- Bagging Ensemble
- Random Forest(随机森林)
- Adaboost
- Gradient Boosting(梯度提升)
- Stacking(堆栈)
- Principal Component Analysis(主成分分析)
- K-Means Clustering Algorithm(K-Means 聚类算法)
- Hierarchical Clustering Algorithm(层次聚类算法)
- DBSCAN Clustering(DBSCAN 聚类)
- Support Vector Machine(支持向量机)
- Cross Validation(交叉验证)
- Bias Variance TradeOff(偏差-方差权衡)
- Gradient Descent(梯度下降)
- Batch Gradient Descent(批量梯度下降)
- Stochastic Gradient Descent(随机梯度下降)
- Perceptron(感知器)
- Multilayer Perceptron(多层感知器)
- Backpropagation(反向传播)
- Vanishing Gradient Problem(梯度消失问题)
- Improving the performance of Neural Networks(提高神经网络的性能)
- Data Scaling(数据幅度缩放)
- Dropout(随机失活)
- Activation Function(激活函数)
- Sigmoid Activation Function(Sigmoid 激活函数)
- Tanh or Hyperbolic tangent(Tanh 或双曲正切)
- ReLU Activation Function(ReLU 激活函数)
- Leaky ReLU Function
- Weight Initialization(权重初始化)
- Batch Normalization(批归一化)
- Momentum Optimization(动量优化)
- Nesterov Accelerated Gradient(Nesterov 加速梯度)
- AdaGrad Optimizer(AdaGrad 优化器)
- RMS Prop
- Adam Optimization(Adam 优化)
- Convolution Neural Network(卷积神经网络)
- Convolution Layer(卷积层)
- Residual Network (ResNet)(残差网络(ResNet))
- Xception(Xception网络)


👍 『(CS234) Reinforcement Learning』Stanford斯坦福 · 强化学习课程
https://www.showmeai.tech/article-detail/347
CS234是顶级院校斯坦福出品的强化学习方向专业课程,为强化学习领域提供坚实的介绍。学生将学习核心挑战和方法,包括概括和探索。
通过讲座、书面和编码作业的结合,学生将精通RL的关键思想和技术。作业将包括强化学习的基础知识以及深度强化学习——这是一个将深度学习技术与强化学习相结合的非常有前途的新领域。

CS234 对于强化学习初步到构建全局认知有很大帮助。
- Introduction to Reinforcement Learning(强化学习介绍)
- Tabular MDP planning(表格型马尔科夫决策)
- Tabular RL policy evaluation(表格型强化学习策略评估)
- Q-learning(Q学习)
- RL with function approximation(基于函数估计的强化学习)
- Policy search(策略搜索)
- Fast Learning(快速学习)
- Batch Reinforcement Learning(批强化学习)
- Monte Carlo Tree Search(蒙特卡洛树搜索)

ShowMeAI 对课程资料进行了梳理,整理成这份完备且清晰的资料包(点击 这里 获取这份资料包):
📚 课件(PDF)。Lecture 1~16(官方未发布第14章的视频和课件)。
📚 笔记(PDF)。Note 1~14(部分笔记对应2章内容)。
📚 作业及参考解答(PDF)。Assignment 1~3 作业、代码和答案。

👍 『(CS50-CS) Introduction to Computer Science』Harvard哈佛 · 计算机科学导论课程
https://www.showmeai.tech/article-detail/348
CS50-CS 是一门非常火爆的计算机导论课!不仅成为哈佛大学最受欢迎的课程之一,也通过网络风靡全球!许多美国大学计算机课程的设计,都参考过这门课程。除了内容的专业度和权威性,Harvard 的课程有着非常与众不同的授课风格,整个课程在舞台形态的讲台上,以极具激情的方式讲授。
作为入门课程,它兼顾了深度和广度,能帮助快速全面地对计算机科学构建知识体系。对于小白来说也比较友好——历年学生有2/3没有编程经验。

课程主题如下:
- C(C语言:语法与格式)
- Arrays(数组:字符串、数组、调试方法)
- Algorithms(算法:结构体、搜索与排序)
- Memory(内存:IO、存储与内存管理)
- Data Structures(数据结构:数组、链表、树、哈希表、字典树、堆、栈、队列)
- Python(Python从语法到应用实战)
- SQL(数据库与SQL知识体系)
- Information(网络编程全指南:网络协议、HTML、CSS、JavaScript)

ShowMeAI 对课程资料进行了梳理,整理成这份完备且清晰的资料包(点击 这里 获取这份资料包):
📚 课件(.pdf)。Lecture 0-8的课件。
📚 代码(.sb3)。课程使用的代码,可以搭建本地环境运行,也可以访问在线studio ( https://scratch.mit.edu/studios/25128634/ )查看代码运行结果。
📚一位学霸的学习笔记资料,供参考。

数据&资源
🔥 『Graph Data Augmentation (GraphDA) for Deep Graph Learning』图数据增强相关文献资源大列表
https://github.com/kaize0409/awesome-graph-data-augmentaion
https://arxiv.org/pdf/2202.08235.pdf
Repo 主要包含用于深度图学习的图数据增强的会议和期刊链接。相关论文『 Data Augmentation for Deep Graph Learning: A Survey』见上方链接。


研究&论文

可以点击 这里 回复关键字 日报,免费获取整理好的论文合辑。
科研进展
- 2022.09.21 『3D目标检测』 BEVStereo: Enhancing Depth Estimation in Multi-view 3D Object Detection with Dynamic Temporal Stereo
- 2022.09.16 『异常检测』 IoT Data Analytics in Dynamic Environments: From An Automated Machine Learning Perspective
- 2022.09.16 『图像分类』 Enhance the Visual Representation via Discrete Adversarial Training
⚡ 论文:BEVStereo: Enhancing Depth Estimation in Multi-view 3D Object Detection with Dynamic Temporal Stereo
论文时间:21 Sep 2022
领域任务:3D Object Detection, Depth Estimation, 3D目标检测
论文地址:https://arxiv.org/abs/2209.10248
代码实现:https://github.com/megvii-basedetection/bevstereo
论文作者:Yinhao Li, Han Bao, Zheng Ge, Jinrong Yang, Jianjian Sun, Zeming Li
论文简介:To this end, we introduce an effective temporal stereo method to dynamically select the scale of matching candidates, enable to significantly reduce computation overhead./为此,我们引入了一种有效的时间立体方法来动态选择匹配候选者的规模,从而大大减少计算开销。
论文摘要:受深度感知固有的模糊性的限制,当代基于相机的三维物体检测方法陷入了性能瓶颈。直观地说,利用时间性的多视角立体技术(MVS)是解决这种模糊性的自然知识。然而,传统的MVS尝试在应用于三维物体检测场景时有两个方面的缺陷:1)所有视图之间的亲和力测量的计算成本昂贵;2)难以处理物体经常移动的户外场景。为此,我们引入了一种有效的时间立体方法,动态地选择匹配候选者的规模,从而大大降低了计算开销。再进一步,我们设计了一个迭代算法来更新更有价值的候选者,使其对移动的候选者具有适应性。我们将我们提出的方法实例化到多视图三维检测器,即BEVStereo。BEVStereo在nuScenes数据集的仅有摄像头的轨道上实现了新的最先进的性能(即52.5%的mAP和61.0%的NDS)。同时,大量的实验反映出我们的方法比当代的MVS方法能更好地处理复杂的户外场景。代码已经发布在 https://github.com/Megvii-BaseDetection/BEVStereo

⚡ 论文:IoT Data Analytics in Dynamic Environments: From An Automated Machine Learning Perspective
论文时间:16 Sep 2022
领域任务:Anomaly Detection, AutoML, 异常检测,自动化机器学习
论文地址:https://arxiv.org/abs/2209.08018
代码实现:https://github.com/western-oc2-lab/automl-implementation-for-static-and-dynamic-data-analytics
论文作者:Li Yang, Abdallah Shami
论文简介:Machine Learning (ML) approaches have shown their capacity for IoT data analytics./机器学习(ML)方法已经显示出其在物联网数据分析方面的能力。
论文摘要:随着近年来传感器和智能设备的广泛普及,物联网(IoT)系统的数据生成速度急剧增加。在物联网系统中,大量的数据必须频繁地被处理、转换和分析,以实现各种物联网服务和功能。机器学习(ML)方法已经显示出它们对物联网数据分析的能力。然而,将ML模型应用于物联网数据分析任务仍然面临许多困难和挑战,特别是有效的模型选择、设计/调整和更新,这对有经验的数据科学家提出了大量需求。此外,物联网数据的动态性质可能会引入概念漂移问题,导致模型性能下降。为了减少人类的努力,自动机器学习(AutoML)已经成为一个流行的领域,旨在自动选择、构建、调整和更新机器学习模型,以实现指定任务的最佳性能。在本文中,我们对AutoML领域的模型选择、调整和更新程序的现有方法进行了回顾,以确定和总结将ML算法应用于物联网数据分析的每个步骤的最佳解决方案。为了证明我们的发现,并帮助工业用户和研究人员更好地实施AutoML方法,在这项工作中进行了一个将AutoML应用于物联网异常检测问题的案例研究。最后,我们讨论并分类了这个领域的挑战和研究方向。

⚡ 论文:Enhance the Visual Representation via Discrete Adversarial Training
论文时间:16 Sep 2022
领域任务:Domain Generalization, Image Classification, 领域泛化,图像分类
论文地址:https://arxiv.org/abs/2209.07735
代码实现:https://github.com/alibaba/easyrobust
论文作者:Xiaofeng Mao, Yuefeng Chen, Ranjie Duan, Yao Zhu, Gege Qi, Shaokai Ye, Xiaodan Li, Rong Zhang, Hui Xue
论文简介:For borrowing the advantage from NLP-style AT, we propose Discrete Adversarial Training (DAT)./为了借用NLP风格的AT的优势,我们提出了离散对抗性训练(DAT)。
论文摘要:对抗性训练(AT)被普遍认为是抵御对抗性例子的最有效的方法之一,但它在很大程度上会损害标准性能,因此在工业规模的生产和应用中的作用有限。令人惊讶的是,这种现象在自然语言处理(NLP)任务中却完全相反,AT甚至可以在概括性方面受益。我们注意到AT在NLP任务中的优点可能来自于离散和符号化的输入空间。为了借用NLP风格的AT的优势,我们提出了离散对抗训练(DAT)。DAT利用VQGAN将图像数据转换为离散的文本输入,即视觉词。然后,它通过象征性的对抗性扰动使这种离散图像的最大风险最小化。我们进一步从分布的角度给出解释,以证明DAT的有效性。作为一种增强视觉表征的即插即用技术,DAT在图像分类、物体检测和自监督学习等多个任务上取得了明显的改善。特别是,用掩码自动编码(MAE)预训练的模型,经过我们的DAT微调,无需额外的数据,就能在ImageNet-C上获得31.40 mCE,在Stylized-ImageNet上获得32.77%的最高准确率,建立了新的最先进的水平。该代码将在 https://github.com/alibaba/easyrobust 发布。


我们是 ShowMeAI,致力于传播AI优质内容,分享行业解决方案,用知识加速每一次技术成长!
◉ 点击 日报合辑,在公众号内订阅话题 #ShowMeAI资讯日报,可接收每日最新推送。
◉ 点击 电子月刊,快速浏览月度合辑。
◉ 点击 这里 ,回复关键字 日报 免费获取AI电子月刊与论文 / 电子书等资料包。
