还挺好看！用命令行画思维导图；66天机器学习之旅；斯坦福CS234 强化学习课程；哈佛CS50 计算机科学导论课程；前沿论文

本文链接：https://blog.csdn.net/ShowMeAI/article/details/127241777

👀日报合辑 | 📆电子月刊 | 🔔公众号下载资料 | 🍩@韩信子

工具&框架

🚧 『Gymnasium』强化学习算法开发与比较的标准API

https://github.com/Farama-Foundation/Gymnasium

https://gymnasium.farama.org/

Gymnasium 是一个开源的 Python 库，用于开发和比较强化学习算法，它提供了一个标准的 API，用于学习算法和环境之间的交互，以及一套符合该 API 的标准环境。它是 OpenAI 的 Gym 库的维护者的一个分支。

🚧 『h-m-m (hackers mind map)』命令行思维导图工具

https://github.com/nadrad/h-m-m

h-m-m（发音类似于感叹词 “嗯”）是一个简单、快速、以键盘为中心的命令行终端工具，用于快捷处理思维导图。

🚧 『Notes』开源跨平台笔记应用

https://github.com/nuttyartist/notes

https://www.get-notes.com/

Notes 是一个开源跨平台的笔记应用，具备以下特性：

本地应用程序（用C++和Qt编写）
速度快，内存占用少
开放源代码并可以跨平台（Linux、macOS、Windows）
完全私密
文件夹和标签方便笔记组织
支持Markdown
支持不同的主题：在浅色、深色和深褐色之间切换
支持快捷键

🚧 『OmniEvent』全面的、统一的、模块化的事件抽取工具包

https://github.com/THU-KEG/OmniEvent

https://omnievent.readthedocs.io/en/latest/

OmniEvent是一个强大的事件提取开源工具包，包括事件检测和事件参数提取。我们全面覆盖了各种范式，并在广泛使用的英文和中文数据集上提供公平和一致的评估。模块化的实现使OmniEvent具有高度的可扩展性。

🚧 『pySciSci』科学的科学分析库

https://github.com/SciSciCollective/pyscisci

The Science of Science (SciSci)是基于一种跨学科的方法，使用大型数据集来研究从事科学的基本机制——从研究问题的选择到职业轨迹和领域内的进展。

pySciSci 软件包提供了一个统一的界面，用于分析科学的科学中最常用的文献计量数据库，包括：

Microsoft Academic Graph (MAG)
Clarivate Web of Science (WoS)
DBLP
American Physical Society (APS)
PubMed
OpenAlex

博文&分享

👍 『journey of 66DaysOfData in Machine Learning』66天机器学习之旅

https://github.com/regmi-saugat/66Days_MachineLearning

Repo 作者按照主题对机器学习内容进行了整理分类。可以按天打卡学习！

Logistic Regression（逻辑回归）
Gradient Descent（梯度下降）
Perceptron Algorithm（感知器算法）
K Nearest Neighbor（K 最近邻）
Decision Tree（决策树）
Ensemble Voting Classifier（集成投票分类器）
Bagging Ensemble
Random Forest（随机森林）
Adaboost
Gradient Boosting（梯度提升）
Stacking（堆栈）
Principal Component Analysis（主成分分析）
K-Means Clustering Algorithm（K-Means 聚类算法）
Hierarchical Clustering Algorithm（层次聚类算法）
DBSCAN Clustering（DBSCAN 聚类）
Support Vector Machine（支持向量机）
Cross Validation（交叉验证）
Bias Variance TradeOff（偏差-方差权衡）
Gradient Descent（梯度下降）
Batch Gradient Descent（批量梯度下降）
Stochastic Gradient Descent（随机梯度下降）
Perceptron（感知器）
Multilayer Perceptron（多层感知器）
Backpropagation（反向传播）
Vanishing Gradient Problem（梯度消失问题）
Improving the performance of Neural Networks（提高神经网络的性能）
Data Scaling（数据幅度缩放）
Dropout（随机失活）
Activation Function（激活函数）
Sigmoid Activation Function（Sigmoid 激活函数）
Tanh or Hyperbolic tangent（Tanh 或双曲正切）
ReLU Activation Function（ReLU 激活函数）
Leaky ReLU Function
Weight Initialization（权重初始化）
Batch Normalization（批归一化）
Momentum Optimization（动量优化）
Nesterov Accelerated Gradient（Nesterov 加速梯度）
AdaGrad Optimizer（AdaGrad 优化器）
RMS Prop
Adam Optimization（Adam 优化）
Convolution Neural Network（卷积神经网络）
Convolution Layer（卷积层）
Residual Network (ResNet)（残差网络(ResNet)）
Xception（Xception网络）

👍 『(CS234) Reinforcement Learning』Stanford斯坦福 · 强化学习课程

https://www.showmeai.tech/article-detail/347

CS234是顶级院校斯坦福出品的强化学习方向专业课程，为强化学习领域提供坚实的介绍。学生将学习核心挑战和方法，包括概括和探索。

通过讲座、书面和编码作业的结合，学生将精通RL的关键思想和技术。作业将包括强化学习的基础知识以及深度强化学习——这是一个将深度学习技术与强化学习相结合的非常有前途的新领域。

CS234 对于强化学习初步到构建全局认知有很大帮助。

Introduction to Reinforcement Learning（强化学习介绍）
Tabular MDP planning（表格型马尔科夫决策）
Tabular RL policy evaluation（表格型强化学习策略评估）
Q-learning（Q学习）
RL with function approximation（基于函数估计的强化学习）
Policy search（策略搜索）
Fast Learning（快速学习）
Batch Reinforcement Learning（批强化学习）
Monte Carlo Tree Search（蒙特卡洛树搜索）

ShowMeAI 对课程资料进行了梳理，整理成这份完备且清晰的资料包（点击这里获取这份资料包）：

📚 课件（PDF）。Lecture 1~16（官方未发布第14章的视频和课件）。

📚 笔记（PDF）。Note 1~14（部分笔记对应2章内容）。

📚 作业及参考解答（PDF）。Assignment 1~3 作业、代码和答案。

👍 『(CS50-CS) Introduction to Computer Science』Harvard哈佛 · 计算机科学导论课程

https://www.showmeai.tech/article-detail/348

CS50-CS 是一门非常火爆的计算机导论课！不仅成为哈佛大学最受欢迎的课程之一，也通过网络风靡全球！许多美国大学计算机课程的设计，都参考过这门课程。除了内容的专业度和权威性，Harvard 的课程有着非常与众不同的授课风格，整个课程在舞台形态的讲台上，以极具激情的方式讲授。

作为入门课程，它兼顾了深度和广度，能帮助快速全面地对计算机科学构建知识体系。对于小白来说也比较友好——历年学生有2/3没有编程经验。

CS50; Introduction to Computer Science; 计算机科学导论

课程主题如下：

C（C语言：语法与格式）
Arrays（数组：字符串、数组、调试方法）
Algorithms（算法：结构体、搜索与排序）
Memory（内存：IO、存储与内存管理）
Data Structures（数据结构：数组、链表、树、哈希表、字典树、堆、栈、队列）
Python（Python从语法到应用实战）
SQL（数据库与SQL知识体系）
Information（网络编程全指南：网络协议、HTML、CSS、JavaScript）

ShowMeAI 对课程资料进行了梳理，整理成这份完备且清晰的资料包（点击这里获取这份资料包）：

📚 课件（.pdf）。Lecture 0-8的课件。

📚 代码（.sb3）。课程使用的代码，可以搭建本地环境运行，也可以访问在线studio （ https://scratch.mit.edu/studios/25128634/ ）查看代码运行结果。

📚一位学霸的学习笔记资料，供参考。

数据&资源

🔥 『Graph Data Augmentation (GraphDA) for Deep Graph Learning』图数据增强相关文献资源大列表

https://github.com/kaize0409/awesome-graph-data-augmentaion

https://arxiv.org/pdf/2202.08235.pdf

Repo 主要包含用于深度图学习的图数据增强的会议和期刊链接。相关论文『 Data Augmentation for Deep Graph Learning: A Survey』见上方链接。

研究&论文

可以点击这里回复关键字日报，免费获取整理好的论文合辑。

科研进展

2022.09.21 『3D目标检测』 BEVStereo: Enhancing Depth Estimation in Multi-view 3D Object Detection with Dynamic Temporal Stereo
2022.09.16 『异常检测』 IoT Data Analytics in Dynamic Environments: From An Automated Machine Learning Perspective
2022.09.16 『图像分类』 Enhance the Visual Representation via Discrete Adversarial Training

⚡ 论文：BEVStereo: Enhancing Depth Estimation in Multi-view 3D Object Detection with Dynamic Temporal Stereo

论文时间：21 Sep 2022

领域任务：3D Object Detection, Depth Estimation, 3D目标检测

论文地址：https://arxiv.org/abs/2209.10248

代码实现：https://github.com/megvii-basedetection/bevstereo

论文作者：Yinhao Li, Han Bao, Zheng Ge, Jinrong Yang, Jianjian Sun, Zeming Li

论文简介：To this end, we introduce an effective temporal stereo method to dynamically select the scale of matching candidates, enable to significantly reduce computation overhead./为此，我们引入了一种有效的时间立体方法来动态选择匹配候选者的规模，从而大大减少计算开销。

论文摘要：受深度感知固有的模糊性的限制，当代基于相机的三维物体检测方法陷入了性能瓶颈。直观地说，利用时间性的多视角立体技术（MVS）是解决这种模糊性的自然知识。然而，传统的MVS尝试在应用于三维物体检测场景时有两个方面的缺陷：1）所有视图之间的亲和力测量的计算成本昂贵；2）难以处理物体经常移动的户外场景。为此，我们引入了一种有效的时间立体方法，动态地选择匹配候选者的规模，从而大大降低了计算开销。再进一步，我们设计了一个迭代算法来更新更有价值的候选者，使其对移动的候选者具有适应性。我们将我们提出的方法实例化到多视图三维检测器，即BEVStereo。BEVStereo在nuScenes数据集的仅有摄像头的轨道上实现了新的最先进的性能（即52.5%的mAP和61.0%的NDS）。同时，大量的实验反映出我们的方法比当代的MVS方法能更好地处理复杂的户外场景。代码已经发布在 https://github.com/Megvii-BaseDetection/BEVStereo

⚡ 论文：IoT Data Analytics in Dynamic Environments: From An Automated Machine Learning Perspective

论文时间：16 Sep 2022

领域任务：Anomaly Detection, AutoML, 异常检测，自动化机器学习

论文地址：https://arxiv.org/abs/2209.08018

代码实现：https://github.com/western-oc2-lab/automl-implementation-for-static-and-dynamic-data-analytics

论文作者：Li Yang, Abdallah Shami

论文简介：Machine Learning (ML) approaches have shown their capacity for IoT data analytics./机器学习（ML）方法已经显示出其在物联网数据分析方面的能力。

论文摘要：随着近年来传感器和智能设备的广泛普及，物联网（IoT）系统的数据生成速度急剧增加。在物联网系统中，大量的数据必须频繁地被处理、转换和分析，以实现各种物联网服务和功能。机器学习（ML）方法已经显示出它们对物联网数据分析的能力。然而，将ML模型应用于物联网数据分析任务仍然面临许多困难和挑战，特别是有效的模型选择、设计/调整和更新，这对有经验的数据科学家提出了大量需求。此外，物联网数据的动态性质可能会引入概念漂移问题，导致模型性能下降。为了减少人类的努力，自动机器学习（AutoML）已经成为一个流行的领域，旨在自动选择、构建、调整和更新机器学习模型，以实现指定任务的最佳性能。在本文中，我们对AutoML领域的模型选择、调整和更新程序的现有方法进行了回顾，以确定和总结将ML算法应用于物联网数据分析的每个步骤的最佳解决方案。为了证明我们的发现，并帮助工业用户和研究人员更好地实施AutoML方法，在这项工作中进行了一个将AutoML应用于物联网异常检测问题的案例研究。最后，我们讨论并分类了这个领域的挑战和研究方向。

⚡ 论文：Enhance the Visual Representation via Discrete Adversarial Training

论文时间：16 Sep 2022

领域任务：Domain Generalization, Image Classification, 领域泛化，图像分类

论文地址：https://arxiv.org/abs/2209.07735

代码实现：https://github.com/alibaba/easyrobust

论文作者：Xiaofeng Mao, Yuefeng Chen, Ranjie Duan, Yao Zhu, Gege Qi, Shaokai Ye, Xiaodan Li, Rong Zhang, Hui Xue

论文简介：For borrowing the advantage from NLP-style AT, we propose Discrete Adversarial Training (DAT)./为了借用NLP风格的AT的优势，我们提出了离散对抗性训练（DAT）。

论文摘要：对抗性训练（AT）被普遍认为是抵御对抗性例子的最有效的方法之一，但它在很大程度上会损害标准性能，因此在工业规模的生产和应用中的作用有限。令人惊讶的是，这种现象在自然语言处理（NLP）任务中却完全相反，AT甚至可以在概括性方面受益。我们注意到AT在NLP任务中的优点可能来自于离散和符号化的输入空间。为了借用NLP风格的AT的优势，我们提出了离散对抗训练（DAT）。DAT利用VQGAN将图像数据转换为离散的文本输入，即视觉词。然后，它通过象征性的对抗性扰动使这种离散图像的最大风险最小化。我们进一步从分布的角度给出解释，以证明DAT的有效性。作为一种增强视觉表征的即插即用技术，DAT在图像分类、物体检测和自监督学习等多个任务上取得了明显的改善。特别是，用掩码自动编码（MAE）预训练的模型，经过我们的DAT微调，无需额外的数据，就能在ImageNet-C上获得31.40 mCE，在Stylized-ImageNet上获得32.77%的最高准确率，建立了新的最先进的水平。该代码将在 https://github.com/alibaba/easyrobust 发布。

我们是 ShowMeAI，致力于传播AI优质内容，分享行业解决方案，用知识加速每一次技术成长！

◉ 点击 日报合辑，在公众号内订阅话题 #ShowMeAI资讯日报，可接收每日最新推送。

◉ 点击 电子月刊，快速浏览月度合辑。

◉ 点击这里，回复关键字日报免费获取AI电子月刊与论文 / 电子书等资料包。