
算法与人生-人生优化算法
文章平均质量分 82
算法与人生之人生优化算法
强化学习曾小健
"强化学习曾小健2、强化学习曾小健3、我是机器人曾小健具身"都是该号副号。CSDN全站80强博客、总近480w+浏览。AI生成式技术,计算机博士;llama3、Baichuan2、Qwen、GLM-4等等项目贡献人(ArtificialZeng)。这个博客的主题主要是强化学习技术、AI生成式技术、大模型多模态技术、机器人具身智能控制技术、机器/深度学习论文或科研前沿、GNN图神经网络、神经网络,包括人工神经网络和生物神经网络,及其大脑演化,智能和认知的产生,通用人工智能;
展开
-
幸福就是过拟合 [算法与人生-专辑]
你在这个公司里可以说是过拟合了,尽管可能你在同行业中未必是最顶尖的,但在你的小圈子里,你获得了幸福感。幸福的真正来源,不是做得比周围的人好,而是拥有足够的能力和弹性,能够适应不断变化的环境。通过不断学习、扩展视野、接触更多的未知事物,我们不仅能够避免欠拟合的痛苦,也能避免过拟合的局限,找到更加持久和广泛的幸福感。职业多样化:如果你在一家公司表现得非常好,或许是时候尝试新的任务或新的领域,避免自己在这个小环境中过度依赖已有的经验。欠拟合带来的不幸,是因为你没有掌握足够的信息,甚至无法达到基本的生活标准。原创 2024-09-27 16:21:31 · 1291 阅读 · 0 评论 -
马斯克:未来AI将处理一切,人类不用工作,而是去寻找生活的意义 最大化多巴胺的AI”所控制
由于AI耐心、知识渊博且“几乎总是正确的”,它将是孩子们的优秀老师——尽管父母仍然需要负责道德和价值观的教育。如果你想将工作作为一种爱好,那么你可以选择工作,否则AI会提供你想要的任何商品和服务。在为时一小时的远程主旨演讲中,马斯克还重申了他之前签署的信件中的观点,即相信未来AI和大型语言模型的发展应暂停。上的一次访谈中提到,未来我们可能不需要工作——如果我们幸运的话,我们将不必担心缺少生活中的一切物品和服务,而是寻求生活的意义。”但他同时担心,如今的孩子们正受到社交媒体的培养,后者实际上是由一种“原创 2024-05-27 11:31:19 · 526 阅读 · 0 评论 -
[强化学习]之马尔可夫决策过程,以及马尔可夫性
详细说马尔可夫决策过程,以及马尔可夫性GPT-4oPoe马尔可夫决策过程 (Markov Decision Process, MDP)马尔可夫决策过程 (MDP) 是一种数学框架,用于描述在不确定环境下进行决策的问题。它在许多领域有广泛应用,如机器人控制、经济学、运营研究和人工智能。MDP 的基本组成部分MDP 由以下四个基本元素组成:状态 (State, S):系统所处的所有可能状态的集合。每个状态s∈S 代表系统在某一时刻的具体情况。原创 2024-05-22 00:13:16 · 935 阅读 · 0 评论 -
[算法与人生] 之 贪婪搜索
贪婪算法在具备最优子结构和贪心选择性质的问题上非常有效,能够提供高效且简单的解法。然而,对于缺乏这些特性的复杂问题,贪婪算法则可能无法找到最优解,甚至会导致错误的结果。在使用贪婪算法时,需要仔细分析问题的结构和性质,以判断其适用性。原创 2024-05-19 10:35:46 · 933 阅读 · 0 评论