Levine-Huang-CSDN博客

原创你的专属旅行策划团队——AI特工们闪亮登场！

想象一下，暑假里，爸爸妈妈要带你去一个全新的城市探险，是不是超级兴奋？” “最强大脑规划师”会立刻行动，把第二天的行程调整为参观有趣的科技馆或水族馆，绝不让你被大雨浇成“落汤鸡”希望这篇文章能点燃你对科学的好奇心，也许未来的某一天，你也会成为那个创造出更神奇AI的科学家哦。你可以把它想象成AI特工们的大脑，这个大脑读过全世界几乎所有的书籍和资料，所以知识渊博，而且特别擅长理解和推理。最近，几位科学家叔叔阿姨就研发了一个叫做“Vaiage”的神奇系统，它就像一个藏在手机里的专属旅行策划团队。

2025-09-08 20:48:18 346

原创 AI智能体进化迎来“轻模式”：Memento无需微调 LLM，凭借“经验记忆”实现持续学习

这项技术的核心，在于为AI智能体装配了一个动态的“经验记忆库”，使其能像人类一样，从过去的成功与失败中汲取教训。

2025-08-26 15:17:40 1146

原创让AI变聪明的秘密：从“1+1”开始学起！

科学家发现中小型AI在处理复杂问题时容易"卡壳"，为解决这一问题，德州农工大学团队开发了"E2HReasoner"系统。该系统采用"由易到难"的渐进式训练方法，将任务分解为不同难度级别，并配合奖励机制引导AI学习。实验表明，经过该方法训练的中小型AI在数学推理等任务上表现显著提升，能给出清晰的解题思路。这项研究证明，科学的教学方法能有效提升AI的学习能力，为开发更高效的智能系统提供了新思路。

2025-08-25 16:38:26 451

原创 AI学霸养成记：揭秘两大“神功”，让AI变身超级解题高手

同学们，你们有没有遇到过这样的情况：一道数学难题，绞尽脑汁也想不出来，感觉自己的大脑好像“卡机”了？别担心，其实现在最聪明的人工智能（AI）有时也会遇到同样的烦恼。

2025-08-25 15:50:35 610

原创 ML-0101-梯度下降小结

基本概念梯度梯度下降梯度下降的相关概念梯度下降算法算法过程梯度下降的各种变体BGDSGDMBGD批量梯度下降Batch gradient descent随机梯度下降Stochastic gradient descent小批量梯度下降Mini-batch gradient descent梯度下降的算法调优梯度下降法和其他无约束优化算法的比较无约束优化算法无约束优化算法的比较

2017-10-25 08:48:47 1128

原创 ML之02-TF-IDF算法原理及其应用

TF-IDF算法TF-IDF介绍TF-IDF算法步骤TF-IDF算法实现TF-IDF算法本身和实现过程中可能的影响因素TF-IDF应用场景TF-IDF算法应用示例余弦相似性cosine similiarityReference如何借助计算机提取文章的关键词（Automatic Keyphrase extraction），或比较两篇文章的相似度？TF-IDF算法余弦相似性(c

2017-06-20 08:26:08 1396

原创 SparkMLlib之02-Pipeline介绍及其应用

Pipeline中的主要概念Pipeline组件TransformersEstimatorsParameters保存和加载PipelinePipeline应用Example1Example2一个典型的机器学习机器学习过程通常会包含：源数据 ETL，数据预处理，指标提取，模型训练与交叉验证，新数据预测等。我们可以看到这是一个包含多个步骤的流水线式工作，也就是说数据从收集开始，要经历多

2017-06-20 08:17:48 930

原创 SparkMLlib之01-Spark机器学习库介绍

Spark机器学习库简介MLlib是Spark的机器学习库。旨在简化机器学习的工程实践工作，并方便扩展到更大规模。MLlib由一些通用的学习算法和工具组成，包括分类、回归、聚类、协同过滤、降维等，同时还包括底层的优化原语和高层的管道API。它提供如下工具：机器学习算法：常规机器学习算法包括分类、回归、聚类和协同过滤。特征工程：特征提取、特征转换、特征选择以及降维。管道：构造、评估和调整的管道的

2017-05-07 20:36:02 1040

原创 ML之01-核密度估计Kernel Density Estimation(KDE)

由给定样本集合求解随机变量的分布密度函数问题是概率统计学的基本问题之一。解决这一问题的方法包括参数估计和非参数估计。

2017-05-07 17:05:09 5539

原创快学scala笔记之02-类

5.1 简单类和无参方法Class Counter {private var value = 0 // 必须初始化字段def increment() { value += 1 } // 方法默认是公有的改值器def current() = value //取值器// def current = value}val myCounter = new Coun

2017-04-20 08:57:27 335

原创利用alias自定义快捷命令

身为开发人员，不可避免地经常需要进入几个常用的目录进行开发，如果目录太深，经常敲一串路径（例如： cd /path/to/my/work/directiron），着实麻烦。可利用alias自定义一些快捷命令。用windows系统在本地开发的研发，Cygwin和Git Bash这两个辅助软件估计必不可少。对于经常需要切换到工作目录，可以按以下方式设置快捷命令。Cy

2017-04-20 08:35:59 6818 1

原创快学scala笔记之01-数据类型

快学scala笔记之01-数据类型

2017-04-15 19:19:36 349

原创 Impala之04-Impala 如何使用 Hadoop 文件格式【译】

原文：https://www.cloudera.com/documentation/enterprise/5-7-x/topics/impala_file_formats.htmlImpala 支持几种熟悉的 Apache Hadoop 中使用的文件格式。Impala 可以加载或查询其他 Hadoop 组件如 Pig 或 MapReduce 产生的数据文件，并且 Impala 产生的数

2017-04-09 16:05:16 1756

原创 Impala之03-原理、架构分析(2)

上一篇文章《Impala之02-原理、架构分析(1)》介绍了MPP相关背景知识，本文将深入分析Impala系统架构、原理。下图展示了Impala的系统架构和查询的执行流程。从图中可以看出，Impala自身包含三个模块：Impalad、Statestore和Catalog，并提供CLI(impala shell)、ODBC、JDBC数据访问接口，除此之外它还依赖Hive Metastor

2017-04-09 16:01:12 1809

原创数据库中DQL、DML、DDL、DCL的概念与区别

SQL(Structure Query Language)语言是数据库的核心语言。SQL语言共分为四大类：数据定义语言DDL，数据操纵语言DML，数据查询语言DQL，数据控制语言DCL。1. 数据定义语言DDL数据定义语言DDL用来创建数据库中的各种对象-----表、视图、索引、同义词、聚簇等如：CREATE TABLE/VIEW/INDEX/SYN/CLUSTER

2017-04-08 11:48:59 43597

原创 Impala之02-原理、架构分析(1)

Apache Impala是由Cloudera开发并开源的一款基于HDFS/Hbase的MPP SQL引擎，是Google Dremel的开源实现。在分析Impala架构、原理之前，先介绍一下相关背景知识。一、SMP、NUMA、MPP体系结构介绍从系统架构来看，目前的商用服务器大体可以分为三类，即对称多处理器结构 (SMP ： Symmetric Multi-Proce

2017-04-08 11:39:22 826

原创 Impala之01-基本介绍

Impala是Cloudera公司主导开发的新型查询系统，是Google Dremel的开源实现。它提供SQL语义，能够查询存储在Hadoop的HDFS和HBase中的PB级大数据。已有的Hive系统虽然也提供了SQL语义，但是由于Hive底层执行使用的是MapReduce引擎，仍然是一个批处理过程，难以满足查询的交互性；相比之下，Impala的最大特点也是最大卖点就是它的快速。设计目

2017-03-30 23:34:07 756

原创 02-深度学习中的Data Augmentation方法

02-深度学习中的Data Augmentation方法在深度学习中，为了避免出现过拟合（Overfitting），通常我们需要输入充足的数据量。当数据量不够大时候，常常采用以下几种方法：Data Augmentation：通过平移、翻转、加噪声等方法从已有数据中创造出一批“新”的数据，人工增加训练集的大小。Regularization：数据量比较小会导致模型过拟合, 使得训练误差很小而测试误

2017-02-23 09:10:15 5568

原创 03-Keras之用MNIST数据集训练一个CNN

03-Keras之用MNIST数据集训练一个CNN模型code# -*- coding: utf-8 -*-'''Trains a simple convnet on the MNIST dataset.Gets to 99.25% test accuracy after 12 epochs(there is still a lot of margin for parameter tuning).

2017-02-19 18:31:44 1519

原创 02-Keras之网络层思维导图

更多文章欢迎关注微信公众号：大数据学苑（Bigdata-Eden）

2017-02-19 17:45:40 1382

原创 01-Keras之用MNIST数据集训练一个DNN

01-Keras之用MNIST数据集训练一个DNN　模型code# -*- coding: utf-8 -*-'''Trains a simple deep NN on the MNIST dataset.Gets to 98.40% test accuracy after 20 epochs(there is *a lot* of margin for parameter tuning).2

2017-02-19 16:33:45 6312 1

原创 00-Keras之入门介绍

00-Keras之入门介绍Keras是一个高层神经网络库，Keras由纯Python编写而成并基于Tensorflow或Theano。Keras 为支持快速实验而生，能够把你的idea迅速转换为结果。Keras特点简易和快速的原型设计（keras具有高度模块化，极简，和可扩充特性）支持CNN和RNN，或二者的结合支持任意的链接方案（包括多输入和多输出训练）无缝CPU和GPU切换Keras设

2017-02-19 11:22:56 725

原创有道云笔记markdow模式如何插入本地图片

有道云笔记markdow模式如何插入本地图片![image](图片链接)，将图片链接替换为待插入图片的绝对路径右键本地图片，打开“属性”页面；转到“安全”选项，在这里，我们将会看到“对象名称”，copy +c 复制图片的地址，如![image](E:\00-Inbox\A06-1.jpg),即可看到插入的图片经测试，改变本地图片路径后，markdown文件中引用的图片可正常显示。改变markd

2017-01-21 12:11:32 7220 1

原创工作中linux常用命令

hostname 查看本机主机名linux主机名hostname设置

2015-09-07 18:37:29 266

Levine Huang