- 博客(20)
- 收藏
- 关注

原创 Scala编程语言学习总结
              &
2018-11-05 21:17:02
32678
7
原创 AI商业化:如何包装技术并找到客户需求?
AI 商业化不仅关乎技术创新,更需要精准的市场洞察与产品包装。技术封装与模块化:让复杂的算法变成简单易用的产品组件。精准的市场调研:了解行业痛点,确保产品直击客户需求。迭代与反馈:快速构建 MVP,不断验证和优化产品,形成稳定的商业模式。多元化变现策略:从 SaaS、定制开发、咨询培训等多条路径探索最适合的商业模式。未来,随着 AI 技术的不断普及和更新,如何在激烈的市场竞争中找到切入点、精准解决用户问题,将是不断探索和进化的过程。
2025-02-06 15:58:29
653
原创 AI大模型训练实战:分布式与微调指南
为什么分布式?:大模型体量动辄数百 GB 的参数,需要多份资源协同才能完成训练;为什么微调?:复用已有大模型知识基底,只需少量场景数据就能让模型精通某个领域,极大降低成本;如何操作?:通常选择框架(DeepSpeed、Megatron-LM 等),结合数据并行、模型并行或 ZeRO 等先进策略;未来趋势**更高阶“轻量化微调”**技术:常见例如LoRA,显著减少参数更新量;多模态分布式训练:当文字、图像、语音融合时,分布式结构将更加复杂,也需要更灵活的并行策略;大模型实时微调。
2025-02-06 15:45:35
945
原创 深入浅出 Transformer:Attention 机制图解
Transformer 的核心正是注意力并行计算,从而替代传统 RNN 结构。多头注意力是将多个注意力机制并行计算后再 Concatenate,增强模型表达能力。残差连接 & LayerNorm提供稳定训练与防止梯度消失。等大模型在此之上累积海量参数与数据,进化出强大的自然语言理解与生成能力,甚至可以延伸到多模态任务。后续你可以探究架构细节。位置编码(Positional Encoding) 及其正余弦函数原理。多模态 Attention:如何在图像与文本之间寻找关联?推理加速。
2025-02-06 12:37:27
1058
原创 从零开始了解人工智能:核心概念、GPT及 DeepSeek 探索
人工智能(Artificial Intelligence)是让机器拥有类似人类思考和学习能力的一门学科。它的核心目标在于模拟与扩展人类智力,在图像识别、语音交互、自然语言处理(NLP)、自动驾驶等领域都能看到 AI 的身影。从专业角度来讲,人工智能结合了统计学、计算机科学及神经科学等多学科理论,通过算法与数据的驱动来让计算机不断迭代优化,甚至可以衍生出自主学习的能力。通过本篇文章,你已经对人工智能(AI)的基础概念和发展历程有了大致了解,也初步见识了大语言模型 GPT。
2025-02-06 12:31:35
1174
原创 HDFS分布式原理---概念篇
HDFS分布式系统2018年10月9日11:50什么是大数据:短时间内快速的产生海量的多种多样的有价值的数据大数据的技术:分布式存储分布式计算分布式批处理数据积攒一段时间,在未来某一时刻一次性计算一批数据分布式流处理数据实时进行计算,产生一条计算一条分布式存储分布式存储系统,是将数据分散存储在多台独立的设备上,存储“大数据”。举个例子:一位顾客将自己许多的琐碎的小物件...
2020-08-21 14:35:00
1196
原创 16进制字符串与字符串、字节之间的转换
1.字符串与16进制字符串之间的转换 /** * * 字符串转换成十六进制字符串 */ public static String str2HexStr(String str) { char[] chars = "0123456789ABCDEF".toCharArray(); StringBuilder sb = new StringBu...
2019-10-14 14:12:25
553
原创 JQuery---点击获取验证码后倒计时,刷新页面倒计时不失效
采用通过添加Cookie的方式实现页面刷新后倒计时仍有效,亲测有效!1.Html部分://导入JS文件<script type="text/javascript" src="../js/jquery.min.js"></script><script type="text/javasc
2019-01-16 09:30:28
1484
3
原创 Jquery相关的<div>标签的隐藏与显示及判断显示或隐藏状态
1.visibility与display之间的区别: ①div的visibility属性可以控制div的显示和隐藏,但是隐藏后页面显示空白,仅限于隐藏内容,所在位置仍存在。 ②display属性可以使div隐藏后释放占用的页面空间。具体使用: ①<div class="p...
2019-01-10 10:33:27
1505
原创 MyBatis中@Transient注解的作用
@Transient注解使用在实体类中,实体类中使用@Table注解后,想要添加数据库表中不存在的字段,就要使用@Transient这个注解。 这样可以使与数据库表相对应的实体类有一个表中没有但可以使用的字段,这样可以减少因为一个字
2018-12-19 13:44:57
11934
原创 Hive的表
Hive中表的类型:&amp;amp;nbsp;&amp;amp;nbsp;&amp;amp;nbsp;&amp;amp;nbsp;1.内部表(受控表):当删除内部表时,HDFS上的数据以及元数据都会被删除&amp;amp;nbsp;&amp;amp;nbsp;&amp;amp;nbsp;&amp;amp;nbsp;2.外部表:当除外部,HDFS上的数据不会被删除但是元数据
2018-10-21 17:36:57
692
原创 Hive原理及Hive的搭建与部署
一、Hive的原理&amp;amp;nbsp;&amp;amp;nbsp;&amp;amp;nbsp;&amp;amp;nbsp;1)Hive简介&amp;amp;nbsp;&amp;amp;nbsp;&amp;amp;nbsp;&amp;amp;nbsp;&amp;amp;nbsp;hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为
2018-10-21 17:11:12
801
原创 MapReduce的代码编写
MapReduce用例代码的编写流程 1)函数入口 ①首先创建配置对象Configurati
2018-10-19 17:27:52
3627
原创 操作HDFS集群的JavaAPI
一、准备阶段首先配置本机的环境变量,配置好HADOOP_HOME;在eclipse中安装好插件,以便在eclipse中操作HDFS集群,将hadoop-eclipse-plugin-2.6.0.jar包放入到eclipse安装文件夹下的dropins文件夹中的plugins下,此后重启eclipse即可在eclipse中操作hdfs集群。注意: 编写的代码若有操作文件(例如修改、删除等功能)时...
2018-10-15 20:05:57
1127
原创 HDFS学习总结
HDFS(分布式存储)学习总结1.Hadoop的历史Hadoop的作者是dogcutting,在其开发的Lucene数据存储工具的基础上实现的Hadoop;Hadoop的三驾马车分别为:Google发布的GFS、MapReduce、BigTable,这是Hadoop实现的前提论文;Hadoop的生态圈包括:HDFS、MapReduce、yarn、common。2.HDFS存储原理1)Nam...
2018-10-14 14:08:15
773
原创 CentOS6.5下搭建高可用完全分布式
一、什么是高可用性 “高可用性”(High Availability)通常来描述一个系统经过专门的设计,从而减少停工时间,而保持其服务的高度可用性。 高可用集群是指以减少服务中断时间为目的的服务器集群技术。它通过保护用户的业务程序对外不间断提供的服务,把因软件/硬件/人为造成的故障对业务的影响降低到最小程度。为此我们在完全分布式系统的基础上加入了ZooKeeper、Journa...
2018-10-12 23:27:05
679
原创 CentOS6.5下搭建完全分布式HDFS
一、准备阶段1.首先安装好四台虚拟机分别作为一台nameNode与三台dataNode,最好规范命名方便操作,例如node01、node02等2.将四台虚拟机的IP配置好,让其使用固定的静态IP,以防动态分配IP,方法为:首先进入 cd /etc/sysconfig/network-scripts/vi ifcfg-eth0 修改文件修改:ONBOOT=yes ...
2018-10-10 19:58:04
534
原创 CentOS下HDFS伪分布式搭建
(1) 配置免密登录 node01->node01① ssh-keygen -t rsa (此处一路回车即可)② ssh-copy-id -i ~/.ssh/id_rsa.pub root@node01(2) 配置JDK再次之前先检查系统中是否有已安装好的jdk:java -version若以后jkd版本要先卸载掉,方法参照:https://www.cnblogs.com/...
2018-10-09 21:03:38
357
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人