- 博客(838)
- 资源 (43)
- 收藏
- 关注
原创 金融业大数据应用场景
如果能够引入外部数据,还可以进一步加快数据价值的变现。外部数据中比较好的有社交数据、电商交易数据、移动大数据、运营商数据、工商司法数据、公安数据、教育数据和银联交易数据等。大数据在金融行业的应用范围较广,典型的案例有花旗银行利用 IBM 沃森电脑为财富管理客户推荐产品,并预测未来计算机推荐理财的市场将超过银行专业理财师;摩根大通银行利用决策树技术,降低了不良贷款率,转化了提前还款客户,一年为摩根...
2020-04-07 17:05:48
9554
3
原创 量化交易主流框架介绍
量化交易主流框架介绍talibtalib的简称是Technical Analysis Library,主要功能是计算行情数据的技术分析指标numpy介绍:一个用python实现的科学计算包。包括:1、一个强大的N维数组对象Array;2、比较成熟的(广播)函数库;3、用于整合C/C++和Fortran代码的工具包;4、实用的线性代数、傅里叶变换和随机数生成函数。numpy和稀疏矩阵运算包s...
2018-10-15 19:16:46
6867
8
原创 压缩文件zip和rar格式有什么区别
采用 RAR 专有压缩算法(结合了 LZSS、LZ77 等改进算法),压缩率显著高于 ZIP,尤其是在压缩多个文件或大型文件包时,能节省更多存储空间。RAR 是 WinRAR 公司的专有格式,受专利保护,解压 RAR 文件虽然多数软件支持,但创建 RAR 文件通常需要付费购买 WinRAR 授权(个人用户可免费试用,但商业用途需付费)。ZIP是开放标准,无专利和版权限制,几乎所有操作系统(Windows、macOS、Linux、Android、iOS)都原生支持,无需额外安装软件就能解压。
2025-12-29 15:51:55
471
原创 RAR压缩包的三种加密方法
文件压缩成RAR压缩包后,想要保护文件内容不被他人随意解压,我们可以给rar压缩包设置加密,这里分享3种方法进行加密。
2025-12-29 15:46:16
183
原创 电脑自带Edge浏览器进行PDF文件合并
Edge 原生没有 “一键合并多个 PDF” 的可视化按钮,可进行Edge 扩展一键合并。具体步骤如下。
2025-12-29 15:24:46
463
原创 Windows 11 与 Windows 10系统对比
Windows 11 是微软在 Windows 10 基础上推出的新一代系统,核心差异体现在 UI 设计、硬件要求、功能体验、安全机制 四个维度,同时对新硬件适配和现代化交互做了针对性优化。以下是博主整理的部门对比内容。
2025-12-25 11:54:02
1457
原创 Windows 11 的OOBE是什么意思
OOBE 全称,中文译为 “开箱体验”,是新电脑首次开机时系统自动启动的引导配置流程,仅在全新未激活的 Windows 系统中出现,也是判断电脑是否为新机的核心依据之一。
2025-12-25 11:06:13
218
原创 电脑参数自检-BIOS
博主最近买了太新电脑(联想小新Pro),整理了一系列验机相关知识。今天来说一下BIOS。除了用验机工具进行验机,BIOS/UEFI 是新电脑验机的核心环节之一,可在无系统环境下快速核对硬件配置、序列号、出厂信息与电池健康,结合系统工具交叉验证,能高效识别翻新 / 篡改、硬件故障与配置不符问题。用BIOS验机前准备工作:先做三码与外观初检BIOS 序列号(SN)、机身底部 SN、包装盒 SN 必须一致,任一不符即可疑。检查机身螺丝无拧痕、接口无插拔磨损、屏幕无坏点、电池无鼓包,避免先通电掩盖瑕疵。
2025-12-25 10:35:31
731
原创 BIOS简介
BIOS(基本输入输出系统)是固化在主板闪存芯片上的底层固件,是电脑开机后运行的第一个程序,负责硬件初始化、系统引导与基础参数管理,是连接硬件与操作系统的关键桥梁。
2025-12-25 10:12:58
761
原创 电脑检测软件—图吧工具箱
图吧工具箱全称是 “图拉丁吧硬件检测工具箱”,它由百度贴吧 “图拉丁吧”(简称图吧)的社区成员于 2014 年发起并维护,最初是吧友整理的检测工具包,后发展为有统一启动器、持续更新的独立工具合集。图吧工具箱是开源、免费、绿色、纯净的硬件检测工具合集,专为所有计算机硬件极客、DIY爱好者、各路大神及小白制作。集成大量常见硬件检测、评分工具,一键下载、方便使用。
2025-12-23 13:22:18
1476
原创 电脑检测软件—鲁大师
鲁大师是新一代的系统工具。它能轻松辨别电脑硬件真伪,保护电脑稳定运行,优化清理系统,提升电脑运行速度的免费软件。主要功能包括硬件检测、电池健康监控(电池状态、电池损耗等)、硬件温度监测、一键清理等功能,下面详解介绍。
2025-12-23 10:58:43
544
原创 新电脑验机工具介绍及避坑指南
新电脑验机工具优先用图吧工具箱(一站式集成),搭配AIDA64、CrystalDiskInfo、CPU-Z/GPU-Z、FurMark、DisplayX,覆盖配置核对、硬盘健康、屏幕质量、稳定性与性能全维度,兼顾新手友好与专业精准。
2025-12-22 16:05:50
955
原创 Hive SQL中COALESCE 函数和NVL()函数、IFNULL函数区别
Hive 中的NVL()是双参数函数,用于将 NULL 值替换为指定的非 NULL 值,语法和行为与 Oracle 的NVL()完全兼容。语法作用:如果expression为 NULL,则返回replacement;否则返回expression本身。要求:expression和replacement的数据类型必须一致(或可隐式转换),否则会报错。SELECTNVL(NULL, 0), -- 返回0NVL('hello', 'world'), -- 返回'hello'
2025-12-17 15:51:01
742
原创 Apache Superset可视化简介
它能连接任何基于 SQL 的数据库,包括现代云原生数据库和 PB 级规模的引擎,用户可以创建物理和虚拟数据集,通过统一的度量定义来扩展图表创建,从交互式仪表盘中探索数据并发现洞察,通过拖放创建强大的图表和表格,编写自定义 SQL 查询、浏览数据库元数据、使用 Jinja 模板等。例如,它可以对接 Hive、Kylin、Druid 等常用的大数据分析工具,通过其高效的查询引擎和轻量级的缓存层,实时展示数据变化,满足企业对大数据分析的需求。Superset 是一个开源项目,拥有活跃的社区支持。
2025-12-17 10:28:13
839
原创 一文读懂豆包和火山引擎关系
豆包与火山引擎同属字节跳动体系,二者是深度绑定的技术与商业搭档关系,豆包作为核心大模型提供技术能力支撑,火山引擎则作为核心载体与渠道实现其商业化落地。
2025-12-15 14:08:43
593
原创 豆包大数据模型有哪些
豆包目前已构建起覆盖通用语言、视觉创作、语音交互、垂直功能的全品类模型体系,并非单一模型,而是十余款适配不同场景的系列模型,这里博主做一下整理和介绍。
2025-12-15 14:04:40
627
原创 电脑核心参数一次讲透
显示芯片在显卡中的地位,就相当于电脑中CPU的地位,是整个显卡的核心。显存容量从早期的512KB、1MB、2MB等极小容量,发展到8MB、12MB、16MB、32MB、64MB,128MB、256MB、512MB、1GB。显存容量从早期的512KB、1MB、2MB等极小容量,发展到8MB、12MB、16MB、32MB、64MB,128MB、256MB、512MB、1GB。”,即“热设计功耗”,是反应一颗处理器热量释放的指标,它的含义是当处理器达到负荷最大的时候,释放出的热量,单位为瓦(W)。
2025-12-12 09:35:56
1448
原创 性能检测中的生产力场景是什么?
在电脑性能和配置对比的语境中,生产力场景指的是围绕工作、学习、创作等产生实际价值的电脑使用场景,区别于游戏、影音娱乐等纯消费型场景。这类场景对电脑的 CPU 多核性能、内存容量、硬盘读写速度、屏幕素质等有明确要求,不同细分场景的需求侧重点不同。
2025-12-11 14:39:33
517
原创 【永洪BI】V11.0重要更新-管理与运维
永洪BI V11.0 的发布日期是2024 年 11 月 26 日,经过近一年的改进,我们公司本月度(2025-12月)也进行了版本升级,升级为11版本。现对具体更新内容进行整理说明。继昨天发布了后,今天继续整理,供大家参考。
2025-12-11 11:52:21
630
原创 【永洪BI】V11.0重要更新-重要功能
永洪BI V11.0 的发布日期是2024 年 11 月 26 日,经过近一年的改进,我们公司本月度(2025-12月)也进行了版本升级,升级为11版本。现对具体更新内容进行整理说明。继昨天发布了后,今天继续整理,供大家参考。
2025-12-11 11:42:21
765
原创 【永洪BI】V11.0重要更新-亮点功能
不同业务部门可按需配置“预测逻辑”、“归因口径”、“洞察路径”等标准流程,供大模型问答自动匹配调用。从V11.0.2开始支持报告数据总结,vivichat运用先进的数据分析技术、自然语言生成(NLG)能力,结合报告自身特点与业务逻辑规则,支持从多个维度为用户生成精准且易于理解的叙事性解读,有效提升数据分析的效率与信息传达的清晰度,让用户能够更高效地从报告数据中获取有价值的见解,为决策提供有力支持。
2025-12-10 14:14:20
752
原创 Python练习经典案例
冒泡排序重复地走访需要排序的元素列表,依次比较两个相邻的元素,如果顺序(如从大到小或从小到大)错误就交换它们的位置。重复地进行直到没有相邻的元素需要交换,则元素列表排序完成。像153,它是一个三位数,1³ + 5³ + 3³ = 1 + 125 + 27 = 153 ,所以153就是一个水仙花数。水仙花数(Narcissistic number)又称超完全数字不变数(PPDI)、自恋数、自幂数、阿姆斯特朗数(Armstrong number),水仙花数共有4个,分别为:153、370、371、407。
2025-12-09 16:35:41
439
原创 Hive SQL中with as用法及注意事项
with t1 as (select * from table1) -- 该语句执行会报错-- 正确写法:(没有使用 t1没关系,其后有select就行)
2025-12-03 11:36:17
569
原创 Apache SeaTunnel的架构设计
Apache SeaTunnel 的架构设计以为核心,整体采用分层模块化结构,核心可拆解为 “三段式数据处理流程 + 核心计算引擎 + 辅助支撑组件”,既保障了数据集成的高效性,又兼顾了适配性和易用性。
2025-11-24 16:48:46
1088
原创 Apache SeaTunnel和其他数据集成工具对比
Apache SeaTunnel 相较于 DataX、Flink CDC、Talend 等主流数据集成工具,在性能、部署易用性、多场景适配性等多个维度都具备显著优势。博主分别结合不同工具做了以下对比分析。
2025-11-24 16:43:14
864
原创 Apache SeaTunnel的发展历程
Apache SeaTunnel 的发展历程是一部从国产开源小项目成长为全球认可的 Apache 顶级项目的进阶史,其前身是 Waterdrop,历经开源起步、Apache 孵化、顶级项目成熟发展等多个关键阶段,下面博主对几个重要时间节点进行梳理。
2025-11-24 16:35:50
409
原创 Apache SeaTunnel介绍
Apache SeaTunnel(原名 Waterdrop)是一款高性能、分布式的开源数据集成平台,主打海量数据的同步、ETL 处理等场景,能解决多数据源兼容、同步场景复杂等行业痛点,目前已成为 Apache 顶级项目,被近百家企业应用于生产环境。
2025-11-24 16:33:02
791
原创 根据经纬度信息计算两点间距离(Python版)
车辆电子围栏是依托 GPS、北斗等卫星定位技术,在监控平台或车载终端的电子地图上划定的虚拟地理区域,是车辆监控与管理的智能化方案,并非实体围栏。当车辆进入或离开这个预设区域时,系统会按提前设定的规则触发相应操作,常被用于车辆防盗、行程监控等场景,像租赁公司可借此监控出租车辆,企业能用来规范员工用车范围。车辆驶出围栏后,系统会发出声光报警震慑不法分子,同时通过手机短信、APP 推送等方式,把车辆实时位置等信息发送给车主或管理人员,方便其及时掌握车辆动态并采取应对措施。
2025-11-18 13:36:46
97
原创 根据经纬度信息计算两点间距离(MySQL、HiveSQL)
车辆电子围栏是依托 GPS、北斗等卫星定位技术,在监控平台或车载终端的电子地图上划定的虚拟地理区域,是车辆监控与管理的智能化方案,并非实体围栏。当车辆进入或离开这个预设区域时,系统会按提前设定的规则触发相应操作,常被用于车辆防盗、行程监控等场景,像租赁公司可借此监控出租车辆,企业能用来规范员工用车范围。车辆驶出围栏后,系统会发出声光报警震慑不法分子,同时通过手机短信、APP 推送等方式,把车辆实时位置等信息发送给车主或管理人员,方便其及时掌握车辆动态并采取应对措施。
2025-11-18 13:31:56
89
原创 【永洪BI】数据层次
对数据字段可以创建自己的自定义分层结构。例如,如果您有一组名为“大区”、“省”和“市”的字段,则可以依据这些字段创建一个分层结构,以便能够快速在报告的图表和表格各层之间向下钻取。
2025-11-18 10:40:58
616
原创 电脑配置四大核心之硬盘篇
硬盘负责长期存放文件、系统和软件,决定数据读写速度和存储容量。电脑硬盘是计算机系统中用于存储和检索数据的重要外部存储设备,即使在断电或重启之后,存储在硬盘上的数据仍然保持不变。
2025-11-06 11:06:31
609
原创 电脑配置四大核心之显卡篇
电脑显卡,全称为图形处理器(Graphics Processing Unit,简称 GPU),是计算机硬件中负责处理和渲染图形图像的关键组件。
2025-11-06 10:46:03
516
原创 电脑配置四大核心之内存篇
电脑内存,即随机存取存储器(Random Access Memory,简称 RAM),是计算机中用于临时存储数据和程序的关键硬件。内存是计算机的临时数据存储中心,作为 CPU 与硬盘间的高速中转站,能临时存放运行中的程序和数据,供 CPU 直接快速访问。其 “随机访问” 特性允许 CPU 直接调用任意位置数据,无需按顺序读取,这对多任务处理至关重要。
2025-11-06 10:06:00
449
原创 电脑配置四大核心之CPU篇
CPU 是中央处理器(Central Processing Unit)的英文缩写,是电子设备的核心运算和控制单元。CPU 是电脑的 “大脑”,负责处理所有数据运算,直接影响多任务处理、软件启动和整体流畅度。CPU 的背面都布满了密密麻麻的针脚或触点。
2025-11-05 14:56:17
310
原创 一文扫盲—笔记本和台式机同样配置,为什么性能不一样?
简单说,笔记本的 “相同配置” 是 “阉割版”,为了便携和续航牺牲了性能和散热;台式机的 “相同配置” 是 “满血版”,能完全发挥硬件潜力。比如同样是 “i5-1135G7 + 16GB + 512GB + RTX 4050”:台式机:玩 3A 游戏更流畅,渲染视频更快,用 5 年还能升级硬件;笔记本:能随身携带,但游戏帧率低、高负载会降频,5 年后基本只能换整机。没有绝对的 “更好”,只看需求 —— 要性能选台式机,要便携选笔记本。
2025-11-05 13:53:40
969
原创 DolphinScheduler功能介绍-创建工作流
点击”保存“按钮,弹出"设置DAG图名称"弹框,如下图所示,输入工作流定义名称,工作流定义描述,设置全局参数(选填,参考全局参数),点击"添加"按钮,工作流定义创建成功。
2025-10-29 15:36:02
136
机器学习02--K近邻算法
2018-11-08
机器学习09--决策树02
2018-11-08
笨办法学python
2018-10-18
数据分析--matplotlib绘图和可视化
2018-11-08
MySQL性能优化之参数配置
2018-11-08
python面试笔试题(现场应聘收集)
2018-10-18
机器学习01--机器学习入门知识(数据科学 5 机器学习介绍)
2018-11-08
机器学习03--决策树01
2018-11-08
集群搭建手册_CDH5.13.1版.docx
2020-03-11
Airflow安装配置和web端插件安装
2020-07-01
navicat 连接oracle 11g驱动包
2020-05-28
陀螺仪调度部署和使用(美云智数).rar
2020-05-14
Day2-pandas-Ⅰ.xmind
2020-01-13
Day3-pandas-Ⅱ.xmind
2020-01-13
Day4-pandas-Ⅲ.xmind
2020-01-13
Day7-pandas-Ⅳ:数据加载与透视表.xmind
2020-01-13
Day1-IPython与Numpy.xmind
2020-01-13
Day5-Scipy.xmind
2020-01-13
azkaban安装包(web+excutor)
2020-03-27
Day10-决策树与贝叶斯.xmind
2020-01-13
Day9-LinearRegression线性回归与逻辑斯蒂回归.xmind
2020-01-13
TensorFlow.xmind
2020-01-13
Day8-KNN.xmind
2020-01-13
Day6-matplotlib.xmind
2020-01-13
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅