清平乐的技术博客-CSDN博客

原创金融业大数据应用场景

如果能够引入外部数据，还可以进一步加快数据价值的变现。外部数据中比较好的有社交数据、电商交易数据、移动大数据、运营商数据、工商司法数据、公安数据、教育数据和银联交易数据等。大数据在金融行业的应用范围较广，典型的案例有花旗银行利用 IBM 沃森电脑为财富管理客户推荐产品，并预测未来计算机推荐理财的市场将超过银行专业理财师；摩根大通银行利用决策树技术，降低了不良贷款率，转化了提前还款客户，一年为摩根...

2020-04-07 17:05:48 9720 3

原创量化交易主流框架介绍

量化交易主流框架介绍talibtalib的简称是Technical Analysis Library,主要功能是计算行情数据的技术分析指标numpy介绍：一个用python实现的科学计算包。包括：1、一个强大的N维数组对象Array；2、比较成熟的（广播）函数库；3、用于整合C/C++和Fortran代码的工具包；4、实用的线性代数、傅里叶变换和随机数生成函数。numpy和稀疏矩阵运算包s...

2018-10-15 19:16:46 7142 8

原创【AI编程】腾讯云CodeBuddy

CodeBuddy 是腾讯云推出的 AI 辅助编程工具，通过将 AI 深度融入全流程，实现从产品构思到产品发布的一站式高效交付平台。产品支持IDE、插件和 CLI 三种形态，覆盖从专业开发者到零基础用户的全场景需求。

2026-07-07 17:14:19 302

原创【AI智能体】腾讯WorkBuddy介绍（二）

WorkBuddy 提供三种工作模式，对应不同的执行权限与交互方式首次使用优先选择Ask模式；熟悉后再按任务复杂度切换至 Plan 或 Craft 模式。处理重要文件前请先备份。（1）问一问（Ask）仅问答与信息查看，不修改文件。用于了解内容、确认需求。（2）做一做（Craft）直接执行任务并修改文件，用于文档生成、表格处理、文件整理。（3）想一想（Plan）先生成执行计划，确认后再操作，多步骤任务、需审阅改动范围。

2026-07-07 16:19:03 243

原创【AI智能体】腾讯WorkBuddy介绍（一）

WorkBuddy 是腾讯出品的全场景 AI 办公工作台。说出要求、开始执行任务、交付完整成果。完美连接腾讯办公生态，你的办公好搭子。只需用一句话描述需求，WorkBuddy 便能像同事一样自主规划和执行复杂任务，并交付可验收的结果。与传统的 AI 对话不同，WorkBuddy 不仅能"听懂人话"，还能"带脑子思考"并"实际操作本地文件"，真正帮您干活。

2026-07-07 16:02:35 457

原创 jieba分词高级用法 5类场景

1、新建user_dict.txt，格式：词语词频词性（词频、词性可省略）大数据开发 100 青岛海边 902、代码加载# 加载自定义词典text = "我今天去青岛海边做大数据开发"print(res)# 输出：['我', '今天', '去', '青岛海边', '做', '大数据开发']

2026-06-25 11:52:36 147

原创 jieba分词4种用法

jieba 是 Python 最常用的中文分词库，主要用于中文文本拆分、关键词提取、词性标注，广泛应用于爬虫、搜索、文本分析、NLP 业务场景。安装命令。

2026-06-25 11:35:49 66

原创【华为DataArts Studio】（二）主要应用场景

从数据采集->数据架构->质量监控->数据清洗->数据建模->数据联接->数据整合->数据消费->智能分析，一站式数据智能运营平台，帮助企业快速构建数据运营能力。快速将线下数据迁移上云，将数据集成到云上大数据服务中，并在DataArts Studio的界面中就可以进行快速的数据开发工作，让企业数据体系的建设变得如此简单。通过应用华为在企业业务领域积累的丰富的行业领域模型和算法，帮助企业构建数据中台，快速提升数据运营能力。

2026-06-16 17:01:43 275

原创【华为DataArts Studio】（一）认识DataArts

数据治理中心(DataArts Studio)是数据全生命周期一站式开发运营平台，提供数据集成、数据开发、数据治理、数据服务等功能，支持行业知识库智能化建设，支持大数据存储、大数据计算分析引擎等数据底座，帮助企业客户快速构建数据运营能力。以下是产品架构图：如图所示，DataArts Studio基于数据底座，提供数据集成、开发、治理等能力。

2026-06-16 16:17:51 323

原创 IDEA无需破解，永久免费！学Java必看

但即使没有订阅，IDEA 依然能够正常使用，可以免费用于商业和非商业项目，畅享 Java 和 Kotlin 开发所需的全部功能。IntelliJ IDEA 继续在第一时间为最新 Java 版本提供支持，同时还会为即将发布的 Java 版本提供早期支持，例如，允许您直接在 IDE 中安装抢先体验版。与 Java 25 不同，Java 26 没有引入任何新的稳定语言功能，但带来了模式匹配和延迟常量预览功能，这些功能已在 IntelliJ IDEA 中得到支持。

2026-06-10 17:15:49 2313

原创【Doris从0到1】（二）Docker部署

输出解析： Alive=true（FE）或 Alive=1（BE）表示节点运行正常。使用 MySQL 客户端连接集群，检查 FE 和 BE 状态。第 1 步（1/3）：下载启动脚本。第 3 步（3/3）：验证集群状态。第 2 步（2/3）：启动集群。

2026-06-09 08:05:42 246

原创【Doris从零到一】（一）Apache Doris 概述

Apache Doris 是一款基于 MPP 架构的高性能、实时分析型数据库，以高效、简单、统一著称：在亚秒级时间内返回海量数据查询结果，一套系统同时支持高并发点查询和高吞吐复杂分析。

2026-05-26 17:14:42 731

原创 Notepad++ 下载避坑指南

最近团队新入职了几名应届同学，统一配发了新办公电脑，首要工作想让他们几个自主完成环境配置。原以为安装 Notepad++ 是一件无脑的小事，结果折腾了半天，要么下载到带捆绑、弹窗广告的流氓软件，要么误入收费钓鱼网站，最后还是我单独下载发他们了了安装包。这件事也让我发现，看似简单的软件安装也藏着超多互联网下载陷阱，还是决定写一篇博文整理一下可能踩的坑。（大周一上班花了点时间写的，希望对大家有帮助，￣︶￣。

2026-05-25 10:41:11 633

原创一文读懂Kafka中的“消费”（对标MySQL数据库）

Kafka存了一堆实时数据，Flink/程序把这些数据拿出来、读一遍、做计算处理，这个全过程就叫消费。Kafka消费：靠Offset书签，只读新数据、从未读的位置继续读，不会重复读历史数据（同消费者组内）Kafka：Flink任务持续读取Topic数据 → 过滤、开窗、聚合统计 → 这就是消费数据。Kafka消费：永久运行、持续监听，新数据一来，立刻自动读取处理，永不停止。Kafka：数据是动态流式的，源源不断新增，属于无界数据。MySQL查询：一次性执行，查完结束，静态读离线数据。

2026-05-21 15:24:42 217

原创【Kafka笔记】（四）Kafka 三种消费模式

开启 Checkpoint 后，Flink 自动管理 Offset，宕机重启不丢数据、不重复数据。实现依赖：Flink Checkpoint + Kafka 手动 Offset 提交。Flink 通过 group.id 绑定消费者组，记录消费位置。Kafka 分区数决定 Flink 最大并行消费能力。实时任务 99% 数据源都是 Kafka。不丢不重，精准消费，企业生产唯一标准。数据一定能消费成功，可能重复消费。不会重复消费，可能丢失数据。

2026-05-21 15:14:45 210

原创【Kafka笔记】（三）常用命令整理

replication-factor：副本数。partitions：分区数。

2026-05-21 15:12:11 144

原创【Kafka笔记】（二）核心架构与专属名词解释

生产标准：关闭 Kafka 自动提交，依赖 Flink 精准 Offset 管理。例如：vehicle_data（车联网数据）、order_log（订单数据）生产铁律：Flink 并行度 ≤ Kafka 分区数，否则消费能力无法拉满。手动提交：消费成功再提交，Flink Checkpoint 就是手动精准提交。核心：Flink 消费数据，本质就是消费某个 Topic 的数据。示例：Flink 任务、数据同步服务、消息推送服务。自动提交：简单但容易丢数据、重复数据（生产禁用）

2026-05-21 15:07:40 438

原创【Kafka笔记】（一）认识 Kafka

Kafka 是一款分布式、高吞吐、低延迟、持久化的消息队列/流处理平台。通俗的讲Kafka 就是一个“实时数据中转站+数据蓄水池”上游业务/设备产生数据 → 发给 Kafka 存起来下游 Flink、服务、数仓 → 从 Kafka 实时拉取数据计算。

2026-05-21 14:59:33 138

原创【FlinkSQL笔记】（三）Flink SQL 核心重难点（窗口函数、水印）

实时场景（车联网、物联网）中，网络波动、设备重连会导致：先产生的数据，后到达Flink，直接导致窗口统计结果错误。

2026-05-21 14:22:43 533

原创【FlinkSQL笔记】（二）Flink SQL 基础语法详解

TIMESTAMP(3)：高精度时间戳（实时任务必备，保留3位毫秒）group.id：消费者组，自定义不重复即可，用于记录消费偏移量。bootstrap.servers：Kafka集群地址端口。STRING：字符串（对应MySQL varchar）connector：指定数据源类型，固定kafka。format：数据序列化格式，企业99%为json。latest：从当前最新数据开始消费（生产默认）earliest：从头消费所有历史数据（测试用）BIGINT：长整型（计数、时间戳常用）DOUBLE：浮点型。

2026-05-21 14:16:42 349

原创【FlinkSQL笔记】（一）什么是Flink SQL

Flink SQL 是 Flink 官方推出的流批一体 SQL 计算语法，无需编写大量代码，用标准SQL即可开发实时计算任务。核心优势：零代码压力：复用标准SQL语法，学习成本极低企业主流：云平台（华为云/阿里云）实时任务90%基于Flink SQL开发能力全覆盖：实时清洗、聚合、开窗、关联、数据同步均可实现天然实时：毫秒级延迟，支持乱序数据处理。

2026-05-21 14:11:01 336

原创【Flink学习】（十）Flink 综合实战项目

从入门到进阶学习路线：Flink 高级状态、Flink SQL 深入、集群部署、实时数仓开发。

2026-05-21 13:53:47 175

原创【Flink学习】（九）Flink 容错机制 Checkpoint 与 Savepoint

本文整理 Flink 生产级容错方案，学会保障线上实时任务稳定运行，避免数据异常问题。

2026-05-20 22:45:31 287

原创【Flink学习】（七）Flink 状态编程入门，有状态实时计算

标准状态开发模板，固定写法直接套用。

2026-05-20 22:39:34 131

原创【Flink学习】（七）Flink 四大窗口机制，实时时间段统计

默认触发规则，自定义窗口触发条件，灵活控制统计时机。

2026-05-20 22:37:53 242 1

原创【Flink学习】（六）Flink 三大时间语义 + 水位线 Watermark

本文我主要整理Flink 时间相关知识，实时计算最大难点：数据乱序，为窗口计算打下基础。

2026-05-20 22:31:29 339

原创【Flink学习】（五）Flink 并行度与任务链，任务运行核心原理

本文主要整理Flink 底层任务运行机制，学会合理设置并行度，初步具备任务调优思维。

2026-05-20 22:28:29 160

原创【Flink学习】（四）Flink 常用转换算子，数据流数据处理

Split 分流、SideOutput 侧输出流，将一条数据流拆分多分支，实现不同数据不同逻辑处理。sum 求和、max 最大值、min 最小值、reduce 自定义聚合算子，流式持续聚合计算。KeyBy 算子：数据流分组，等同于 SQL group by，实时分组核心。FlatMap 算子：一对多数据拆分，字符串拆分、数组拆分。Map 算子：一对一数据转换，字段修改、数据格式转换。Filter 算子：数据过滤，剔除脏数据、无效数据。Connect：合并不同类型数据流，相互关联处理。

2026-05-20 22:26:14 156

原创一文读懂Flink全家桶（Flink、Flink SQL、PyFlink、Java Flink ）

Flink、Flink SQL、PyFlink、Java Flink 到底啥关系？其实全是同一个 Apache Flink 框架，只是写法不一样、语言不一样、用法不一样。

2026-05-20 00:43:29 663

原创【Flink学习】（三）Flink 数据源详解，主流 Source 数据读取

Flink 对接 Kafka 消费实时数据，配置消费者组、主题、序列化方式，实现实时读取消息队列数据。内置数据源、文件数据源、网络数据源、Kafka 主流数据源、自定义数据源。3、区分有界流（文件）、无界流（实时数据流）本地测试：集合、元素、Socket 数据源。线上实时业务：统一使用 Kafka 数据源。离线分析：本地文件、HDFS 文件。2、读取 HDFS 分布式文件。1、读取本地单行文本文件。

2026-05-20 00:37:32 228

原创【Flink学习】（二）Flink 本地环境搭建，运行第一个入门程序

/ 1. 获取流执行环境// 设置全局并行度// 2. 读取本地文本文件作为数据源// 3. 数据拆分处理});// 分组求和统计次数.sum(1).print();// 5. 执行任务env.execute("第一个Flink入门程序");

2026-05-20 00:19:37 182

原创【Flink学习】（一）初识 Flink，大数据实时计算核心认知

Apache Flink 是一款分布式、高性能、高吞吐、低延迟的开源流式计算引擎，支持流处理、批处理，目前大数据实时领域主流框架。

2026-05-20 00:16:10 244

原创一文读懂华为云DataArts：企业数据管理一站式平台

在数据驱动的时代，华为云DataArts以一站式全生命周期管理、云原生弹性架构、低代码AI赋能、全链路安全可信、生态深度融合五大核心优势，解决企业数据管理全流程痛点，助力企业从“数据杂乱”到“数据治理”再到“数据价值释放”的跨越。无论你是互联网、金融、制造、政务还是零售行业，无论企业规模大小，DataArts都能适配需求，成为企业数字化转型的核心“数据引擎”，让数据真正成为驱动业务增长的核心生产力。

2026-05-14 09:36:43 550

原创企微机器人消息推送（Python实现案例）

企微机器人推送，本质就是用一个带唯一密钥的 Webhook 地址，通过 HTTP POST 把 JSON 消息发给企微服务器，由它转发到指定群。具体可参考官网：https://developer.work.weixin.qq.com/document/path/99110。你的系统 / 脚本向这个 URL 发HTTP POST+JSON 消息体。全程是单向推送：你的系统→企微服务器→群成员，无需扫码、无需授权。企微服务端校验 key 合法后，把消息转发到对应群聊。下面把原理、流程、关键细节讲清楚。

2026-05-14 08:36:09 539

原创 Python依赖包实现window下载上传到Linux

本文介绍了在Windows环境下为Linux服务器离线安装Python依赖包的方法。

2026-04-15 11:38:36 214

原创 Obsidian使用指南

Obsidian（黑曜石）是一款主打本地私有、双向链接与知识网络的 Markdown 笔记与知识管理软件，常被用来构建个人 “第二大脑”。官方网站：https://obsidian.md/下载链接：https://obsidian.md/download。

2026-04-01 17:01:32 1418

原创查看impala版本

在Apache Impala中，查看版本信息通常可以通过几种方法来实现。Apache Impala是一个开源的大数据查询引擎，它允许用户以SQL的方式查询存储在Hadoop上的数据。打开终端或命令提示符。

2026-03-31 16:22:54 83

原创 2026 最强开源 AI 智能体：OpenClaw，为什么全网都叫它 AI 龙虾？

OpenClaw 国内优化版：https://github.com/jiulingyun/openclaw-cn。GitHub 源码：https://github.com/openclaw/openclaw。官方文档（含中文）：https://docs.openclaw.ai/zh-CN。技能市场（3000 + 插件）：https://clawhub.ai/2、自动写代码、跑脚本、处理 Excel、发邮件、爬网页。官网：https://openclaw.ai/

2026-03-10 13:37:23 1655 2

原创 HBase集群连接方式

如果您已经创建了HBase集群，可以使用HBase Shell、Thrift server、Java api方式连接集群，进行数据业务操作。

2026-01-27 08:46:27 221

原创压缩文件zip和rar格式有什么区别

采用 RAR 专有压缩算法（结合了 LZSS、LZ77 等改进算法），压缩率显著高于 ZIP，尤其是在压缩多个文件或大型文件包时，能节省更多存储空间。RAR 是 WinRAR 公司的专有格式，受专利保护，解压 RAR 文件虽然多数软件支持，但创建 RAR 文件通常需要付费购买 WinRAR 授权（个人用户可免费试用，但商业用途需付费）。ZIP是开放标准，无专利和版权限制，几乎所有操作系统（Windows、macOS、Linux、Android、iOS）都原生支持，无需额外安装软件就能解压。

2025-12-29 15:51:55 2572

机器学习02--K近邻算法

k近邻法(k-nearest neighbor, k-NN)是1967年年由Cover T和Hart P提出的一种基本分类与回归方法。它的工作原理理是：存在一个样本数据集合，也称作为训练样本集，并且样本集中每个数据都存在标签，即我们知道样本集中每一个数据与所属分类的对应关系。输入没有标签的新数据后，将新的数据的每个特征与样本集中数据对应的特征进⾏行行⽐比较，然后算法提取样本最相似数据(最近邻)的分类标签。一般来说，我们只选择样本数据集中前k个最相似的数据，这就是k-近邻算法中k的出处，通常k是不大于20的整数。最后，选择k个最相似数据中出现次数最多的分类，作为新数据的分类。

2018-11-08

机器学习03--sklearn手写数字识别

Scikit learn 也简称sklearn，是机器器学习领域的python模块，sklearn包含了了很多机器器学习的方式

2018-11-08

机器学习09--决策树02

ID3算法的核心是在决策树各个结点上对应信息增益准则选择特征，递归地构建决策树。从根结点(root node)开始，对结点计算所有可能的特征的信息增益，选择信息增益最大的特征作为结点的特征，由该特征的不不同取值建立子节点；再对子结点递归地调用以上方法，构建决策树；直到所有特征的信息增益均很小或没有特征可以选择为⽌止，最后得到一个决策树。

2018-11-08

机器学习05--朴素贝叶斯

朴素贝叶斯算法是有监督的学习算法，解决的是分类问题，如客户是否流失、是否值得投资、信用等级评定等多分类问题。

2018-11-08

机器学习06--线性回归

回归的目的是预测数值型的⽬目标值。最直接的办法是依据输入写出一个目标值的计算公式

2018-11-08

数据分析1--认识大数据工具

数据分析是人工智能的必备知识，算法、数据结构都要很高的要求，这些文档由浅入深给大家提供数据分析的知识，总共10个文档，后续会陆续更新

2018-09-25

Diango从基础到高级

Django框架的基础回顾以及高级应用，共三个文档，上传了一个重要的，这里不能设置免费分数，另外两个下载的朋友免费邮箱发送不单独上传了

2018-09-19

数据分析2--NumPy

由浅入深交给你如何用python实现大数据开发和人工智能

2018-09-25

大数据分析---Pandas使用

pandas和Numpy还是有区别，这里主要包括两个主要数据结构：Series和DataFrame

2018-10-09

大数据分析--数据加载、存储

pandas提供了一些用于将表格型数据读取为DataFrame对象的函数，其中read_csv和read_table用得最多

2018-10-09

笨办法学python

《笨办法学 Python》(Learn Python The Hard Way，简称 LPTHW)是 Zed Shaw 编写的一本Python 入门书籍。适合对计算机了解不多，没有学过编程，但对编程感兴趣的朋友学习使用。这本书以习题的方式引导读者一步一步学习编程，从简单的打印一直讲到完整项目的实现。也许读完这本书并不意味着你已经学会了编程，但至少你会对编程语言以及编程这个行业有一个初步的了解。

2018-10-18

数据分析--matplotlib绘图和可视化

信息可视化（也叫绘图）是数据分析中最重要的工作之一。它可能是探索过程的一部分，例如，帮助我们找出异常值、必要的数据转换、得出有关模型的idea等。另外，做一个可交互的数据可视化也许是工作的最终目标。matplotlib是一个用于创建出版质量量图表的桌⾯面绘图包（主要是2D方面）。

2018-11-08

大数据分析--数据清洗和准备

在数据分析和建模的过程中，相当多的时间要用在数据准备上：加载、清理理、转换以及重塑。这些工作会占到分析师时间的80%或更更多。

2018-10-09

大数据分析---数据规整：聚合和重塑

在许多应⽤用中，数据可能分散在许多文件或数据库中，存储的形式也不不利利于分析，应采用聚合、合并、重塑数据的⽅方法进⾏行行处理理。

2018-10-09

MySQL性能优化之参数配置

mysql性能优化的配置过程，back_log值指出在MySQL暂时停⽌止回答新请求之前的短时间内多少个请求可以被存在堆栈中。也就是说，如果MySql的连接数据达到max_connections时，新来的请求将会被存在堆栈中，以等待某一连接释放资源，该堆栈的数量量即back_log，如果等待连接的数量量超过back_log，将不不被授予连接资源。

2018-11-08

python面试笔试题（现场应聘收集）

题目都是照片格式的，都是面试python的同事和朋友提供，我统一整理的，题目类型涉及多方面，因为是面试所以拍摄角度有的会有点偏差，有需要的可以下载希望对大家有用！

2018-10-18

机器学习面试题目1

python高级的知识点，包括当下的机器学习见面试题，这里做了3份，分别上传给大家，基本涉及到了相关要点，希望对大家有用

2018-10-18

机器学习01--机器学习入门知识（数据科学 5 机器学习介绍）

何谓机器器学习就是把无序的数据转换成有⽤用的信息，海海量量数据抽取有价值的信息。创建并使用那些由学习数据⽽而得出的模型，预测建模或数据挖掘。用已存在的数据来开发可⽤用来对新数据预测多种可能结果的模型。第一个文档让大家对机器学习有个初步认识

2018-11-08

115个Java面试题和答案——终极（上）.pdf

资料包含115道java常考面试题，共分为两个文档分为上下两册，内容来自北京著名iT培训机构，实战性强，欢迎下载！

2019-06-29

机器学习03--决策树01

决策树(decision tree)是⼀一种基本的分类与回归方法。流程图就是⼀一个决策树，长方形代表判断模块(decision block)，椭圆形成代表终⽌止模块 (terminating block)，表示已经得出结论，可以终止运行行。从判断模块引出的左右箭头称作为分支(branch)，它可以达到另一个判断模块或者终⽌止模块。

2018-11-08

高效能人士的七个习惯（笔记整理）

整理高效能人士的七个习惯笔记，希望大家在写代码的时候保持高效、积极、乐观，成就更好的自己

2025-07-08

集群搭建手册_CDH5.13.1版.docx

整理企业级Hadoop_CDH集群的搭建步骤和常见问题解决方案，包括环境配置，安装步骤和使用方法，最后将搭建过程中的常见错误做了总结和解释

2020-03-11

Airflow安装配置和web端插件安装

网络中关于airflow的资料比较少，这里做了一下整理： 1.整理centos7中airflow的安装配置 2.原生airflow默认不支持web端的拖拽实现dag,需要写python脚本，这里我做了一个插件安装说明，可以从网页端实现dag的编写

2020-07-01

数仓规范文档.rar

本文档整理数据仓库搭建过程中的分层结构和数据库、表名、字段命名规范，对数仓开发、大数据开发有重要帮助，欢迎下载。有问题随时博客留言或者私信我。

2020-05-30

HiveSQL开发指南2021.rar

介绍HiveSQL的相关知识和常用开发代码，实用、便捷。密码qingpingyue01,欢迎下载

2021-12-06

navicat 连接oracle 11g驱动包

我的Navicat 版本是Navicat Premium 12 ，最近在windows环境中远程连接新项目的Oracle（11g版本）连接报错。我在之前项目中连接Oracle12是不报错的，也不需要做任何配置，直接选择basic或者TNS连接方式都可以顺利连接，刚开始也很恼火，查了资料后，加载这个驱动就行，最终解决,这里面还有连接hive和mysql的，大家也可以存一下

2020-05-28

陀螺仪调度部署和使用（美云智数）.rar

整理美云智数调度工具部署和使用。美云智数，源自于财富世界500强企业美的集团信息科技，基于先进企业的业务实践，把管理实践软件产品化，为大中型企业提供智能制造、大数据、数字营销、移动办公、身份管理、财务与人力、IT咨询等领域的云产品与解决方案。

2020-05-14

Day2-pandas-Ⅰ.xmind

整理python数据分析库的重要知识，包括ipython、numpy、pandas（重要，包括3个文档）、scipy包、matplotlib图形绘制,共计7个文档，里面涵盖基础操作，案例解析和注意事项，因不能同时上传多个文件，所以逐一上传，如果下载文档的博友有问题可以随时咨询我，保证物有所值

2020-01-13

Day3-pandas-Ⅱ.xmind

2020-01-13

Day4-pandas-Ⅲ.xmind

2020-01-13

Day7-pandas-Ⅳ：数据加载与透视表.xmind

2020-01-13

Day1-IPython与Numpy.xmind

整理python数据分析库的重要知识，包括ipython、numpy、pandas（重要，包括3个文档）、scipy包、matplotlib图形绘制,共计7个文档，里面涵盖基础操作，案例解析和注意事项，如果下载文档的博友有问题可以随时咨询我，保证物有所值

2020-01-13

Day5-Scipy.xmind

2020-01-13

azkaban安装包（web+excutor）

zkaban是一个Hadoop workflow定时调度工具，它解决了多个Hadoop任务单元之间的前后依赖关系。它提供了十分友好的用户界面，使用简单，容易上手。这里为大家提供azkaban2.5调度工具的全套安装包，具体安装步骤可以参考我的博客

2020-03-27

Day10-决策树与贝叶斯.xmind

整理python机器学习常用算法，里面涵盖基础操作，案例解析和注意事项，包括knn算法、逻辑斯蒂回归、线性归回、岭回归、SVM支持向量机、决策树、贝叶斯等，因不能同时上传多个文件，所以逐一上传，如果下载文档的博友有问题可以随时咨询我，保证物有所值

2020-01-13

Day9-LinearRegression线性回归与逻辑斯蒂回归.xmind

整理python机器学习常用算法，里面涵盖基础操作，案例解析和注意事项，包括knn算法、逻辑斯蒂回归、线性归回、岭回归、SVM支持向量机等，因不能同时上传多个文件，所以逐一上传，如果下载文档的博友有问题可以随时咨询我，保证物有所值

2020-01-13

TensorFlow.xmind

整理python机器学习常用算法，里面涵盖基础操作，案例解析和注意事项，包括knn算法、逻辑斯蒂回归、线性归回、岭回归、SVM支持向量机，TensorFlow等，因不能同时上传多个文件，所以逐一上传，如果下载文档的博友有问题可以随时咨询我，保证物有所值

2020-01-13

Day8-KNN.xmind

2020-01-13

Day6-matplotlib.xmind

2020-01-13

115个Java面试题和答案——终极（下）_ (1).pdf

资料包含115道java常考面试题，共分为两个文档分为上下两册，内容来自北京著名iT培训机构，实战性强，欢迎下载！

2019-06-29

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人