Appreciate(欣赏)
码龄4年
关注
提问 私信
  • 博客:113,457
    问答:339
    113,796
    总访问量
  • 102
    原创
  • 65,877
    排名
  • 501
    粉丝
  • 0
    铁粉

个人简介:有志者、事竟成,破釜沉舟,百二秦关终属楚;苦心人、天不负,卧薪尝胆,三千越甲可吞吴

IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:四川省
  • 加入CSDN时间: 2020-11-17
博客简介:

Appreciate(欣赏)

查看详细资料
  • 原力等级
    当前等级
    5
    当前总分
    1,153
    当月
    5
个人成就
  • 获得732次点赞
  • 内容获得12次评论
  • 获得817次收藏
  • 代码片获得1,770次分享
创作历程
  • 32篇
    2024年
  • 43篇
    2023年
  • 16篇
    2022年
  • 11篇
    2021年
成就勋章
TA的专栏
  • python
    14篇
  • Flink
    13篇
  • mysql
    1篇
  • java
    14篇
  • dinky
    1篇
  • redis
    1篇
  • Linux
    3篇
  • hive
    15篇
  • Hadoop
    2篇
  • CDH
    1篇
  • datax
    1篇
  • kafka
    2篇
  • Maxwell
    2篇
  • Logstash
    1篇
  • flume
    1篇
  • zookeeper
    1篇
  • docker
    1篇
  • NGINX
    1篇
  • kibana
    1篇
  • spark
    1篇
  • scala
    1篇
  • FlinkTransformations
    1篇
  • flinkSource
    1篇
  • DataHub
    1篇
  • Superset
    1篇
兴趣领域 设置
  • 大数据
    hadoophivespark
创作活动更多

超级创作者激励计划

万元现金补贴,高额收益分成,专属VIP内容创作者流量扶持,等你加入!

去参加
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

sklearn转换器和估计器

2、estimator.fit(x_train, y_train)计算。在sklearn中,估计器是一个重要的角色,是一类实现了算法的API。调用fit_transform()1、实例化一个estimator。-----调用完毕,模型生成。3、用于无监督学习的估计器。2、用于回归的估计器。
原创
发布博客 2024.08.20 ·
414 阅读 ·
3 点赞 ·
0 评论 ·
3 收藏

scikit-learn特征降维

数据中包含冗余或相关变量(或称特征、属性、指标等),旨在从原有特征中找出主要特征定义:高维数据转换为低维数据的过程,在此过程中可能会舍弃原有数据、创造新的变量作用:是数据维数的压缩,尽可能降低原数据的维数(复杂度),损失少量信息应用:回归分析或者聚类分析中。
原创
发布博客 2024.08.20 ·
1028 阅读 ·
26 点赞 ·
0 评论 ·
18 收藏

scikit-learn特征预处理

通过对原始的数据进行变换把数据映射到(默认为[0,1]之间)注意最大值最小值是变化的,另外,最大值与最小值非常容易受到异常值影响,所以这种方法稳定性较差,只适合传统精确小数据场景通过对原始数据进行变换把数据变换到均值为0,标准差为1的范围内在已有样本足够多的情况下比较稳定,适合现代嘈杂大数据场景。
原创
发布博客 2024.08.19 ·
665 阅读 ·
8 点赞 ·
0 评论 ·
4 收藏

scikit-learn特征抽取

特征工程是使用专业背景知识和技巧处理数据,使得特征能在机器学习算法上发挥更好的作用的过程意义:会直接影响机器学习的效果将任意数据(如文本或图像)转换为可用于机器学习的数字特征注:特征值是为了计算机更好的去理解数据字典特征提取(特征离散化)文本特征提取图像特征提取(深度学习再介绍)
原创
发布博客 2024.08.19 ·
826 阅读 ·
24 点赞 ·
0 评论 ·
21 收藏

pip 安装 scikit-learn

【代码】pip 安装 scikit-learn。
原创
发布博客 2024.08.07 ·
1057 阅读 ·
4 点赞 ·
0 评论 ·
4 收藏

python爬虫Selenium模块及测试案例详解

【代码】python爬虫Selenium模块及测试案例详解。
原创
发布博客 2024.07.17 ·
1607 阅读 ·
6 点赞 ·
0 评论 ·
8 收藏

python爬虫网页解析模块及测试案例详解

【代码】python爬虫网页解析模块及测试案例详解。
原创
发布博客 2024.07.13 ·
670 阅读 ·
4 点赞 ·
0 评论 ·
10 收藏

python网络爬虫之Urllib

urllib的request模块提供了最基本的构造HTTP请求的方法,使用它可以方便地实现请求的发送并得到响应,同时它还带有处理授权验证(authentication)、重定向(redirection)、浏览器Cookies以及其他内容。
原创
发布博客 2024.07.10 ·
819 阅读 ·
1 点赞 ·
0 评论 ·
8 收藏

python异常和文件

执行会新创建一个文件,如果文件存在会报错。
原创
发布博客 2024.07.09 ·
275 阅读 ·
1 点赞 ·
0 评论 ·
4 收藏

python对象

在类的代码块中,我们可以定义变量和函数# 在类中我们所定义的变量,将会成为所有的实例的公共属性# 所有实例都可以访问这些变量name = 'swk' # 公共属性,所有实例都可以访问# 在类中也可以定义函数,类中的定义的函数,我们称为方法# 这些方法可以通过该类的所有实例来访问# 方法每次被调用时,解析器都会自动传递第一个实参# 第一个参数,就是调用方法的对象本身,# 如果是p1调的,则第一个参数就是p1对象# 如果是p2调的,则第一个参数就是p2对象。
原创
发布博客 2024.07.08 ·
930 阅读 ·
21 点赞 ·
0 评论 ·
12 收藏

python函数

def fn() :print('这是我的第一个函数!')print('今天天气真不错!')
原创
发布博客 2024.07.03 ·
867 阅读 ·
25 点赞 ·
0 评论 ·
20 收藏

python序列

字典的每个键值 key=>value 对用冒号 : 分割,每个对之间用逗号(,)分割,整个字典包括在花括号 {} 中。可以使用大括号 { } 创建集合,元素之间用逗号 , 分隔, 或者也可以使用 set() 函数创建集合。与字符串的索引一样,列表索引从 0 开始,第二个索引是 1,依此类推。集合中的元素不会重复,并且可以进行交集、并集、差集等常见的集合操作。Python 的元组与列表类似,不同之处在于元组的元素不能修改。元组创建很简单,只需要在括号中添加元素,并使用逗号隔开即可。
原创
发布博客 2024.06.30 ·
601 阅读 ·
8 点赞 ·
0 评论 ·
7 收藏

python流程控制语句

Python for 循环可以遍历任何可迭代对象,如一个列表或者一个字符串。
原创
发布博客 2024.06.30 ·
281 阅读 ·
8 点赞 ·
0 评论 ·
5 收藏

python入门

如果判断结果为False,则执行语句2,并返回执行结果。如果判断结果为True,则执行语句1,并返回执行结果。语法: 语句1 if 条件表达式 else 语句2。条件运算符在执行时,会先对条件表达式进行求值判断。
原创
发布博客 2024.06.26 ·
714 阅读 ·
24 点赞 ·
0 评论 ·
18 收藏

FlinkCEP复杂事件处理(Complex Event Processing)

所谓 CEP,其实就是“复杂事件处理(Complex Event Processing)”的缩写;而 Flink CEP,就是 Flink 实现的一个用于复杂事件处理的库(library)。那到底什么是“复杂事件处理”呢?就是可以在事件流里,检测到特定的事件组合并进行处理,比如说“连续登录失败”,或者“订单支付超时”等等。具体的处理过程是,把事件流中的一个个简单事件,通过一定的规则匹配组合起来,这就是“复杂事件”;然后基于这些满足规则的一组组复杂事件进行转换处理,得到想要的结果进行。
原创
发布博客 2024.06.02 ·
939 阅读 ·
22 点赞 ·
0 评论 ·
31 收藏

数据库架构设计的三种模式:share nothing , share everythong , share disk

数据库架构设计的三种模式:share nothing , share everythong , share disk
原创
发布博客 2024.05.28 ·
801 阅读 ·
7 点赞 ·
0 评论 ·
4 收藏

Flink的SQL开发

Table API和SQL是最上层的API,在Flink中这两种API被集成在一起,SQL执行的对象也是Flink中的表(Table),所以我们一般会认为它们是一体的。Flink是批流统一的处理框架,无论是批处理(DataSet API)还是流处理(DataStream API),在上层应用中都可以直接使用Table API或者SQL来实现;这两种API对于一张表执行相同的查询操作,得到的结果是完全一样的
原创
发布博客 2024.01.29 ·
1832 阅读 ·
17 点赞 ·
0 评论 ·
30 收藏

FlinkAPI开发之FlinkSQL

这里的依赖是一个Java的“桥接器”(bridge),主要就是负责Table API和下层DataStream API的连接支持,按照不同的语言分为Java版和Scala版。
原创
发布博客 2024.01.24 ·
2176 阅读 ·
22 点赞 ·
0 评论 ·
22 收藏

Dinky安装和部署

Dinky 是一个开箱即用、易扩展,以 Apache Flink 为基础,连接 OLAP 和数据湖等众多框架的一站式实时计算平台,致力于流批一体和湖仓一体的探索与实践。
原创
发布博客 2024.01.21 ·
3623 阅读 ·
18 点赞 ·
0 评论 ·
23 收藏

FlinkAPI开发之容错机制

既然是端到端的exactly-once,我们依然可以从三个组件的角度来进行分析:(1)Flink内部Flink内部可以通过检查点机制保证状态和处理结果的exactly-once语义。(2)输入端输入数据源端的Kafka可以对数据进行持久化保存,并可以重置偏移量(offset)。所以我们可以在Source任务(FlinkKafkaConsumer)中将当前读取的偏移量保存为算子状态,写入到检查点中;
原创
发布博客 2024.01.18 ·
1383 阅读 ·
15 点赞 ·
0 评论 ·
17 收藏
加载更多