枫叶的落寞
码龄11年
关注
提问 私信
  • 博客:76,227
    问答:4,783
    动态:1
    81,011
    总访问量
  • 41
    原创
  • 2,216,107
    排名
  • 29
    粉丝
  • 0
    铁粉

个人简介:hadoop、spark数据挖掘与机器学习算法工程师

IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:陕西省
  • 加入CSDN时间: 2013-12-19
博客简介:

枫叶的落寞的博客

查看详细资料
个人成就
  • 获得42次点赞
  • 内容获得34次评论
  • 获得128次收藏
  • 代码片获得239次分享
创作历程
  • 2篇
    2021年
  • 23篇
    2020年
  • 7篇
    2019年
  • 7篇
    2018年
  • 2篇
    2017年
成就勋章
TA的专栏
  • 大数据架构与算法
    付费
    2篇
  • 大数据架构
  • Flink
    16篇
  • pymysql
    1篇
  • mysql
    2篇
  • 大数据产品
    1篇
  • clickhouse
  • redis
    1篇
  • mongodb
    1篇
  • hive数据仓库的开发
  • hbase
    7篇
  • phoenix
    3篇
  • google
  • spark
    10篇
  • NLP
    1篇
  • BERT
    1篇
  • python
    2篇
  • hive
    1篇
  • 运维
    1篇
兴趣领域 设置
  • 大数据
    hadoop
创作活动更多

超级创作者激励计划

万元现金补贴,高额收益分成,专属VIP内容创作者流量扶持,等你加入!

去参加
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

pymysql windows路径入库指南

问题在使用pymysql连接mysql以后,在insert带有反斜杠的字符串时候,入库后会发现反斜杠丢失;解决方案from pymysql import escape_string然后在构造data的时候用escape_string(col)将含有反斜杠的字段进行转义再录入...
原创
发布博客 2021.07.15 ·
196 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

pyautogui 定位图片采用中文命名报错!!求助!!

答:

为啥非要用中文命名呢?

用file_path = unicode('八.bmp' , "utf8"),转换成unicode就可以了

下次记得注明python version

回答问题 2021.04.14

python连接sql数据库pandas读取报错

答:

这个看错误是数据条数太多,尝试在sql里面limit一下

回答问题 2021.04.14

Flink基础系列-DataSet广播变量

flink DataSet广播变量
原创
发布博客 2021.03.31 ·
390 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

安装kivy库第一次使用出现问题

答:

试试执行下面的代码

pip install --upgrade pip wheel setuptools
pip install docutils pygments pypiwin32 kivy.deps.sdl2 kivy.deps.glew
pip install kivy.deps.gstreamer
pip install kivy.deps.angle

ps:友情提示:下次提问的时候记得把使用的环境和复现需要的条件都写清楚,方便大家帮你

回答问题 2021.03.22

快速且批量删除MySQL表

快速删除多个mysql表
原创
发布博客 2020.11.12 ·
384 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

大数据产品系列-客户分群技术解析

客户分群技术
原创
发布博客 2020.07.19 ·
576 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

pyspark dataframe 读写MySQL

pyspark dataframe 读写MySQL
原创
发布博客 2020.06.08 ·
807 阅读 ·
0 点赞 ·
0 评论 ·
2 收藏

大数据架构设计-lambda、kappa、以及delta lake详解

大数据架构设计-lambda、kappa、以及delta lake详解
原创
发布博客 2020.06.07 ·
1486 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

成为一个大数据大牛需要掌握的知识树

成为一个大数据大牛都需要掌握哪些知识
原创
发布博客 2020.06.07 ·
574 阅读 ·
0 点赞 ·
0 评论 ·
5 收藏

PySpark访问MySQL失败:java.lang.ClassNotFoundException: com.mysql.jdbc.Driver

PySpark访问MySQL失败:java.lang.ClassNotFoundException: com.mysql.jdbc.Driver
原创
发布博客 2020.06.06 ·
4414 阅读 ·
5 点赞 ·
8 评论 ·
8 收藏

30天搞定spark源码系列-rdd dataset dataframe的区别

深入理解spark rdd dataframe dataset的区别和共同点
原创
发布博客 2020.05.28 ·
392 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

30天搞定spark源码系列-Job,stage,task区别

深入理解spark高频面试题-Job,stage,task的区别
原创
发布博客 2020.05.27 ·
539 阅读 ·
1 点赞 ·
0 评论 ·
1 收藏

30天搞定spark源码系列-scheduler-运行模式篇

阅读这篇文章,你应该得到面试中有可能会问到的几个问题的答案:spark的运行模式有几种?这几种运行模式分别有什么差别思路其实简单使用过spark的童鞋们都应该知道spark的运行模式就是这几种,一些人也能大致说出不同运行模式的差别,这里我们从源码的角度分析一下运行模式的不同会引起什么样的任务调度local模式1、定义spark的local模式是在本地起多个Thread,每个thread相当于一个executor,来模拟spark的并行运行模式,在实际项目中常用的有两种写法:local
原创
发布博客 2020.05.18 ·
402 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

30天搞定spark源码系列-RDD番外篇-shuffledRDD

spark源码番外篇-带领你深刻理解spark shuffle的原理
原创
发布博客 2020.05.16 ·
1194 阅读 ·
3 点赞 ·
0 评论 ·
1 收藏

30天搞定spark源码系列-RDD篇

看源码为了更好的使用,不要陷入源码中!不要陷入源码中!不要陷入源码中!
原创
发布博客 2020.05.15 ·
337 阅读 ·
0 点赞 ·
0 评论 ·
2 收藏

Flink生态系列-PyFlink篇

敬请期待。。。
原创
发布博客 2020.05.15 ·
426 阅读 ·
0 点赞 ·
3 评论 ·
0 收藏

Flink生态系列-机器学习

敬请期待。。。
原创
发布博客 2020.05.07 ·
327 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Flink生态系列-图计算篇

敬请期待。。。
原创
发布博客 2020.05.07 ·
1266 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏
加载更多