忆影·耀
码龄10年
关注
提问 私信
  • 博客:8,549
    问答:611
    9,160
    总访问量
  • 5
    原创
  • 1,736,609
    排名
  • 3
    粉丝
  • 0
    铁粉
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:广东省
  • 加入CSDN时间: 2014-10-27
博客简介:

追忆不如抓住当下

查看详细资料
个人成就
  • 获得3次点赞
  • 内容获得0次评论
  • 获得19次收藏
创作历程
  • 1篇
    2023年
  • 5篇
    2020年
成就勋章
TA的专栏
  • 数据结构和算法基础
  • 小命令
    2篇
  • 读书笔记
    1篇
  • 转载
    1篇
  • 从零开始的python世界
    1篇
  • 数据挖掘-工具篇
兴趣领域 设置
  • 数据结构与算法
    排序算法推荐算法
  • 人工智能
    tensorflownlpscikit-learn聚类集成学习迁移学习分类回归
创作活动更多

超级创作者激励计划

万元现金补贴,高额收益分成,专属VIP内容创作者流量扶持,等你加入!

去参加
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

【Hive命令】去除字符串两端的逗号等

字符串中间或者两端有重复分隔符的处理方式
原创
发布博客 2023.02.06 ·
1223 阅读 ·
1 点赞 ·
0 评论 ·
4 收藏

【转载】SPARK-SQL的几种JOIN实现

文章来源:面试必知的 Spark SQL 几种 Join 实现依亲身经历而言,面试官的确有可能会问你JOIN有哪些分类,这时候一定不要慌,让我们一起来看看该怎么回答。JOIN的基本要素join条件(ON)、过滤条件(where)、JOIN方式(join/left join/full join等)是构成JOIN的三大基本要素JOIN的基本实现流程Spark将参与Join的两张表抽象为流式遍历表(streamIter)和查找表(buildIter),通常streamIter为大表,buildIter
转载
发布博客 2020.08.03 ·
541 阅读 ·
0 点赞 ·
0 评论 ·
2 收藏

【Python】时间模块

在python中,定义和操控时间常用到的是time和datetime这两个模块timedatetimefrom datetime import datetime,date,timedeltafrom dateutil.relativedelta import relativedelta获取当前时间# 获取当前时间datetime.now()# datetime.datetime(2020, 7, 14, 10, 58, 40, 492463)# 转换成指定形式datetime.
原创
发布博客 2020.07.17 ·
163 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

【读书笔记】《特征工程入门与实践》

文章目录数据等级数据等级本书认为数据可以分为四大等级,分为是:定类、定序、定距、定比,其中定类和定序都是定性的数据,定距和定比是定量的数据。定类是离散的、无序的,举例:人名、油漆名称、动物物种:猴子、马、牛等定序是有序类别、可以比较的,举例:考试等级:Great、Good、Not bad、Bad等或 0 - 6 表示心情的好坏程度定距是有数据意义的、但是做除法是没有意义的,比如温度定比是连续的、存在有意义的绝对零点、可以做除法---- 未完待续...
原创
发布博客 2020.06.17 ·
550 阅读 ·
1 点赞 ·
0 评论 ·
2 收藏

【hdfs命令】 查看表的存储大小

查看表的大小通常的方法是hdfs dfs -du -h, 但统计的是子目录的大小,如:hdfs dfs -du -h /user/hive/warehouse/tmp.db/xxx555.7 G 1.6 T /user/hive/warehouse/tmp.db/xxx/data_date=20200610556.2 G 1.6 T /user/hive/warehouse/tmp.db/xxxt/data_date=20200611其实我们需要统计当前目录的大小时可加入 -s
原创
发布博客 2020.06.15 ·
5807 阅读 ·
1 点赞 ·
0 评论 ·
6 收藏

【PYTHON基础数据类型】set、list、tuple、dict的区别

数据结构中文是否有序是否可重复是否可操作例子查询方式其他常见用法注意事项list列表有序可重复可修改、可更新、可删除 、可嵌套s1 = [‘a’,1,1,{‘a’:2}]下标索引查询 如: s1[0:2]s1.append(‘b’)、del s1[2]set集合无序不重复可修改、可更新、可删除 、不可嵌套s1 = set()下标索引查询 如: s1[0:2]s1.append(‘b’)、del s1[2]可哈希的元素有:int、f...
原创
发布博客 2020.06.10 ·
265 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

mastering the game of go with deep neural networks and tree search.pdf

发布资源 2019.02.15 ·
pdf

协作型过滤算法及其在推荐系统的应用

发布资源 2015.08.25 ·
ppt

上下文感知推荐系统若干关键技术研究

发布资源 2015.08.25 ·
caj

阿里云首届分享日×云栖大会六大嘉宾PPT+数据保护倡议书和生态路线图

发布资源 2015.08.05 ·
rar

基于位置社交网络的数据挖掘

发布资源 2015.07.01 ·
pdf

C语言头文件里放声明,其实现放哪?

答:

C程序采用模块化的编程思想,需合理地将一个很大的软件划分为一系列功能独立的部分合作完成系统的需求,在模块的划分上主要依据功能。模块由头文件和实现文件组成,对头文件和实现文件的正确使用方法是:

  • 规则1 头文件(.h)中是对于该模块接口的声明,接口包括该模块提供给其它模块调用的外部函数及外部全局变量,对这些变量和函数都需在.h中文件中冠以extern关键字声明;

  • 规则2 模块内的函数和全局变量需在.c文件开头冠以static关键字声明;

  • 规则3 永远不要在.h文件中定义变量;
    定义变量和声明变量的区别在于定义会产生内存分配的操作,是汇编阶段的概念;而声明则只是告诉包含该声明的模块在连接阶段从其它模块寻找外部函数和变量

回答问题 2015.04.14

大数据技术丛书《数据挖掘:实用案例分析》迷你书.pdf

发布资源 2015.02.07 ·
pdf

CNINC发布第35次互联网络发展状况统计报告

发布资源 2015.02.05 ·
pdf