Data+Science+Insight
码龄9年
  • 2,241,506
    被访问
  • 3,637
    原创
  • 46
    排名
  • 7,144
    粉丝
关注
提问 私信

个人简介:毕业于中国科学院大学智能计算专业。研究方向为,数据挖掘、机器学习、深度学习等。深度参与了多项数据挖掘、计算机视觉以及自然语言处理相关项目,例如,社会计算、异常分析、聚类分析、预测分析、序列标记、语言生成、OCR、图像分类+检测+分割等。现任某茅数据科学家,负责数据科学团队的管理及项目实施。曾就职于中国信科集团,负责大数据与机器学习组的管理及项目实施。曾参与国家级医疗大数据平台机器学习项目的开发和建设、构建了完整的数据链路、特征池、模型仓库、迁移中心、数据应用、数据服务Pipeline,并与AWS team基于AWS云服务合作开发大型工业互联网项目,积累了工业互联网模型构建、部署、监控实战经验。

  • 加入CSDN时间: 2012-12-19
博客简介:

data+scenario+science+insight

博客描述:
data+scenario+science+insight
查看详细资料
  • 9
    领奖
    总分 14,576 当月 1,476
个人成就
  • 获得22,768次点赞
  • 内容获得7,691次评论
  • 获得22,771次收藏
创作历程
  • 1237篇
    2022年
  • 2445篇
    2021年
成就勋章
  • 入选《本周创作者榜》第88名
TA的专栏
  • Python+实用编程+高效复用
    付费
    132篇
  • 数据科学方案及方法探讨
    付费
  • R语言从入门到机器学习
    付费
    1780篇
  • 机器学习面试+横扫千军
    付费
    432篇
  • 数据科学从0到1
    付费
    1345篇
兴趣领域 设置
  • 大数据
    oraclemysqlhbasehadoophivestormsparkbig data数据库hdfs大数据
  • 人工智能
    数据挖掘语音识别计算机视觉目标检测机器学习人工智能深度学习神经网络自然语言处理sklearn语言模型图像处理数据分析scikit-learn聚类集成学习迁移学习分类回归
  • 微软技术
    sql
  • 最近
  • 文章
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

R语言批量把dataframe多个分类变量因子化处理、批量把多个分类变量转换为因子变量

R语言批量把dataframe多个分类变量因子化处理、批量把多个分类变量转换为因子变量
原创
发布博客 前天 16:30 ·
51 阅读 ·
2 点赞 ·
1 评论

R语言使用cph函数和rcs函数构建限制性立方样条cox回归模型、使用ggcoxzph函数可视化进行Schoenfeld残差图检验模型是否满足等比例风险

R语言使用cph函数和rcs函数构建限制性立方样条cox回归模型、使用ggcoxzph函数可视化进行Schoenfeld残差图检验模型是否满足等比例风险
原创
发布博客 前天 16:29 ·
30 阅读 ·
0 点赞 ·
0 评论

R语言使用DALEX包的predict_parts函数对h2o包生成的多个算法模型的在指定单条测试样本(观察)数据下的核心预测变量(特征)进行分析、可视化对于指定样本影响力最强的前10个变量

R语言使用DALEX包的predict_parts函数对h2o包生成的多个算法模型的在指定单条测试样本(观察)数据下的核心预测变量(特征)进行分析、可视化对于指定样本影响力最强的前10个变量
原创
发布博客 前天 16:29 ·
9 阅读 ·
0 点赞 ·
0 评论

R语言ggplot2可视化分面图(faceting)、可视化分面山脊图(facetted ridgeline plot with facet_wrap)

R语言ggplot2可视化分面图(faceting)、可视化分面山脊图(facetted ridgeline plot with facet_wrap)
原创
发布博客 前天 16:29 ·
12 阅读 ·
0 点赞 ·
0 评论

R语言可视化分面图、多变量分组嵌套多水平t检验、并指定参考水平、可视化多变量分组嵌套多水平分面箱图(faceting bar plot)并添加显著性水平、指定显著性参考水平

R语言可视化分面图、多变量分组嵌套多水平t检验、并指定参考水平、可视化多变量分组嵌套多水平分面箱图(faceting bar plot)并添加显著性水平、指定显著性参考水平
原创
发布博客 前天 16:28 ·
2 阅读 ·
0 点赞 ·
0 评论

R语言ggplot2可视化X轴标签互相覆盖如法识别解决:x轴上每隔十年显示一个时间值、将时间信息从因子或者字符转化为数值则ggplot2会自动优化X轴标签的显示

R语言ggplot2可视化X轴标签互相覆盖如法识别解决:x轴上每隔十年显示一个时间值、将时间信息从因子或者字符转化为数值则ggplot2会自动优化X轴标签的显示
原创
发布博客 前天 16:26 ·
3 阅读 ·
0 点赞 ·
0 评论

Pandas中xs()函数:SyntaxError: can‘t assign to function call

Pandas中xs()函数:SyntaxError: can't assign to function call
原创
发布博客 前天 16:26 ·
38 阅读 ·
0 点赞 ·
0 评论

R语言ggplot2可视化:默认情况下ggplot2在x轴和y轴的刻度线和轴之间保留了一些空间、设置ggplot2可视化去除可视化结果与坐标轴之间的空间、可视化结果与坐标轴紧紧贴合,没有空白区域

R语言ggplot2可视化:默认情况下ggplot2在x轴和y轴的刻度线和轴之间保留了一些空间、设置ggplot2可视化去除可视化结果与坐标轴之间的空间、可视化结果与坐标轴紧紧贴合,没有空白区域
原创
发布博客 前天 16:26 ·
19 阅读 ·
0 点赞 ·
0 评论

R语言ggplot2可视化为散点图的数据点填充色彩并在点周围设置边框(border around points)

R语言ggplot2可视化为散点图的数据点填充色彩并在点周围设置边框(border around points)目录R语言ggplot2可视化为散点图的数据点填充色彩并在点周围设置边框(border around points)#散点图的数据点色彩填充#点周围设置边框(border around points)1#点周围设置边框(border around points)2#散点图的数据点色彩填充df <- data.frame(id=runif(12), x..
原创
发布博客 前天 16:25 ·
13 阅读 ·
0 点赞 ·
0 评论

R语言ggplot2可视化在图像中添加表格(table)数据实战

R语言ggplot2可视化在图像中添加表格(table)数据实战目录R语言ggplot2可视化在图像中添加表格(table)数据实战#ggplot2可视化#表格数据#在图像中添加表格(table)数据#在图像中添加表格(table)数据(表格位置)#在图像中添加表格(table)数据#ggplot2可视化set.seed(1)mydata <- data.frame(a=1:50, b=rnorm(50))ggplot(mydata,aes(x=...
原创
发布博客 前天 16:24 ·
14 阅读 ·
0 点赞 ·
0 评论

R语言使用gbm包的gbm函数构建梯度提升机模型(Gradient Boosting Machine)、指定分布为贝努力分布bernoulli

R语言使用gbm包的gbm函数构建梯度提升机模型(Gradient Boosting Machine)、指定分布为贝努力分布bernoulli
原创
发布博客 2022.05.19 ·
69 阅读 ·
2 点赞 ·
0 评论

R语言为散点图添加凸包(convex hull):数据预处理(创建一个包含每组数据凸包边界的数据集)、geom_polygon函数为可视化图像添加凸包并高亮(highlight)每个凸包并配置不同色彩

R语言为散点图添加凸包(convex hull):数据预处理(创建一个包含每组数据凸包边界的数据集)、geom_polygon函数为可视化图像添加凸包并高亮(highlight)每个凸包并配置不同的色彩
原创
发布博客 2022.05.19 ·
28 阅读 ·
1 点赞 ·
0 评论

R语言ggplot2可视化修改图例标签的大小但是保持图像中的标签大小不变实战:控制ggplot2图例外观而不影响可视化图像

R语言ggplot2可视化修改图例标签的大小但是保持图像中的标签大小不变实战:控制ggplot2图例外观而不影响可视化图像目录R语言ggplot2可视化修改图例标签的大小但是保持图像中的标签大小不变实战:控制ggplot2图例外观而不影响可视化图像#原始的可视化图像(iris数据集)​#改变图例标签的大小则图像也变化#改变图例标签的大小则图像保持不变#原始的可视化图像(iris数据集)ggplot(iris, aes(Petal.Width,Petal.Length..
原创
发布博客 2022.05.19 ·
129 阅读 ·
1 点赞 ·
0 评论

ValueError: all the input arrays must have same number of dimensions, but the array at index 0 has 1

ValueError: all the input arrays must have same number of dimensions, but the array at index 0 has 1 dimension(s) and the array at index 1 has 2 dimension(s)目录ValueError: all the input arrays must have same number of dimensions, but the array at inde
原创
发布博客 2022.05.19 ·
102 阅读 ·
1 点赞 ·
0 评论

R语言data.table导入数据实战:data.table的链式操作语法(chaining)

R语言data.table导入数据实战:data.table的链式操作语法(chaining)目录R语言data.table导入数据实战:data.table的链式操作语法(chaining)#data.table是什么?#data.table安装#把data.table数据转化为data.frame数据的语法#仿真数据#使用data.table将data.frame数据转化为data.table数据#data.table的链式操作语法(chaining)#da.
原创
发布博客 2022.05.19 ·
10 阅读 ·
1 点赞 ·
0 评论

pandas使用drop函数删除dataframe中指定索引位置的数据行(drop row in dataframe with integer index)

pandas使用drop函数删除dataframe中指定索引位置的数据行(drop row in dataframe with integer index)
原创
发布博客 2022.05.16 ·
68 阅读 ·
3 点赞 ·
1 评论

R语言可视化:plotly可视化多分类变量密度图(multiple density plot)、在底部边缘使用geom_rug函数添加边缘轴须图Marginal rug plots

R语言plotly可视化:plotly可视化多分类变量密度图(multiple density plot)、在底部边缘使用geom_rug函数添加边缘轴须图Marginal rug plots
原创
发布博客 2022.05.16 ·
49 阅读 ·
2 点赞 ·
1 评论

R语言可视化:plotly可视化多分类变量密度图(multiple density plot)、在底部边缘使用geom_rug函数添加边缘轴须图Marginal rug plots

R语言plotly可视化:plotly可视化多分类变量密度图(multiple density plot)、在底部边缘使用geom_rug函数添加边缘轴须图Marginal rug plots
原创
发布博客 2022.05.16 ·
49 阅读 ·
2 点赞 ·
1 评论

R语言ggplot2可视化在轴标签、轴标题中添加大于号、等于号等实战

R语言ggplot2可视化在轴标签、轴标题中添加大于号、等于号等实战目录R语言ggplot2可视化在轴标签、轴标题中添加大于号、等于号等实战#轴标签中添加大于号、等于号#在轴标题添加大于等于号#轴标签添加范围标签、添加大于等于号#轴标签中添加大于号、等于号.d <- data.frame(a = letters[1:6], y = 1:6)ggplot(.d, aes(x=a,y=y)) + geom_point() + scale_x_discre
原创
发布博客 2022.05.02 ·
508 阅读 ·
15 点赞 ·
1 评论

R语言中三线表是什么?使用table1包绘制(生成)三线表实战

R语言中三线表是什么?使用table1包绘制(生成)三线表实战
原创
发布博客 2022.05.02 ·
244 阅读 ·
15 点赞 ·
4 评论
加载更多