数据人阿多
码龄12年
关注
提问 私信
  • 博客:164,770
    164,770
    总访问量
  • 114
    原创
  • 16,881
    排名
  • 229
    粉丝
  • 0
    铁粉
  • 学习成就

个人简介:一枚热爱技术的数据分析师,同时也热爱分享技术,欢迎大家多多交流,共同进步

IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:北京市
  • 加入CSDN时间: 2012-09-13
博客简介:

DataShare

查看详细资料
  • 原力等级
    成就
    当前等级
    4
    当前总分
    873
    当月
    11
个人成就
  • 获得369次点赞
  • 内容获得96次评论
  • 获得1,132次收藏
  • 代码片获得3,979次分享
创作历程
  • 21篇
    2024年
  • 23篇
    2023年
  • 12篇
    2022年
  • 12篇
    2021年
  • 33篇
    2020年
  • 13篇
    2019年
成就勋章
TA的专栏
  • Python pandas
    14篇
  • Python polars基础学习
    10篇
  • hive
    7篇
兴趣领域 设置
  • Python
    pythonscikit-learnnumpypandas
  • 开发工具
    githubgitwindowspycharm
  • 大数据
    hive数据仓库
  • 人工智能
    机器学习深度学习神经网络tensorflowpytorch数据分析
  • 操作系统
    linux
  • 服务器
    linux
创作活动更多

AI大模型如何赋能电商行业,引领变革?

如何使用AI技术实现购物推荐、会员分类、商品定价等方面的创新应用?如何运用AI技术提高电商平台的销售效率和用户体验呢?欢迎分享您的看法

184人参与 去创作
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

Python 基于plotly库快速画旭日图

本文借助库来画旭日图,该库是一个高级可视化库,相对 Matplotlib 更高级一些,上手起来相对比较容易。
原创
发布博客 2024.11.04 ·
409 阅读 ·
4 点赞 ·
0 评论 ·
9 收藏

hadoop 常用命令总结

在本地记事本记得太多了,有的命令使用频次很低,时间长了容易忘记,分享出来后续使用时查找。
原创
发布博客 2024.09.27 ·
414 阅读 ·
9 点赞 ·
0 评论 ·
1 收藏

Rust 是否会重写 Python 解释器与有关的库,替代 C 语言地位?

近2年随着Rust语言的大力发展,一些系统与软件开始逐渐使用Rust语言来实现,并且一些大型公司也开始逐渐转向Rust因为在学习 Polars 库时,看到该库是使用Rust实现的,小编近一年也逐渐开始学习Rust语言,了解到其中的一些思想相对其他语言来说确实比较先进,所有权概念的引入,不仅可以提升性能,而且还保证了数据安全、准确,不会有数据竞争问题的产生小编最近在处理加解密任务时,借助Rust语言实现了一个DES加解密库,借助Rust 中的pyo3包,在Python 中借助maturin。
原创
发布博客 2024.09.24 ·
462 阅读 ·
4 点赞 ·
0 评论 ·
6 收藏

Python pandas中重排列与列重名

把数据导出到Excel中时,有时需要对列的顺序进行调整,按业务需求进行排列,并且字段名字不能是英文,这样方便业务人员查看与理解数据,在pandas中有相应的函数可以满足以上2个要求,让我们来学习一下吧。
原创
发布博客 2024.09.06 ·
373 阅读 ·
5 点赞 ·
0 评论 ·
8 收藏

Python 利用矢量化,计算2个经纬度之间的距离

假如全国所有的酒店/民宿经纬度信息已知的情况下,基于当前位置,怎么快速计算附近5KM内的酒店/民宿呢?现实中有大量的这种业务场景,需要快速计算2点间的地球距离本篇文章,比如当前的定位是在北京,那么没有必要去计算与上海的酒店/民宿距离;来进行优化,看看性能大约能提升多少。
原创
发布博客 2024.08.20 ·
401 阅读 ·
6 点赞 ·
0 评论 ·
6 收藏

Python polars学习-10 时间序列类型

polars学习系列文章,第10篇 时间序列类型(Time series)该系列文章会分享到github,大家可以去下载jupyter文件,进行参考学习。
原创
发布博客 2024.08.05 ·
912 阅读 ·
17 点赞 ·
1 评论 ·
16 收藏

Python polars学习-09 数据框关联与拼接

polars学习系列文章,第9篇 数据框关联与拼接(Join 、Concat)该系列文章会分享到github,大家可以去下载jupyter文件,进行参考学习。
原创
发布博客 2024.07.23 ·
754 阅读 ·
18 点赞 ·
0 评论 ·
16 收藏

Python polars学习-08 分类数据处理

polars学习系列文章,第8篇 分类数据处理(Categorical data)该系列文章会分享到github,大家可以去下载jupyter文件,进行参考学习仓库地址:https://github.com/DataShare-duo/polars_learn。
原创
发布博客 2024.07.08 ·
552 阅读 ·
23 点赞 ·
0 评论 ·
5 收藏

Python polars学习-07 缺失值

在 polars 中缺失值用null来表示,只有这1种表示方式,这个与 pandas 不同,在 pandas 中NaN(NotaNumber)也代表是缺失值,但在polars中把NaN归属为一种浮点数据},print(df)┌───────┐│ value ││ --- ││ i64 │╞═══════╡│ 1 ││ 2 ││ 3 ││ null ││ 5 ││ 6 ││ null ││ 8 ││ 9 │└───────┘。
原创
发布博客 2024.06.25 ·
589 阅读 ·
5 点赞 ·
0 评论 ·
10 收藏

Python polars学习-06 Lazy / Eager API

polars学习系列文章,第6篇 Lazy / Eager API延迟、惰性即时、实时该系列文章会分享到github,大家可以去下载jupyter文件,进行参考学习仓库地址:https://github.com/DataShare-duo/polars_learn。
原创
发布博客 2024.06.20 ·
380 阅读 ·
5 点赞 ·
0 评论 ·
10 收藏

Python polars学习-05 包含的数据结构

polars学习系列文章,第5篇 包含的数据结构,与pandas一样,polarsSeriesDataFrame,大部分操作与pandas保持一致,减少了大家的学习难度该系列文章会分享到github,大家可以去下载jupyter文件,进行参考学习仓库地址:https://github.com/DataShare-duo/polars_learn。
原创
发布博客 2024.06.14 ·
422 阅读 ·
5 点赞 ·
0 评论 ·
4 收藏

让ChatGPT回答闰年的计算逻辑

背景闰年计算在平时很常见,不管是面试还是业务数据处理,基本都会涉及到闰年的计算逻辑,那么就来问一下ChatGPT(基于 4o 模型回答),让他来帮我们详细解释一下闰年的计算逻辑问题1:判断闰年的计算逻辑基本规则:一个年份如果能被4整除并且不能被100整除,则是闰年一个年份如果能被400整除,也是闰年这些规则总结起来就是:如果年份能被4整除,但不能被100整除,是闰年如果年份能...
原创
发布博客 2024.06.01 ·
539 阅读 ·
14 点赞 ·
0 评论 ·
12 收藏

Python polars学习-04 字符串数据处理

polars学习系列文章,第4篇 字符串数据处理该系列文章会分享到github,大家可以去下载jupyter文件,进行参考学习仓库地址:https://github.com/DataShare-duo/polars_learn。
原创
发布博客 2024.05.23 ·
563 阅读 ·
4 点赞 ·
0 评论 ·
6 收藏

polars学习-03 数据类型转换

polars学习系列文章,第3篇 数据类型转换。该系列文章会分享到github,大家可以去下载jupyter文件仓库地址:https://github.com/DataShare-duo/polars_learn。
原创
发布博客 2024.05.13 ·
695 阅读 ·
6 点赞 ·
0 评论 ·
7 收藏

Python polars学习-03 数据类型转换

背景polars学习系列文章,第3篇 数据类型转换。该系列文章会分享到github,大家可以去下载jupyter文件仓库地址:https://github.com/DataShare-duo/polars_learn小编运行环境import sysprint('python 版本:',sys.version.split('|')[0])#python 版本: 3.11.5 im...
原创
发布博客 2024.05.13 ·
260 阅读 ·
3 点赞 ·
0 评论 ·
4 收藏

Python polars学习-02 上下文与表达式

Polars 开发了自己的特定领域语言 (DSL),用于转换数据。该语言非常容易使用,允许进行复杂的查询,但仍保持人类可读性。该语言的两个核心组成部分是上下文和表达式Polars 自己设计了一套用于处理数据的功能。该功能易于使用,而且能以易理解的方式进行复杂的数据处理。上下文与表达式是该功能的两个核心组成部分。1. Contexts 上下文上下文是指需要计算表达式的上下文选择:df.select(…),df.with_columns(…)过滤:df.filter()
原创
发布博客 2024.04.29 ·
886 阅读 ·
23 点赞 ·
0 评论 ·
17 收藏

Python polars学习-01 读取与写入文件

在Python数据处理与分析中,大家在处理数据时,使用的基本都是Pandas,该库非常好用。随着 Rust 的出圈,基于其开发的Polars库,逐渐赢得大家的喜爱,在某些功能上更优于Pandas。于是小编在自学的过程中,逐步整理一些资料供大家参考学习,这些资料会分享到github仓库地址:https://github.com/DataShare-duo/polars_learnPS:为了学习Polars,小编先了解一遍 Rust,《Rust权威指南》
原创
发布博客 2024.04.25 ·
792 阅读 ·
3 点赞 ·
0 评论 ·
7 收藏

Python中的Lambda匿名函数

Lambda匿名函数在Python中经常出现,小巧切灵活,使用起来特别方便,但是小编建议大家少使用,最好多写几行代码,自定义个函数。既然Python中存在Lambda匿名函数,那么小编本着存在即合理的原则,还是介绍一下,本篇文章翻译自《Lambda Functions in Python》,分享出来供大家参考学习原文地址:https://www.clcoding.com/2024/03/lambda-functions-in-python.html。
原创
发布博客 2024.04.09 ·
299 阅读 ·
5 点赞 ·
0 评论 ·
3 收藏

Python pandas遍历行数据的2种方法

pandas在数据处理过程中,除了对整列字段进行处理之外,有时还需求对每一行进行遍历,来处理每行的数据。本篇文章介绍 2 种方法,来遍历pandas 的行数据。
原创
发布博客 2024.03.06 ·
508 阅读 ·
4 点赞 ·
0 评论 ·
4 收藏

Python 常用的加解密算法实例应用

经过移动互联网的蓬勃发展后,促使数字化也进入大众视野,现阶段各个行业能数字化的基本都数字化,至于数字化后好用不好用是另一回事了数字化就会涉及到数据处理、数据存放等,紧接着引出了数据安全,数据存放时是否需要加密的问题,大型公司数据存放在服务器时,敏感数据基本都是加密后存放小编这里大概梳理了几个常用的加密算法,本篇文章重点是实际使用,不介绍算法原理,算法原理相对比较深奥,涉及到密码学,小编也研究不懂。
原创
发布博客 2024.02.04 ·
853 阅读 ·
8 点赞 ·
1 评论 ·
14 收藏
加载更多