Python应用
文章平均质量分 94
Xin学数据
数据分析处理小能手,两年数据分析岗相关经验,一年python授课经验~~理论结合实践,做知识的传递者。
展开
-
Pandas DataFrame 转 Spark DataFrame报错:AttributeError_ ‘DataFrame‘ object has no attribute ‘iteritems‘
处理方案如下,根据自身需求选择:- 降低 pandas 版本:`pip install pandas==1.5.3`- 用 items() 替换 iteritems():`pd.DataFrame.iteritems = pd.DataFrame.items`- 升级 spark 版本:下载链接:[https://spark.apache.org/downloads.html](https://spark.apache.org/downloads.html)原创 2024-01-27 11:47:14 · 1501 阅读 · 1 评论 -
GPT3.5 改用 GPT4 价格翻了30倍 如何破局? GPT 对话成本推演
假设你搭建了一个平台,提供 ChatGPT 3.5 的聊天服务。目前已经有一批用户的使用数据,想要测算一下如果更换 GPT 4.0 服务需要多少成本?原创 2023-12-31 19:47:21 · 1856 阅读 · 0 评论 -
如何计算 ChatGPT 的 Tokens 数量?
本文主要介绍了 GPT 如何计算 Tokens 的方法,官方提供了两种方式:网页计算和接口计算。网页计算不需要技术,只需要魔法即可体验,而接口计算,事实上接口计算包含了两种方法,一种使用tiktoken,则需要点 Python 基础,而openai还需要点网络基础和货币基础,需要代理和 plus 账号(20刀/月)等。原创 2023-12-05 09:15:00 · 7458 阅读 · 2 评论 -
使用 PyODPS 采集神策事件数据
本文主要介绍将神策数据入库的相关操作。目标:将神策数据入库到 MaxCompute 数仓。最终的解决方案的整个流程梳理下来其实就是:请求神策数据->Pandas 处理数据->转为 MaxCompute 数组并入库。原创 2023-11-25 13:44:56 · 766 阅读 · 0 评论 -
Dataworks API:调取 MC 项目下所有表单
本文介绍了从 Dataworks 项目中获取所有表单字段的方法,基本步骤如下:查看官方文档,了解约束和接口;在线调试,并获取源码;配置本地环境,安装 alibabacloud_dataworks_public20200518;配置环境变量,新增两个环境变量ALIBABA_CLOUD_ACCESS_KEY_ID和 ALIBABA_CLOUD_ACCESS_KEY_SECRET,并将阿里云账号的 ACCESS_KEY_ID 和 ACCESS_KEY_SECRET 分别作为对应变量的值;测试源码,打原创 2023-10-27 20:53:24 · 989 阅读 · 0 评论