训练分类模型
提示:我希望你能扮演一名数据科学家,并为我编写代码。我有一个[描述数据集]的数据集。请构建一个机器学习模型,预测[目标变量]。
自动机器学习
提示:我希望你能扮演一个使用TPOT的自动机器学习(AutoML)机器人。我正在研究一个预测[...]的模型。请编写Python代码来找到具有最高AUC测试集分数的最佳分类模型。
调优超参数
提示:我希望你能扮演一名数据科学家,并为我编写代码。我已经训练了一个[模型名称]。请编写代码来调整超参数。
探索数据
提示:我希望你能扮演一名数据科学家,并为我编写代码。我有一个[描述数据集]的数据集。请编写用于数据可视化和探索的代码。
生成数据
提示:我希望你能扮演一个虚拟数据生成器。我需要一个有x行和y列的数据集:[插入列名]
编写正则表达式
提示:我希望你能扮演一名程序员。请用Python为我编写一个正则表达式,它可以[描述正则表达式]
训练时间序列
提示:我希望你能扮演一名数据科学家,并为我编写代码。我有一个时间序列数据集[描述数据集]。请构建一个机器学习模型来预测[目标变量]。请使用[时间范围]作为训练集,[时间范围]作为验证集。
解决数据不平衡问题
提示:我希望你能扮演一名程序员。我在一个不平衡的数据集上训练了机器学习模型。预测变量是[插入列名]列。用Python,我如何对数据进行过采样和/或欠采样?
获取特征重要性
提示:我希望你能扮演一名数据科学家,并解释模型的结果。我已经训练了一个决策树模型,我想找到最重要的特征。请编写代码。
使用Matplotlib可视化数据
提示:我希望你能在Python中扮演一名程序员。我有一个包含列[名称]的数据集[名称]。[描述图形要求]
使用Matplotlib可视化图像网格
提示:我希望你能扮演一名程序员。我有一个图像文件夹。[描述文件在目录中的组织方式] [描述你希望如何打印图像]
使用Lime解释模型
提示:我希望你能扮演一名数据科学家,并解释模型的结果。我已经训练了一个[库名称]模型,我想使用LIME解释输出。请编写代码。
使用Shap解释模型
提示:我希望你能扮演一名数据科学家,并解释模型的结果。我已经训练了一个scikit-learn XGBoost模型,我想使用一系列Shap图解释输出。请编写代码。
编写多线程函数
提示:我希望你能扮演一名程序员。你能帮我在Python中将这段代码并行化到多个线程吗?
比较函数速度
提示:我希望你能扮演一名软件开发人员。我想比较两个在Python中执行相同任务的算法的效率。请编写代码,帮助我进行可重复5次的实验。请输出实验的运行时间和其他汇总统计数据。[插入函数]
创建NumPy数组
提示:我希望你能扮演一名数据科学家。我需要创建一个NumPy数组。该NumPy数组应该具有(x,y,z)的形状。请用随机值初始化NumPy数组。
编写单元测试
提示:我希望你能扮演一名软件开发人员。请为函数[插入函数]编写单元测试。测试用例是:[插入测试用例]
验证列
提示:我希望你能扮演一名数据科学家。请编写代码来测试我的pandas数据框是否[插入要求]
解释代码
提示:我希望你能扮演一名代码解释者。这段代码在做什么?[插入代码]
解释SQL
提示:我希望你能扮演一名数据科学讲师。你能解释一下这段SQL代码在做什么吗?[插入SQL代码]
解释Google Sheets公式
提示:我希望你能扮演一名Google Sheets公式解释者。解释以下Google Sheets命令。[插入公式]
优化代码
提示:我希望你能扮演一名软件开发人员。请帮我提高以下代码的时间复杂度。[插入代码]
优化Pandas
提示:我希望你能扮演一名代码优化者。你能指出以下pandas代码的错误并进行优化吗?[在这里插入代码]
优化SQL
提示:我希望你能扮演一名SQL代码优化者。以下代码运行缓慢。你能帮我加速吗?[插入SQL]
简化Python
提示:我希望你能扮演一名代码简化者。你能简化以下代码吗?
格式化代码
提示:我希望你能扮演一名软件开发人员。请为下面的func1提供文档。[插入函数]
提高可读性
提示:我希望你能扮演一名代码分析师。你能提高以下代码的可读性和可维护性吗?[插入代码]
格式化SQL
提示:我希望你能扮演一名SQL格式化程序。请格式化以下SQL代码。请将所有保留关键字转换为大写[插入要求]。[插入代码]
翻译代码
提示:我希望你能扮演一名程序员,并为MySQL编写SQL代码。对于MySQL来说,PostgreSQL的DATE_TRUNC有什么等效替代?
将Python翻译到R
提示:我希望你能扮演一名代码翻译员。你能把以下代码从Python翻译成R吗?[插入代码]
将R翻译成Python
提示:我希望你能扮演一名代码翻译员。你能把以下代码从R翻译成Python吗?[插入代码]
解释概念
提示:我希望你能扮演一名数据科学讲师。用五岁孩子能理解的方式解释[概念]。
对大学生解释
提示:我希望你能扮演一名数据科学讲师。用大学生能理解的方式解释[概念]。
对教授解释
提示:我希望你能扮演一名数据科学讲师。用教授能理解的方式解释[概念]。
对业务利益相关者解释
提示:我希望你能扮演一名数据科学讲师。用业务利益相关者能理解的方式解释[概念]。
像StackOverflow一样解释
提示:我希望你能扮演StackOverflow上的回答者。你可以提供代码片段、示例表和输出来支持你的答案。[插入技术问题]
提出建议
提示:我希望你能扮演一名软件开发人员。请帮我捕获这个函数的边缘案例[插入函数]
建议数据集
提示:我希望你能扮演一名数据科学职业教练。我想构建一个预测[...]的模型。同时,我也想展示我在[...]方面的知识。你能为我的用例建议五个最相关的数据集吗?
建议作品集想法
提示:我希望你能扮演一名数据科学教练。我的背景是[...]、我想[职业目标]。我需要建立一个数据科学项目的作品集,以帮助我在[...]领域获得[...]角色。你能为我建议五个具体的作品集项目吗?这些项目将展示我在[...]方面的专长,并与[公司]相关。
建议资源
提示:我希望你能扮演一名数据科学教练。我想学习[主题]。请建议3个最佳的具体资源。你可以包括[指定资源类型]
建议时间复杂度
提示:我希望你能扮演一名软件开发人员。请比较下面两个算法的时间复杂度。[插入两个函数]
建议特征工程
提示:我希望你能扮演一名数据科学家,并执行特征工程。我正在研究一个预测[插入特征名称]的模型。有这些列:[描述列]。你能为这个机器学习问题建议一些可以设计的特征吗?
建议A/B测试步骤
提示:我希望你能扮演一名统计学家。[描述上下文]请为此目的设计一个A/B测试。请包括我应该运行的具体统计测试步骤。
职业指导
提示:我希望你能扮演一名职业顾问。我正在寻求[角色名称]的工作。我的背景是[...]。我应该如何在6个月内获得这个角色,需要什么具体资源?
排查问题
提示:你上面的代码是错的。[指出错误]。你能再试一次吗?
更正Python代码
提示:我希望你能扮演一名软件开发人员。这段代码本应[预期功能]。请帮我调试无法运行的Python代码。[插入函数]
更正SQL代码
提示:我希望你能扮演一名SQL代码纠正者。这段代码在[你的DBMS,例如PostgreSQL]中无法运行。你能为我纠正它吗?[这里是SQL代码]
排查PowerBI模型问题
提示:我希望你能扮演一名Power BI模型构建者。这是我当前项目的细节。[插入细节]。你觉得这个表有什么问题吗?
编写SQL
提示:我希望你能扮演一名数据科学家,为我编写SQL代码。我有一个包含两列[插入列名]的表。我想计算[哪个值]的运行平均值。对于PostgreSQL 14,编写什么SQL代码?
解决LeetCode问题
提示:假设你有这些表...有这些列...输出以下内容...[来自DataLemur的问题)
编写其他代码
提示:我希望你能扮演一个生成Google Sheets公式的机器人。请生成一个公式,满足[描述要求]
编写R脚本
提示:我希望你能扮演一名使用R的数据科学家。你能编写一个R脚本来[插入要求]吗?
编写Shell
提示:我希望你能扮演一名Linux终端专家。请编写代码来[描述要求]
编写VBA
提示:我希望你能扮演一名Excel VBA开发人员。你能编写一个VBA来[插入功能]吗?
格式化表格
提示:我希望你能扮演一名文档格式化者。请为我将以下内容格式化成一个漂亮的表格,以便我放入Google文档?[在这里插入文本表格]
总结书籍
提示:我希望你能扮演一名技术书籍总结者。你能用5个主要要点来总结[书名]吗?
总结论文
提示:我希望你能扮演一名学者。请用一段简单的话总结[...]论文。
提供情感支持
提示:我希望你能给我提供情感支持。[在这里解释问题。]
以上提示词来自于《60 CHATGPT PROMPTS FOR DATA SCIENCE》,作者:Travis Tang