自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(28)
  • 收藏
  • 关注

原创 第6章【思考与练习1】调整MLP分类器的参数solver,比较不同参数的模型在鸢尾花数据集上的分类性能。在MLP训练函数fit()前后增加计时功能,设置不同隐藏层数目,比较训练所耗费的时间。

第6章 | 神经网络与深度学习建模分析。P125 思考与练习1。1. 调整MLPClassifier分类器的参数solver,比较不同参数的模型在鸢尾花数据集上的分类性能。2. 在MLPClassfier训练函数fit()前后增加计时功能,设置不同隐藏层数目,比较训练所耗费的时间,以及模型分类的准确性。针对MLP模型,是否结点越多分类性能越好?

2022-05-31 20:39:38 4427 1

原创 第5章【思考与练习2】将数据集划分为训练集与测试集,查看决策树分类器的性能。 将例5-3中的分类器保存到文件中,然后重新加载预测给出的新数据。

第5章 | 机器学习建模分析。P101思考与练习2。1.将数据集划分为训练集与测试集,查看决策树分类器的性能。2.将例5-3中的分类器保存到文件中,然后重新加载预测给出的新数据。

2022-04-13 11:21:58 9337 7

原创 第5章【思考与练习1】 延续回归模型的性能评估,计算使用全部数据学习得到的回归模型linreg在测试集上的性能。从例5-2训练集中取出前100条、200条样本,学习得到回归模型,并在测试集上预测分析

第5章 | 机器学习建模分析。P96思考与练习1。1. 延续回归模型的性能评估,计算使用全部数据学习得到的回归模型linreg在测试集上的性能,与只使用训练集的模型linregTr进行比较,并对结果进行分析。2.从例5-1中取出前100条样本,学习回归模型linregHalf;在练习1的测试集上计算该模型预测性能,并与使用200条样本学习的模型比较。

2022-04-13 11:16:16 7418 1

原创 第4章【思考与练习1】叙述Pandas和Matplotlib绘图工具之间的关系。 2012~2020年我国人均可支配收入为[1.47, 1.62, 1.78...]按照要求绘制以下图形:折线图、多子图

第4章 | 数据可视化。P70【思考与练习1】。使用Matplotlib绘图,DataFrame.plot()绘图与Series.plot()绘图。绘制折线图,多子图。2. 1)模仿例4-1和4-3,绘制人均可支配收入折线图。用小矩形标记数据点,黑色虚线,用注解标注最高点,图例标题“Income ”,设置坐标轴标题,最后将最后将图形保存为jpg文件。2)模仿例4-2,使用多个子图分别绘制人均可支配收入的折线图、箱形图以及柱状图

2022-03-15 14:24:25 7681

原创 第4章【综合练习题】文件bankpep.csv存放着银行储户的基本信息,数据格式如下表所示,请通过绘图对这些客户数据进行探索性分析。客户年龄分布的直方图和密度图

第4章 | 数据可视化。P86【综合练习题】。文件bankpep.csv存放着银行储户的基本信息,数据格式如下表所示:请通过绘图对这些客户数据进行探索性分析。1)客户年龄分布的直方图和密度图2)客户年龄和收入关系的散点图3)绘制散点图观察账户(年龄,收入,孩子数)之间的关系,对角线显示直方图4)按区域展示平均收入的柱状图,并显示标准差5)多子图绘制:账户中性别占比饼图,有车的性别占比饼图,按孩子数的账户占比饼图6)各性别收入的箱须图

2022-03-15 13:53:43 11023 3

原创 第4章【思考与练习2】数据文件high-speed rail.csv存放着世界各国高速铁路的情况。对世界各国高铁的数据进行绘图分析。使用Basemap绘制地图及使用Pyecharts绘制地图。

第4章 | 数据可视化。P84【思考与练习2】。python可视化Matplotlib绘图,Basemap与Pyecharts绘制地图。1、叙述各类图形的特点、适合展示的数据特性,以及在数据探索阶段的用途。2、数据文件high-speed rail.csv存放着世界各国高速铁路的情况。数据格式如下表所示。请对世界各国高铁的数据进行绘图分析。

2022-03-15 13:47:46 8799

原创 第3章【综合练习题】根据某系的实验教学计划,完成以下分析:读取DataScience.xlsx文件数据,创建为DataFrame数据对象。根据银行储户的基本信息,完成以下分析。从文件中读取信息

第3章 | 数据汇总与统计。【综合练习题】。2)查询实验教学计划的基本内容及总数(df.index,df.columns)3)查询实验教学计划中是否含有NaN数据?将含有NaN数据的行导出为数据文件pre.csv,判断采用何种数据清洗模式:填充、删除或手工填充;从“bankpep.csv”文件中读取用户信息。2)查看储户的总数,以及居住在不同区域的储户数。3)计算不同性别储户收入的均值和方差。

2022-03-13 01:18:42 14487 1

原创 第3章【思考与练习5】 数据合并,从studentsInfo.xlsx的“Group3”页读取数据,将序号、性别、年龄项保存到data1对象。数据排序和排名,使用练习1最后合并的数据。

第3章 | 数据汇总与统计。P56【思考与练习5】。1. 数据合并。1)从studentsInfo.xlsx的“Group3”页读取数据,将序号、性别、年龄项保存到data1对象;2)从studentsInfo.xlsx的“Group3”页读取数据,将序号、身高、体重、成绩项保存到data2对象;3)将data2合并到data1中,连接方式为内连接。2. 数据排序和排名。1)使用练习1最后合并的数据;2)按月生活费对数据升序排序;3)按身高对数据降序排名,并列取值方式设置为min。

2022-03-13 01:01:25 6204

原创 第3章【思考与练习4】数据清洗,从studentsInfo.xlsx 文件的“Group1”表单中读取数据。数据填充,使用习题1的数据,使用列的平均值填充“体重”和“成绩”列的NaN数据。

第3章 | 数据汇总与统计。P52【思考与练习4】。考察数据填充与清洗。1、数据清洗。 1)从studentsInfo.xlsx 文件的“Group1”表单中读取数据;2)将“案例教学”列数据值全改为NaN; 3)滤除每行数据中缺失3项以上(包括3项)的行;4)滤除值全部为NaN的列;2、数据填充:1)使用习题1的数据; 2)使用列的平均值填充“体重”和“成绩”列的NaN数据; 3)使用上一行数据填充“年龄”列的NaN数据; 4)使用“中位数”填充“生活费用”NaN数据。

2022-03-13 00:56:04 7600 2

原创 第3章【思考与练习3】创建50×7的DataFrame对象,数据为 [10,99]之间的随机整数;海伦一直使用在线交友网站寻找适合的约会对象, 她将交友数据存放在datingTestSet.xls文件

第3章 | 数据汇总与统计。P48【思考与练习3】。考察文件的读取。1、创建50×7的DataFrame对象,数据为 [10,99]之间的随机整数;columns为字符a-g;将DataFrame对象保存到csv文件中。2、1)从文件中读取有效数据保存到Dataframe对象中,跳过所有文字解释行;2)列索引名设为 ['flymiles','videogame','icecream','type’];3)显示读取到的前面5条数据;4)显示所有'type'为'largeDoses‘的数据;

2022-03-13 00:50:18 7176

原创 第3章【思考与练习2】创建并访问Series对象。创建如下表的Series数据对象,其中a-f为索引;增加数据27,索引为g。创建并访问DataFrame对象。创建3×3DataFrame数据对象。

第3章 | 数据汇总与统计。P44【思考与练习2】。3)修改索引对应的值为40;4)查询值大于27的数据;5)删除位置为1-3的数据。a)创建3×3DataFrame数据对象:数据内容为1-9;行索引为字符a,b,c;列索引为字符串one,two,three;b)查询列索引为two和three两列数据;c)查询第0行、第2行、第0列、第2列数据;d)筛选第1列中值大于2的所有行数据,另存为data1对象;e)为data1添加一列数据,列索引为four,值都为10;

2022-03-13 00:42:41 9503 3

原创 第3章【思考与练习1】简述统计量均值和中位数的区别,如果某样本统计的均值和中位数存在较大差别,说明数据集具有什么特性。使用Excel表格计算样本均值、方差、中位数和上四分位数、下四分位数。

第3章 | 数据汇总与统计。P36【思考与练习】。1、简述统计量均值和中位数的区别,如果某样本统计的均值和中位数存在较大差别,说明数据集具有什么特性?2、使用Excel表格计算表3-1中由5名学生“成绩”组成的样本均值、方差、中位数和上四分位数、下四分位数。

2022-03-13 00:31:50 1318

原创 第1章 数据科学基础答案

综合练习题1、在个人计算机上下载Anaconda3科学计算工具包,并正确安装。2、编写Python程序实现功能:用键盘输入若干姓名,保存在字符串列表中;输入任意姓名,检索列表中是否存在。3、编写Python程序实现功能:使用字典记录学生姓名及对应身高值;输入任意学生姓名,在字典中查找并显示所有高于此身高值的学生信息。

2022-03-12 13:05:53 2661

原创 第2章 多维数据结构与运算答案

P25思考与练习1、补充作业题1、P30思考与练习2、补充作业题2、P33思考与练习3、P33综合练习题。

2022-03-12 13:04:59 3114

原创 第2章【综合练习题】基于2.3节中随机游走的例子,使用ndarray和随机数生成函数模拟一个物体在三准空间随机游走的过程。三维空间随机游走轨迹模拟并作图。

第2章 | 多维数据结构与运算。P33【综合练习题】第2题。本题围绕物体在三维空间随机游走轨迹展开。运用Matplotlib绘制三维图。1)创建3×10的二维数组,记录物体每步在三个轴向上的移动距离。在每个轴向的移动距离服从标准正态分布(期望为0,方差为1)。行序0、1、2分别对应x轴、y轴和z轴。2)计算每步走完后物体在三维空间的位置。3)计算每步走完后物体到原点的距离(只显示两位小数)。4)统计物体在z轴上到达的最远距离。5)统计物体在三维空间距离原点的最近值。

2022-03-11 00:20:28 3552 3

原创 第2章【综合练习题】“大润发”、“沃尔玛”、“好德”和“农工商”四个超市都卖苹果、香蕉、橘子和芒果四种水果。使用NumPy的ndarray实现以下功能。

第2章 | 多维数据结构与运算。P33【综合练习题】第1题。考查二维数组DataFrame的创建,切分、运算。使用NumPy的ndarray实现以下功能。1)创建两个一维数组分别存储超市名称和水果名称。2)创建一个4×4的二维数组存储不同超市的水果价格,其中价格由4~10范围内的随机数生成。3)选择“大润发”的苹果和“好德”的香蕉,并将价格增加1元。4)“农工商”水果大减价,所有水果价格减2元。5)统计四个超市节果和芒果的销售均价。6)找出橘子价格最贵的超市名称(不是编号)。

2022-03-11 00:02:07 6010 2

原创 第2章【思考与练习3】随机游走轨迹模拟。将随机游走的步数增加到100步,计算物体最终与原点的距离。重复多次随机游走过程,观察物体与原点距离的变化趋势。

第2章 | 多维数据结构与运算。P33思考与练习。探究随机游走轨迹并探究终点与原点的距离。1、将随机游走的步数增加到100步,计算物体最终与原点的距离。2、重复多次随机游走过程,观察物体与原点距离的变化趋势。

2022-03-10 23:53:05 3134

原创 第2章【思考与练习2】将scores数组中所有学生的英语成绩减去3分并显示。统计scores数组中每名学生所有科目的平均分并显示。使用随机函数生成[-1,1]之间服从均匀分布的3×4二维数组,求元素和

第2章 | 多维数据结构与运算 。P30思考与练习2。【补充作业题】。1,将scores数组中所有学生的英语成绩减去3分并显示。2.统计scores数组中每名学生所有科目的平均分并显示。3,使用随机函数生成[-1,1]之间服从均匀分布的3×4二维数组,并计算所有元素的和。1.选取scores中第2行第2列元素。2.选取scores中两个元素,行序号为0,列序号为1的元素;以及行序号为3,列序号为6的元素。3.选取数组scores中的前3行数据。

2022-03-10 23:38:42 3421

原创 第2章【思考与练习1】一维数组访问,在subjects数组中选择并显示序号1、2、4门课的名称。二维数组访问,选择并显示scores数组的1、4行。生成由整数10~19组成的2×5的二维数组

第2章 | 多维数据结构与运算答案。P25【思考与练习1】、【补充作业题】一维数组访问:2)选择并显示names数组从2到最后的数组元素:选择并显示subjects数组正序2~4的数组元素。3)使用布尔条件选择并显示subjects数组中的英语和物理科目名称。二维数组访问:2)选择并显示scores数组中行序2、4学生的数学和Python成绩。3)选择并显示scores数组中所有学生的数学和艺术课程成绩。4)选择并显示scores数组中“王微”和“刘旭阳”的英语和艺术课程成绩。

2022-03-10 23:05:43 4331

原创 第1章【综合练习题】编写Python程序实现功能:使用字典记录学生姓名及对应身高值;输入任意学生姓名,在字典中查找并显示所有高于此身高值的学生信息。

第1章 | 数据科学基础答案。P17【综合练习题】第3题。附【补充作业题】:计算1+2+ ….+100的和,并输出结果。定义列表 t=[10,20,30,40,50,60,70,80,90,100]。切片操作:t[0:9:2]、t[2:7]、t[ :5]、t[1: ]、t[: :-1]、t[6:0:-1]、t[6:0:-2]。

2022-03-10 22:31:46 5253 1

原创 第1章【综合练习题】编写Python程序实现功能:用键盘输入若干姓名,保存在字符串列表中;输入任意姓名,检索列表中是否存在

第1章 | 数据科学基础答案。【综合练习题】第2题。

2022-03-10 22:22:23 6075

原创 第1章【综合练习题】下载Anaconda 科学计算工具包,并正确安装

第1章 | 数据科学基础答案。【综合练习题】第1题

2022-03-10 22:17:53 462

原创 第4章 数据可视化答案

python可视化Matplotlib绘图,Basemap与Pyecharts绘制地图P70思考与练习1、P84思考与练习2、P86综合练习题。

2022-03-08 23:13:59 5787

原创 第3章 DataFrame补充作业题1(上大)

第3章 DataFrame补充作业题1(上大)读取文件中数据,DataFrame中提取数据。

2022-03-07 23:16:11 1125 1

原创 第3章 DataFrame补充作业题2(上大)

第3章 DataFrame补充作业题2。进一步熟悉DataFrame的访问、计算与统计知识点

2022-03-07 23:09:36 919 1

原创 第3章 数据汇总与统计答案

Series、DataFrame创建,读取,统计分析。P36思考与练习1、P44思考与练习2、P48思考与练习3、P52思考与练习4、P56思考与练习5、P63综合练习题。

2022-03-07 22:40:30 5765

原创 第一章|第二节 Python数据分析工具——关于Spyder与Jupyter Notebook的一些使用说明

目录二、Python数据分析工具1、关于Spyder的一些使用说明(1)保存为.py文件(2)运行(3)修改参数2、关于Jupyter Notebook的一些使用说明(1)创建、重命名与保存.ipynb文件(2)运行(3)清空运行结果并重新运行(4)查看所创建的.ipynb文件位置(5)markdown常用标记(6)还原误删的单元二、Python数据分析工具Python通过多个开源的第三方工具包来实现数据分析。...

2022-01-29 10:49:41 6876

原创 第一章|第一节 了解数据科学

系列文章目录提示:这里可以添加系列文章的所有文章的目录,目录需要自己手动添加例如:第一章 Python 机器学习入门之pandas的使用提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录系列文章目录 前言 一、pandas是什么? 二、使用步骤 1.引入库 2.读入数据 总结前言提示:这里可以添加本文要记录的大概内容:例如:随着人工智能的不断发展,机器学习这门技术也越来越重要,很多人都开启了学习机器学习,本文就介绍了机器学习的.

2022-01-29 10:10:10 1227

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除