- 博客(30)
- 收藏
- 关注
原创 吴恩达机器学习(7)K-means & PCA
(1)导入库(2)导入数据(3)可视化1.2 获取样本点所属类别计算每个样本点与聚类中心的距离: 1.3 计算重心点1.4 运行kmeans,重复执行上述步骤1.5 绘制数据集聚类结果&聚类中心的移动轨迹通俗的讲,原图像每个像素点的单个通道有256种颜色可供选择,而我们要用K-means算法选16种颜色,用于图片压缩。把原始图片的每个像素看作一个数据样本,然后利用K-means算法去找分组最好的16种颜色。(1)导入库与数据(2)数据
2023-11-02 19:22:30
141
原创 吴恩达机器学习(3)神经网络
(1)导入库(2)导入数据(3)可视化多图可视化2 代价函数3梯度下降函数4 使用scipy优化函数(1)定义函数(2)实例化5 预测准确率(1)定义预测函数(2)实例化(3)计算预测准确率(1)导入库(2)导入数据(3)定义X、y(4)导入参数 2 定义激活函数3 构建神经网络 4 预测及准确率(1)预测函数(2)计算预测准确率
2023-10-30 18:22:39
29
原创 8.SQL基础教程(八)-SQL高级处理
窗口函数可以进行排序、生成序列号等一般的聚合函数无法实现的高级操作。通过PARTITION BY分组后的记录集合称为“窗口”。
2023-10-23 15:24:29
34
1
原创 8.Pandas库入门(8)-数据透视与vlookup功能
pivot_table有四个最重要的参数indexvaluescolumnsaggfunc。
2023-10-19 17:15:21
277
原创 4.Pandas库入门(4)-数据处理
数据对齐:是数据清洗的重要过程,可以按索引对齐进行运算,如果没对齐的位置则补NaN,最后也可以填充NaN。分层索引:就是在一个轴上拥有多个(两个以上)索引级别,使用户能以低维度形式处理高维度数据。(4)如果不在MultiIndex中设置索引名,也可以事后设置。(3)from_product方法。【附】MultiIndex参数表。使用replace( )函数实现。(1)from_arrays方法。(2)from_tuples方法。方法一:将空值填充为0。
2023-10-18 16:14:00
205
原创 2.Pandas库入门(2)-数据操作
通过on指定数据合并对齐的列。没有指定how的话默认使用inner方法,除了内连接,还包括左连接、右连接、全外连接。如果表合并的过程中遇到有一列两个表都同名,但是值不同,合并的时候又都想保留下来,就可以用suffixes给每个表的重复列名增加后缀。concat:可以沿一条轴将多个对象连接到一起。merge:可以根据一个或多个键将不同的DataFrame中的行连接起来。join:inner是交集,outer是并集。
2023-10-17 14:41:58
107
原创 1.Pandas库入门(1)-文件读取与数据结构
(1)仅有数据列表即可产生最简单的Series。(3)查询多列,返回的是pd.DataFrame。(4)查询多行,返回的是pd.DataFrame。(5)键和值存在两个列表中,创建Series。(1)只查询一列,返回的是pd.Series。(2)只查询一行,返回的是pd.Series。(3)使用Python字典创建Series。(3)txt文件转csv文件。(2)指定Series的索引。(4)根据标签索引查询数据。
2023-10-17 11:18:44
156
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人