自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 第三周:李宏毅机器学习

在前几周掌握了机器学习基本步骤后,本周了解了模型在不同情况下的发生原因以及改进措施,可以看出loss的观测无论在训练集还是测试集上都至关重要。最优化是机器学习的重要步骤,但是总是达不到最优,分析得到了以下几种原因:局部最小值和鞍点、批次、学习率、损失函数等。接着对几种原因进行分析并找出解决办法。本周以机器学习的基本框架为主体逐步分析,旨在于找到最好的训练效果,其中optimization比较复杂。

2024-07-13 14:17:18 812 1

原创 第二周:李宏毅机器学习

本周以宝可梦为例,学习了回归和分类的基本步骤。在线性回归模型的改进中,利用正则化解决了过拟合的问题;在分类任务中,建立了概率生成模型,对模型各部分概率进行了逐步分析,提出了高斯分布和最大似然估计(模型参数估计)。最后,提出了分类任务的另一种模型是逻辑回归,将逻辑回归与线性回归进行比较,并对比了均方差和交叉熵,又将概率生成模型和逻辑回归模型进行对比,分析各自优势场景。一、线性回归通过一组数据点来拟合线性模型,以便估算目标结果标签与一个或多个特征变量之间的关系,从而预测数值。

2024-07-07 17:21:48 780

原创 第一周:李宏毅机器学习

本周基本了解了机器学习是什么并学习了其模型的训练步骤,以具体案例作分析一步步对模型进行优化并学会运用梯度下降法来找最小损失点;初步认识了神经网络与深度学习,也以具体案例介绍了深度学习的训练步骤;最后还学习了反向传播算法,并进行了手动模拟计算。:为什么要定义损失函数?:为了评估模型在训练过程中的效果,比如误差是否过大,或者是否模型过拟合。函数集(function set)就是只定义出了一个network structure,但是没有设定输入值和超参数(w、b),它包含或好或坏的function。

2024-06-30 17:36:09 977

原创 python爬虫js逆向(标准算法加密)

答:加密前的内容一致时,加密后的结果一定相同!md5在线加密网站输入加密,发现真的是md5加密(对照加密后的字符串和前面网页控制台的n(o)后的字符串是否一样)。可以看出n()函数是MD5加密函数,o则是其中的待加密字符串(仔细观察发现是数据包中的请求载荷的参数)小知识点:常见的标准算法md5(32位)、sha1(40位)这种找标准算法的方法属于投机取巧了,有些并不是标准算法,而是js混淆,那么这个时候就需要另一种方法(补代码)!!!

2024-05-25 16:38:36 2681

原创 爬虫常见报错(二)及一些思考

不是自带函数,是自定义的事件函数,它是指列表内容加载到内存中的形式。对它的理解还是太模糊!!!nodejs爬取博客园的博文 - 卡卡小狮子 - 博客园 (cnblogs.com)详细解读Jquery各Ajax函数:$.get(),$.post(),$.ajax(),$.getJSON()-腾讯云开发者社区-腾讯云 (tencent.com)

2024-05-19 17:15:33 1337 1

原创 爬虫常见报错(一)

尝试之后仍然无法解决,然后突然看到了我的headers里面的cookie字符串是乱码的,意识到了到了headers解码读取cookies的时候就已经报错,根本不是请求后返回文本的问题。一开始我以为是requests请求返回的内容编码有错误,所以在请求时添加了编码方式encoding,但是发现get方法居然没有这个参数(可能不同版本不一样把),所以我以为是写法的问题。最终把所有的内容写完后编译运行了一下,报错,搜了一下,发现是因为文件名与包的名称重复了!改一下文件名就好啦!至此,就完整的安装好了。

2024-05-16 17:02:23 747

原创 python爬虫(数据分析+批量获取图片)

第一部分吧是讲述如何爬取网页中自己想要的那部分数据,并且将数据有序的存入csv文件中;第二部分是如何批量爬取图片。其中包括一些库的导入、python的语法、正则表达式、数据处理、数据包和网页html的分析等,还有一些报错处理。写得比较杂乱,尽量理清楚。每一部分先放了效果图,然后是详细步骤。下文的用到的代码上传至百度网盘:链接:https://pan.baidu.com/s/1-lTHwLO5pwmUGpal7f7mnQ提取码:xwsp。

2024-05-15 16:33:25 2098

原创 yolov5训练数据集

yolo(you only look once)系列是目标检测的算法,可以应用在多个不同的领域,yolovx的算法不断进行改进,提高性能,增加网络的复杂度,至于具体都有哪些优缺点,还没有深究。至于为什么选择yolov5,因为它有轻量级模型大小,速度快的同时又兼备了较好的准确性。而且网上的讲解教程也很多,算是主流一点的。

2024-05-08 14:30:17 662 1

原创 如何使用anaconda来创建不同的虚拟环境及安装包的错误总结

如果不在环境变量中添加此anaconda,那么anaconda在windows的shell中便不能直接打开,会被认为“不是内部或外部命令”,而可用的方法就是进入anaconda的shell中再执行conda命令。以下name的位置换成自己给该虚拟环境起的名字,version的位置换成需要的python版本,比如3.9、3.7等等。可能是由于网络的问题,使用以下源再次安装,一般都可以解决(注:以下的package的地方换成自己需要安装的包)以下name的位置换成想要卸载的虚拟环境的名称。

2024-05-07 21:54:31 726

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除