python
文章平均质量分 72
??(lxy)
这个作者很懒,什么都没留下…
展开
-
爬虫基础入门(一)——爬虫基础
学习网络爬虫不仅需要python基础,还需要对网络、HTTP、网页、爬虫原理等有一个全方位的认识。然鹅很多大佬的文章都是直接讲库和代码,对于非计算机专业、网页零基础的本菜鸟来说,真的是一头雾水。所以还是乖乖刨了本书来补些基础,这篇文章就作为自己的入门笔记啦。边学边粗糙记录一下。1 爬虫基础1.1 HTTP基本原理参考:(14条消息) HTTP基本原理(简介)_Robin Hu的专栏-CSDN博客_http原理在了解HTTP之前,科普一些名词:1.1.1 URI和URLURL是统一资源原创 2021-07-28 11:08:24 · 527 阅读 · 1 评论 -
特征工程中常用技术所涉及到的方法——特征选择、降维和不平衡数据处理
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档目录文章目录前言一、特征选择二、降维常见降维方法三、不均衡数据处理总结前言随着信息时代数据量的快速增加,一门通过对大量数据进行分析,以发现和提取隐含在其中的具有价值的信息和知识的学科——数据挖掘发展起来提示:以下是本篇文章正文内容,主要介绍特征工程中常用技术所涉及到的方法,特征选择、降维和不平衡数据处理一、特征选择概念:特征选择是从原始特征中挑选出一组最有代表性、分类性能好的特征子集.原创 2021-05-23 18:55:49 · 1138 阅读 · 1 评论 -
数据挖掘(二)——Python加载数据实操
数据挖掘——Python加载数据实操来源:数据挖掘实验;实验环境:jupyter主要内容:基于python中klearn的自带小数据读取,以及生成自定义分类数据并实现数据可视化。第一部分:读取四个klearn中自带的的数据集,并进行查看以及简单拟合模型。第二部分:生成自定义分类数据并实现数据可视化。备注:Scikit-learn(sklearn)是机器学习中常用的第三方模块,围绕机器学习提供了很多课直接调用的机器学习算法以及经典的数据集,对常用的机器学习方法进行了封装,是一种简单高效原创 2021-05-21 16:09:00 · 1307 阅读 · 0 评论 -
数据挖掘(一)——numpy入门操作
Numpy实操一、numpy库的导入和常用操作import numpy as npprint(np.zeros([2,2]))#生成全零数组print(np.ones([2,2]))#生成全1数组print(np.eye(2))#创建对角矩阵print(np.empty([3,3]))print(np.full([3,3],6))print(np.linspace(0,100,10))输出:[[0.00000000e+000 0.00000000e+000原创 2021-05-20 16:04:11 · 46 阅读 · 0 评论