![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Python
Chemlez
学生党一枚~ 个人主页(文章首发地址):https://www.chemlez.cn/
展开
-
2020考研如此激烈,还怕获得不了最新的调剂信息么?来对小木虫考研调剂信息爬取
title: 对小木虫考研调剂信息的爬取categories:[Python,爬虫]tags:爬虫正则表达式RequestBeautifulsouptop: ‘’thumbnail: ‘’cover: falsedate: 2020-04-09 20:15:36icons:一、说明由于国家线快出了,故写了一份爬取小木虫网站调剂信息的爬虫代码,方便信息查看。此代码...原创 2020-04-09 20:43:46 · 3347 阅读 · 2 评论 -
机器学习-特征工程之数据预处理
在上一节中的泰坦尼克号入门案例的数据预处理过程中,出现了数据不完整、数据的编码(数值转化),即将非结构化文本转化为结构化文本。本文主要用来记录在sklearn中常用的数据预处理基本方法。数据预处理从数据中检测,纠正或删除损坏,不准确或不适用于模型的记录的过程。可能面对的问题有:数据类型不同,比如有的是文字,有的是数字,有的含时间序列,有的连续,有的间断。也可能,数据的质量不行,有噪声,有异常...原创 2020-04-09 20:32:18 · 319 阅读 · 0 评论 -
一篇文章搞定Python爬虫
一、Requests库的7个主要方法方法说明requests.request()构造一个请求,支撑一下各方法的基础方法requests.get()获取HTML网页的主要方法,对应于HTTP的GETrequests.head()获取HTML网页头信息的方法,对应于HTTP的HEADrequests.post()向HTML网页提交POST请求的方法,对应...原创 2020-03-18 17:44:28 · 477 阅读 · 0 评论 -
序列之深拷贝-浅拷贝
在上周的Python科学计算课上,老师讲到了Python序列的浅拷贝以及深拷贝方面的知识,个人觉得说得比较言简意赅了,对于我这个刚入Python的新手来说,也基本可以避免今后变量的赋值使用错乱的问题。这里我们简单的将Python中的标准数据类型分为两类:不可变数据类型:int、float、string、boolean可变(组合)数据类型:列表(list)、字典(dict)、集合(set)...原创 2020-03-15 20:44:52 · 141 阅读 · 0 评论