YingWGY-CSDN博客

原创 Day2

Day2Java流程控制Scanner对象可以获取用户的输入。java.util.Scanner基本语法：Scanner s = new Scanner(System.in);通过Scanner类的next()与nextLine()方法获取输入的字符串，在读取前一般需要使用hasNext()与hasNextLine()判断是否有输入的数据。next（）：一定要读取到有效字符串后才可以结束输入对输入有效字符串之前遇到的空白，next()方法会自动去掉只有输入有效字符

2020-12-14 18:53:26 404

原创 Day1

Java复习 Day1变量可以变化的量int a = 1;int b = 2;String c = "sadasad";double pi = 3.14;变量作用域类变量实例变量局部变量public class Demo01 { //类变量 static static double salary = 2500; //属性：变量 //实例变量：从属于对象；如果不自行初始化，这个类型的默认值 0 0.0 //布尔值：默认是false

2020-12-13 16:46:03 373

原创线性回归算法梳理——Test1

关于机器学习概念监督学习输入数据被称为训练数据，它们有已知的标签或者结果，比如垃圾邮件/非垃圾邮件或者某段时间的股票价格。模型的参数确定需要通过一个训练的过程，在这个过程中模型将会要求做出预测，当预测不符时，则需要做出修改。常见的监督学习算法包括回归分析和统计分类。无监督学习输入数据不带标签或者没有一个已知的结果。通过通过推测输入数据中存在的结构来建立模型。常见的无监督学习算法有聚类。...

2019-05-13 18:37:31 794

原创使用selenium模拟登陆163邮箱

摘要这次主要是稍微学习一下selenium，并进行简单的模拟登陆。网络上有许多有意思的网站，不同类型的网站爬虫策略不同，难度也不一样。从是否要登录这方面讲，一些简单网站不需要登录就可以爬取，比如猫眼电影、豆瓣250榜单等。还有一些是需要先登录才能爬取，比如微信、知乎、学校的教务系统等。selenium是一个自动化测试工具，利用它可以驱动浏览器执行特定的动作，如点击、下拉等操作，同时还可以获取浏...

2019-04-11 18:32:23 7108 11

原创爬虫练手——使用Beautiful Soup、XPath分别获取丁香园论坛回复内容

简单整点吧简单的说，Beautiful Soup就是Python的一个html或xml的解析库，可以用来从网页中提取数据。BeautifulSoup在解析时实际上以来解析器，它除了支持Python标准库中的html解析器外，还支持一些第三方解析器（比如lxml）。用法介绍就看文档和一些书籍就好了，推荐崔庆才的《 Python3网络爬虫开发实战》。再说说XPath，全称是XML Path La...

2019-04-09 14:42:50 508

原创使用request和re爬取豆瓣250排行榜信息

1.1 请求请求，也就是由客户端发出，可以分成4部分：请求方法、请求的网址、请求头、请求体。常见的请求方法有两种：GET和POST。在浏览器里直接输入URL然后回车，这就发起了一个GET请求，请求的参数会直接包含到URL里。比如百度搜索时间，就是一个GET请求，对应链接：https://www.baidu.com/s?wd=时间，参数wd就是要搜索的关键字。POST请求多数用在表单的提交...

2019-04-07 20:43:21 1552

YingWGY的博客

原创 Day2

原创 Day1

原创线性回归算法梳理——Test1

原创使用selenium模拟登陆163邮箱

原创爬虫练手——使用Beautiful Soup、XPath分别获取丁香园论坛回复内容

原创使用request和re爬取豆瓣250排行榜信息

空空如也

空空如也

原创 Day2

原创 Day1

原创 线性回归算法梳理——Test1

原创 使用selenium模拟登陆163邮箱

原创 爬虫练手——使用Beautiful Soup、XPath分别获取丁香园论坛回复内容

原创 使用request和re爬取豆瓣250排行榜信息

空空如也

空空如也

原创线性回归算法梳理——Test1

原创使用selenium模拟登陆163邮箱

原创爬虫练手——使用Beautiful Soup、XPath分别获取丁香园论坛回复内容

原创使用request和re爬取豆瓣250排行榜信息