![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
爬虫
反反反反反反气旋
有点懒,稀罕吃
展开
-
基于sklearn随机森林实现东莞房价预测
== 答辩结束,记录一下觉得是毕设的一个亮点 ==以下是实现房价预测的流程图:原始数据大概如下(展示部分):在清洗之前先进行数据字段的相关系数的计算,相关度越大影响越大,对于后期建模建模分数比较有利相关系数计算:engine = create_engine("mysql+pymysql://root:root@localhost:3306/houseinfo?charset=utf8...原创 2020-04-28 00:34:22 · 2269 阅读 · 1 评论 -
selenium+pyquery爬取东莞新房以及二手房的信息
一.二手房网站:安居客工具:开发平台:pycharm,爬取工具:selenium+pyquery主要爬取信息: town:镇名,flood:小区名称,decoration装修程度,range房屋户型,built建筑年代,area 面积,floor楼层,totalPrice总价,unitprice单价 orientation 朝向难点:安居客最多只能爬取100页,所以分批爬取并且,如上图所示...原创 2019-12-04 11:55:09 · 351 阅读 · 0 评论 -
使用selenium+phantomJS爬取并截取百度图片
主要是通过pycharm中采用selenium再调用该库的phantomJS前提已经下载好相关软件(可到官网下载)代码实现# 导入 webdriverfrom selenium import webdriver# 调用键盘按键操作时需要引入的Keys包from selenium.webdriver.common.keys import Keys# 调用环境变量指定的Phanto...原创 2019-11-14 20:06:48 · 210 阅读 · 0 评论