- 博客(6)
- 资源 (2)
- 收藏
- 关注
原创 Python爬虫实例(二)爬取数据后并入excel
报错:Module Not Found Error: No module named 'openpyxl'则下载openpyxl模块,pip install openpyxl源码:import requestsfrom lxml import etreeimport pandas as pd#设置请求头headers = { 'User-Agent':'Mozilla...
2019-11-29 16:23:14 1537
原创 Python爬虫实例(一)使用request+lxml模块抓取豆瓣top250电影名
## 一、requests模块 get请求豆瓣网,获取不到任何数据在发起请求之前首先要注意是否是get请求,请求头信息都有哪些,是否有cookie。把user-agent也进header中## 二、在使用range()函数时a = list(range(开始,末尾,步数))## 三、源码```import requestsfrom lxml import etree...
2019-11-29 15:16:03 1035
原创 数据挖掘与知识发现课后习题答案
2、给出一个将关联规则应用于互联网上的例子。购物分析,通过关联规则推荐与购买物品置信度较高的物品。3、指出Apriori算法的性能瓶颈。一是由于对海量数据库的多趟扫描,另一个是用JOIN运算产生潜在频繁项集。4、指出采用FP_tree结构的优缺点。优点:在完备性方面,它不会打破交易中的任何模式,而且包含了挖掘序列模式所需的全部信息;在紧密性方面,它剔除不想关信息,不包含非频繁项
2017-12-23 18:45:55 6861 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人