财政收入影响因素分析和预测模型 描述:采用数据挖掘算法中人工神经网络算法,首先用Adaptive—Lasso方法找出相关性最大的因素,根据现有的数据建立神经网络模型,然后对未知属性做出预测。代码:import pandas as pddef Data_pro(feature,data): data_train = data.loc[range(1994, 2014)].copy() # 取2014年前的数据建模 ...
航空公司客户价值分析 描述:采用数据挖掘算法中K-Means聚类算法,首先对数据探索,清洗,规约,然后对数据归一化处理,使用K-Means算法进行聚类分析,代码:#-*- coding:utf -8-*-import pandas as pd#对数据基本探索,返回最大最小值def Data_Explore(data): outputfile = 'F:/chapter7_explore_result....
电力切漏电用户自动识别 描述:使用数据挖掘中LM神经网络和CART决策树算法,首先分析窃漏电用户行为特征,对数据预处理,采用拉格朗日插值算法补全数据,构建专家样本,建立LM神经网络和CART决策树模型,同时画出两个模型的ROC曲线图和可视化混淆矩阵,用于评价模型优劣。代码:#将原始数据分为20%的测试样本和80%的训练样本import pandas as pdfrom random import shuffle #导...
python爬取flickr官网上图片 代码:import requestsimport urllib.requestfrom bs4 import BeautifulSoupfrom selenium import webdriverimport randomfrom selenium.webdriver.chrome.options import Optionsimport re#http请求头headers = ...
python爬取贴吧用户评论,用户名等相关信息 代码:# coding:utf-8# 引入requests请求包import requestsimport urllib# 给一个url参数 返回源代码def get_datasource(url): try: response = requests.get(url) if response.status_code == 200: ...
定向爬取新浪股票和百度股票数据 代码:import reimport requestsfrom bs4 import BeautifulSoupdef getHTMLtext(url,code = "utf-8"): try: r = requests.get(url) r.raise_for_status() r.encoding = code ...
根据搜索内容爬取招聘网的职位招聘信息 代码:import requestsfrom bs4 import BeautifulSoupimport timedef getHtml(url,code='gbk'): try: r = requests.get(url) r.raise_for_status() r.encoding = code return...
根据搜索内容爬取拉钩网和招聘网的职位招聘信息 代码:import requestsimport timeimport randomip_list = ['117.135.132.107', '121.8.98.196', '194.116.198.212']#http请求头信息headers={'Accept':'application/json, text/javascript, */*; q=0.01','Accept...
requests和beautifulSoup库爬取豆瓣各类型电影 代码:# -*-coding:utf-8-*-from selenium.webdriver.chrome.options import Optionsfrom bs4 import BeautifulSoupfrom selenium import webdriverimport reimport requestsimport timeimport jsonimport rand...
python之matplotlib库的基本操作 matplotlib库丰富的绘图功能,具体如下:#绘图import matplotlib.pyplot as plt #导入图像库plt.rcParams['font.sans-serif'] = ['SimHei'] #设置中文标签plt.rcParams['axes.unicode_minus'] = False #设置负号正常显示plt.figure(figsize = (7,
python之Pandas库的基本操作 Pandas的安装比较容易,安装好Numpy之后,可以通过pip install pandas直接或者下载源码之后安装,但是默认的Pandas还不能读写Excel文件,需要安装xlrd(读),xlwt(写)库才能支持Excel的读写,方法如下:pip install xlrd 为python添加读入Excel的功能pip install xlwt 为python添加写入Excel的功
python之Matplotlib库的简单操作 Matplotlib是最著名的会图库,主要用于二维绘图,也可以进行简单的三维绘图,安装可以通过pip install matplotlib直接安装,也可以下载源代码安装import numpy as npimport matplotlib.pyplot as plt #导入Matloptlibx = np.linspace(0,10,1000) #作图自变量y = np.sin(
python之scipy库简单操作 Scipy提供了真正的矩阵,以及大量基于矩阵运算的对象与函数,功能包含最优化,线性代数,积分,插值,拟合,特殊函数,快速傅里叶变换,信号处理和图像处理,常微分方程求解等,Scipy依赖于Numpy库,因此安装Scipy时应先安装Numpy库,Scipy安装与其他库一样,可通过pip install Scipy安装,也可以自行下载源代码,然后用pip install 路径+文件名全称(包括.后缀
python之Numpy库简单操作 在windows中,Numpy安装与其他库一样,可通过pip install numpy安装,也可以自行下载源代码,然后用pip install 路径+文件名全称(包括.后缀文件名)进行安装,源码下载链接:https://pypi.python.org/pypi/numpy/1.14.0,选择对应版本下载即可import numpy as np #一般用np作为numpy的别名a = n
查找GPA最高的学生 # 找到GPA最高的学生 class Student: def __init__(self, name, hours, qpoints): self.name = name self.hours = float(hours) self.qpoints = float(qpoints) def getName(self)