魏小魏-CSDN博客

原创财政收入影响因素分析和预测模型

描述：采用数据挖掘算法中人工神经网络算法，首先用Adaptive—Lasso方法找出相关性最大的因素，根据现有的数据建立神经网络模型，然后对未知属性做出预测。代码：import pandas as pddef Data_pro(feature,data): data_train = data.loc[range(1994, 2014)].copy() # 取2014年前的数据建模 ...

2018-04-30 21:40:34 6223 6

原创航空公司客户价值分析

描述：采用数据挖掘算法中K-Means聚类算法，首先对数据探索，清洗，规约，然后对数据归一化处理，使用K-Means算法进行聚类分析，代码：#-*- coding:utf -8-*-import pandas as pd#对数据基本探索，返回最大最小值def Data_Explore(data): outputfile = 'F:/chapter7_explore_result....

2018-04-30 21:38:16 720

描述：使用数据挖掘中LM神经网络和CART决策树算法，首先分析窃漏电用户行为特征，对数据预处理，采用拉格朗日插值算法补全数据，构建专家样本，建立LM神经网络和CART决策树模型，同时画出两个模型的ROC曲线图和可视化混淆矩阵，用于评价模型优劣。代码：#将原始数据分为20%的测试样本和80%的训练样本import pandas as pdfrom random import shuffle #导...

2018-04-30 21:36:31 795

原创 python爬取flickr官网上图片

代码：import requestsimport urllib.requestfrom bs4 import BeautifulSoupfrom selenium import webdriverimport randomfrom selenium.webdriver.chrome.options import Optionsimport re#http请求头headers = ...

2018-04-30 21:33:19 7369 1

原创 python爬取贴吧用户评论，用户名等相关信息

代码：# coding:utf-8# 引入requests请求包import requestsimport urllib# 给一个url参数返回源代码def get_datasource(url): try: response = requests.get(url) if response.status_code == 200: ...

2018-04-30 21:32:01 3347 1

原创定向爬取新浪股票和百度股票数据

代码：import reimport requestsfrom bs4 import BeautifulSoupdef getHTMLtext(url,code = "utf-8"): try: r = requests.get(url) r.raise_for_status() r.encoding = code ...

2018-04-30 21:30:07 2124

原创根据搜索内容爬取招聘网的职位招聘信息

代码：import requestsfrom bs4 import BeautifulSoupimport timedef getHtml(url,code='gbk'): try: r = requests.get(url) r.raise_for_status() r.encoding = code return...

2018-04-30 21:26:03 476

原创根据搜索内容爬取拉钩网和招聘网的职位招聘信息

代码：import requestsimport timeimport randomip_list = ['117.135.132.107', '121.8.98.196', '194.116.198.212']#http请求头信息headers={'Accept':'application/json, text/javascript, */*; q=0.01','Accept...

2018-04-30 21:24:16 728

原创 requests和beautifulSoup库爬取豆瓣各类型电影

代码：# -*-coding:utf-8-*-from selenium.webdriver.chrome.options import Optionsfrom bs4 import BeautifulSoupfrom selenium import webdriverimport reimport requestsimport timeimport jsonimport rand...

2018-04-30 21:21:26 1033

原创 python之matplotlib库的基本操作

matplotlib库丰富的绘图功能，具体如下：#绘图import matplotlib.pyplot as plt #导入图像库plt.rcParams['font.sans-serif'] = ['SimHei'] #设置中文标签plt.rcParams['axes.unicode_minus'] = False #设置负号正常显示plt.figure(figsize = (7,

2018-02-07 17:22:25 945

原创 python之Pandas库的基本操作

Pandas的安装比较容易，安装好Numpy之后，可以通过pip install pandas直接或者下载源码之后安装，但是默认的Pandas还不能读写Excel文件，需要安装xlrd（读），xlwt（写）库才能支持Excel的读写，方法如下：pip install xlrd 为python添加读入Excel的功能pip install xlwt 为python添加写入Excel的功

2018-01-16 17:43:07 1148

原创 python之Matplotlib库的简单操作

Matplotlib是最著名的会图库，主要用于二维绘图，也可以进行简单的三维绘图，安装可以通过pip install matplotlib直接安装，也可以下载源代码安装import numpy as npimport matplotlib.pyplot as plt #导入Matloptlibx = np.linspace(0,10,1000) #作图自变量y = np.sin(

2018-01-16 17:27:33 756

原创 python之scipy库简单操作

Scipy提供了真正的矩阵，以及大量基于矩阵运算的对象与函数，功能包含最优化，线性代数，积分，插值，拟合，特殊函数，快速傅里叶变换，信号处理和图像处理，常微分方程求解等，Scipy依赖于Numpy库，因此安装Scipy时应先安装Numpy库，Scipy安装与其他库一样，可通过pip install Scipy安装，也可以自行下载源代码，然后用pip install 路径+文件名全称（包括.后缀

2018-01-15 11:14:09 4567

原创 python之Numpy库简单操作

在windows中，Numpy安装与其他库一样，可通过pip install numpy安装，也可以自行下载源代码，然后用pip install 路径+文件名全称（包括.后缀文件名）进行安装，源码下载链接：https://pypi.python.org/pypi/numpy/1.14.0，选择对应版本下载即可import numpy as np #一般用np作为numpy的别名a = n

2018-01-15 11:07:34 537

原创查找GPA最高的学生

# 找到GPA最高的学生 class Student: def __init__(self, name, hours, qpoints): self.name = name self.hours = float(hours) self.qpoints = float(qpoints) def getName(self)

2018-01-13 16:42:48 1138