自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

既是0也是1的寻道书生

诸天炁荡荡,我道日兴隆。

原创 电商产品评论的数据情感分析python代码实现

步骤1:从爬取的数据中提取对应的评论信息 #-*- coding: utf-8 -*- import pandas as pd inputfile = '.../huizong.csv' #评论汇总文件 outputfile = '.../meidi_jd.txt&...

2018-10-04 10:36:01 6629 11

原创 电商产品评论数据情感分析

背景与挖掘目标 在这种电商平台激烈竟争的大背景下除了提高商品质量、压低商品价格之外,了解更多消费者的心声对于电商平台来说也变得越来越有必用,其中非常重要的方式就是对消费者的文本评论数据进行内在信息的数据挖掘分析。 对某平台的热水器评沦进行文本挖掘分析本次数据挖掘建模目标如下: 分析某一品牌热水器...

2018-10-04 09:48:59 8646 4

原创 数据分析之数据预处理

数据预处理的主要内容包括数据清洗、数据集成、数据变换和数据规约。 数据清洗 数据清洗主要是删除原始数据集的无关数据、重复数据,平滑噪声数据,筛选掉与挖掘主题无关的数据,处理缺失值、异常值等. 缺失值处理 处理缺失值的方法可分为3类: 删除记录 数据插补 不处理 如果存在大量缺失的列,可以采用删...

2018-10-04 09:26:03 1370 0

原创 数据分析之数据探索

数据探索 解决的问题: 样本数据集的数量和质量是否满足模型构建的要求? 是否出现从未设想过的数据状态? 其中有没有么明显的规律和趋势? 各因素之间有什么样的关联性? 数据质量分析: 对缺失值、异常值、不一致值、重复数据及其含有特殊符号的数据 缺失值分析: 产生的原因: 有些信息暂时无法获取,...

2018-10-03 22:52:43 397 0

原创 python基础库之Pandas

运行环境:win10 64位 py 2.7 pycharm 2018.1.1 #!/usr/bin/python # -*- coding:utf-8 -*- from pandas import Series,DataFrame import pandas as pd import nump...

2018-09-09 19:37:22 239 0

原创 python基础库之Numpy

运行环境:win10 64位 py 3.6 pycharm 2018.1.1 #!/usr/bin/python # -*- coding:utf-8 -*- import numpy as np # 一维数组 a = np.arange(100) print(a) print(a.dty...

2018-09-09 17:38:35 190 0

原创 机器学习之特征工程

1、特征工程是什么 特征工程就是一个把原始数据转变成特征的过程,这些特征可以很好的描述这些数据,并且利用它们建立的模型在未知数据上的表现性能可以达到最优(或者接近最佳性能)。从数学的角度来看,特征工程就是人工地去设计输入变量X。 其本质是一项工程活动,目的是最大限度地从原始数据中提取特征以供算法...

2018-08-05 15:32:18 225 0

原创 机器学习解决问题的流程

了解场景和目标 对要解决的问题做具体分析,理解业务场景,这种场景中的常用模型。 了解评估准则 最终的目标是从准确率还是召回率方向(打个比方)做为模型的评估标准 认识数据 了解数据是否平衡,类型,结构,关联关系 数据预处理(清洗,调权) 类型转化,缺失值处理,标准化或者归一化,one-hot ...

2018-08-05 11:10:33 190 0

原创 机器学习房价预测模改进

运行环境:win10 64位 py 2.7 pycharm 2018.1.1 #!/usr/bin/python # -*- coding:utf-8 -*- import numpy as np import pandas as pd import matplotlib.pyplot as...

2018-08-05 00:07:25 480 0

原创 机器学习简单房价预测模型

运行环境:win10 64位 py 2.7 pycharm 2018.1.1 #!/usr/bin/python # -*- coding:utf-8 -*- import numpy as np import pandas as pd train_df = pd.read_csv(...

2018-08-04 17:45:38 1605 0

原创 机器学习模型评估、选择与验证

运行环境:win10 64位 py 3.6 pycharm 2018.1.1 from sklearn.metrics import zero_one_loss # 0-1损失函数 y_true = [1,1,1,1,1,0,0,0,0,0] y_pred = [0,0,0,1,1,1,1,...

2018-07-29 10:09:05 341 0

原创 机器学习数据预处理

运行环境:win10 64位 py 3.6 pycharm 2018.1.1 from sklearn.preprocessing import Binarizer #二元化 X = [ [1,2,3,4,5], [5,4,3,2,1], [3,3,3,3,3],...

2018-07-29 09:48:33 230 0

原创 python 集成学习 RandomForestClassifier,RandomForestRegressor 模型

运行环境:win10 64位 py 3.6 pycharm 2018.1.1 import matplotlib.pyplot as plt import numpy as np from sklearn import datasets,cross_validation,ensemble,n...

2018-07-26 23:18:39 1728 0

原创 python 集成学习 GradientBoostingClassifier,GradientBoostingRegressor 模型

运行环境:win10 64位 py 3.6 pycharm 2018.1.1 import matplotlib.pyplot as plt import numpy as np from sklearn import datasets,cross_validation,ensemble,n...

2018-07-26 22:55:55 5531 0

原创 python 集成学习 AdaBoostClassifier,AdaBoostRegressor模型

运行环境:win10 64位 py 3.6 pycharm 2018.1.1 import matplotlib.pyplot as plt import numpy as np from sklearn import datasets,cross_validation,ensemble,n...

2018-07-26 22:23:29 1855 0

原创 python 多层神经网络与线性不可分数据

运行环境:win10 64位 py 3.6 pycharm 2018.1.1 from matplotlib import pyplot as plt from mpl_toolkits.mplot3d import Axes3D import numpy as np from sklearn ...

2018-07-08 11:43:09 250 0

原创 python 人工神经网络模型

运行环境:win10 64位 py 3.6 pycharm 2018.1.1 from matplotlib import pyplot as plt from mpl_toolkits.mplot3d import Axes3D import numpy as np from sklearn....

2018-07-08 11:36:10 437 0

原创 python SVM 非线性分类模型

运行环境:win10 64位 py 3.6 pycharm 2018.1.1 import matplotlib.pyplot as plt import numpy as np from sklearn import datasets,linear_model,cross_validati...

2018-07-08 10:57:33 1913 0

原创 python SVM 线性分类模型

运行环境:win10 64位 py 3.6 pycharm 2018.1.1 导入对应的包和数据 import matplotlib.pyplot as plt import numpy as np from sklearn import datasets,linear_model,cros...

2018-07-08 10:42:57 1772 0

原创 python 聚类与EM算法模型

运行环境:win10 64位 py 3.6 pycharm 2018.1.1 import numpy as np import matplotlib.pyplot as plt from sklearn.datasets.samples_generator import make_blob...

2018-07-08 10:08:12 1282 0

原创 python 数据降维PCA,KernelPCA模型

运行环境:win10 64位 py 3.6 pycharm 2018.1.1 import numpy as np import matplotlib.pyplot as plt from sklearn import datasets,decomposition,manifold def...

2018-06-19 23:19:43 2334 2

原创 python K近邻法KNeighborsClassifier,KNeighborsRegressor模型

运行环境:win10 64位 py 3.6 pycharm 2018.1.1 import numpy as np import matplotlib.pyplot as plt from sklearn import neighbors,datasets,cross_validation ...

2018-06-19 23:01:42 2412 0

原创 python贝叶斯分类器GaussianNB

运行环境:win10 64位 py 3.6 pycharm 2018.1.1 from sklearn import datasets,cross_validation,naive_bayes import numpy as np import matplotlib.pyplot as plt ...

2018-06-13 23:15:59 3719 0

原创 python决策树DecisionTreeClassifier模型

运行环境:win10 64位 py 3.6 pycharm 2018.1.1 import numpy as np from sklearn.tree import DecisionTreeClassifier from sklearn import cross_validation ...

2018-06-13 23:00:31 2224 0

原创 python决策树DecisionTreeRegressor模型

运行环境:win10 64位 py 3.6 pycharm 2018.1.1 import numpy as np from sklearn.tree import DecisionTreeRegressor from sklearn import cross_validation impo...

2018-06-13 22:54:43 2645 0

原创 python线性回归模型之LogisticRegression,LinearDiscriminantAnalysis模型

运行环境:win10 64位 py 3.6 pycharm 2018.1.1 import matplotlib.pyplot as plt import numpy as np from sklearn import datasets,linear_model,discriminant_ana...

2018-06-09 10:02:19 498 0

原创 python线性回归模型之LinearRegression,Ridge,Lasso,ElasticNet模型

运行环境:win10 64位 py 3.6 pycharm 2018.1.1 import matplotlib.pyplot as plt import numpy as np from sklearn import datasets,linear_model,discriminant_ana...

2018-06-09 09:28:00 872 2

原创 机器学习之线性回归模型相关算法推导

把学习过程中的一些算法推导贴出来

2018-05-13 21:33:43 160 0

原创 python提升81-100

81.809*??=800*??+9*?? 其中??代表的两位数, 809*??为四位数,8*??的结果为两位数,9*??的结果为3位数。求??代表的两位数,及809*??后的结果。 for i in range(10,101): if 809 * i == 800 * i + 9 * i...

2018-05-12 09:27:35 193 0

原创 python提升61-80

61.打印出杨辉三角形(要求打印出10行) n = 10 def lst(i, j): if i == j or j == 1: return 1 else: return lst(i-1, j-1) + lst(i-1, j) for i in r...

2018-05-12 09:26:16 128 0

原创 python提升41-60

41.模仿静态变量的用法。 class foo: def __init__(self, n=0): self.n = n def __call__(self, i): self.n += i return self.n a=foo() print a(1) prin...

2018-05-12 09:25:00 159 0

原创 python提升21-40

21.猴子吃桃问题:猴子第一天摘下若干个桃子,当即吃了一半,还不瘾,又多吃了一个第二天早上又将剩下的桃子吃掉一半,又多吃了一个。以后每天早上都吃了前一天剩下的一半零一个。到第10天早上想再吃时,见只剩下一个桃子了。求第一天共摘了多少。 def taozi(n): if n == 1: ...

2018-05-12 09:23:56 129 0

原创 python提升1-20

1.有四个数字:1、2、3、4,能组成多少个互不相同且无重复数字的三位数?各是多少? for i in range(1, 5): for j in range(1, 5): for k in range(1, 5): if i != k and i ...

2018-05-12 09:22:02 206 0

原创 Linux环境下java后台获取外网IP

项目测试时有测试ip,之后给分配公网ip.那么怎么获取公网ip呢 通过一个网络代理去获取对应的信息,返回的是一个Json,需要建立一个类接收,之后在取出来 代码 接收的类 import java.io.Serializable; public class IpMessage implem...

2018-03-29 17:35:12 917 1

原创 Apache Shiro进行权限认证

权限认证核心要素 权限认证,也就是访问控制,即在应用中控制谁能访问哪些资源。在权限认证中,最核心的三个要素是:权限,角色和用户: 权限(permission):即操作资源的权利,如访问某个url,对某个模块数据进行增删改查 角色(role):权限的集合,一种角色可以包含多种权限。例如操作员...

2018-03-05 21:19:49 111 0

原创 Apache Shiro进行身份验证

Apache Shiro是一个强大易用的Java安全框架,提供了认证、授权、加密和会话管理功能,可为任何应用提供安全保障。 Shiro中可以在.ini文件中指定一个认证主体,也可以从数据库中取,这里使用.ini文件来写一个简单的认证主体: [users] test=123456 这里指定...

2018-03-05 20:05:41 83 0

原创 apache上shiro的开源项目

shiro:http://svn.apache.org/repos/asf/shiro/

2018-03-03 20:24:20 264 0

原创 oracle权限语句大全

1.系统默认的几个用户: sys ——–网络管理用户,具有最高数据库管理权限 system——本地管理用户,权限次于sys scott——-普通用户,默认是锁住的(不可用) 默认情况下:scott 密码是 tiger (自己设定) sys 密码是安裝的时候输入的密码 s...

2018-03-03 15:04:37 1357 0

原创 Json工具类

Json工具类 import java.util.List; import com.fasterxml.jackson.core.JsonProcessingException; import com.fasterxml.jackson.databind.JavaType; import ...

2018-02-25 23:24:28 106 0

原创 Jedis的代码测试

封装代码测试 @Test public void testJedisClient() throws Exception { //初始化Spring容器 ApplicationContext applicationContext = new ClassP...

2018-02-25 22:45:44 107 0

提示
确定要删除当前文章?
取消 删除