自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(26)
  • 收藏
  • 关注

原创 关系模型

信息世界:用概念模型表示对现实世界的抽象与模拟计算机世界:用DBMS支持的数据模型表现信息世界对应概念模型计算机世界对应数据模型数据模型术语:概念模型:是一种独立与计算机系统的数据模型,只是用来描绘某个特定环境下,特地给系统中,特定需求对象所关系的客观存在的信息结构概念模型通常是E-R模型、扩充 的E-R模型来表示概念模型的相关术语:实体:客观存在且相互区别的事物...

2019-01-18 21:20:00 508

原创 数据库基本概念

数据库的定义:以一定组织方式将相关数据组织在一起,长期存放在计算机内可为多个用户共享,与应用程序彼此独立,统一管理的数据集合数据库是数据库系统的核心部分,是数据库管理系统的管理对象。数据库管理系统:DBMS用户和操作系统之间,具有数据定义,管理和操纵功能的软件的集DBMS子语言:DDL数据定义语言           DML数据操纵语言DCL数据控制语言 数据库系统DB...

2019-01-17 23:11:15 153

原创 相关系数和协方差

import pandas as pdimport numpy as npimport pandas_datareader.data as webimport matplotlib as mplimport matplotlib.pyplot as pltfrom pandas import Series,DataFrame'''all_data={}for ticker in ['...

2018-11-22 23:16:27 185

原创 排序排名

data.iloc[0:100,:]  # ',' 前的部分标明选取的行,‘,’后的部分标明选取的列# -*- coding: utf-8 -*-"""Created on Fri Nov  9 23:16:18 2018@author: fengjuan"""import pandas as pdimport numpy as npfrom numpy import nan...

2018-11-10 00:33:05 135

原创 dataframe-4

# -*- coding: utf-8 -*-"""Created on Wed Nov  7 22:03:33 2018@author: fengjuan"""import pandas as pdimport numpy as npfrom numpy import nan as NaNimport reimport matplotlib as mplimport mat...

2018-11-07 23:20:46 106

原创 python-dataframe

frame=DataFrame(np.arange(9).reshape((3,3)),index=['a','c','d'],                columns=['Ohio','Texas','California'])#print(frame)'''   Ohio  Texas  Californiaa     0      1           2c     3  ...

2018-11-06 22:10:43 347

原创 python之dataframe

# -*- coding: utf-8 -*-"""Created on Sat Nov  3 09:45:49 2018@author: fengjuan"""import pandas as pdimport numpy as npfrom pandas import Series,DataFramedata={'state':['Ohio','Ohio','Ohio','...

2018-11-06 18:32:09 158

原创 Pandas 数据结构之Series

# -*- coding: utf-8 -*-"""Created on Fri Nov  2 18:17:02 2018@author: fengjuan"""import pandas as pdimport numpy as npfrom pandas import Series,DataFrameobj=Series([4,7,-5,3])#print(obj)#Ser...

2018-11-03 09:45:25 109

原创 python-数组

# -*- coding: utf-8 -*-"""Created on Wed Oct 24 23:06:17 2018@author: fengjuan"""import numpy as np from numpy.random import randn,randintimport pandas as pdimport matplotlib.pyplot as pltfr...

2018-10-24 23:51:25 97

原创 python-数组3

#利用数组进行数据处理points=np.arange(-5,5,0.01)#1000个间隔相等的点xs,ys=np.meshgrid(points,points)#np.meshgrid产生两个二维数组#print('this is xs',xs)#print('this is ys:',ys)import matplotlib.pyplot as pltz=np.sqrt(xs*...

2018-10-23 23:29:18 175

原创 python-数组-2

#花式索引,将数据赋值到新数组中。'''arr=np.empty((8,4))print(arr)for i in range(8):    arr[i]=iprint(arr)brr=arr[[4,0,3,5]]brr1=arr[[-5,-6,-7]]#print(brr)'''#4,0,3,5就是每行开头的数字'''结果:[[4. 4. 4. 4.] [0. 0. 0....

2018-10-22 20:50:17 1357

原创 python-数组-1

# -*- coding: utf-8 -*-"""Created on Sat Oct 20 10:04:22 2018@author: fengjuan"""import numpy as npfrom numpy.random import randn'''arr=np.array([1,2,3,4,5])#print(arr.dtype)float_arr=arr.a...

2018-10-20 23:58:15 182

原创 PYTHON

# -*- coding: utf-8 -*-"""Created on Thu Oct 18 20:44:11 2018@author: fengjuan"""# -*- coding: utf-8 -*-"""Created on Wed Oct 17 09:13:26 2018@author: fengjuan"""import pandas as pd

2018-10-19 18:18:27 180

原创 python-基础

# -*- coding: utf-8 -*-"""Created on Thu Oct 18 20:44:11 2018@author: fengjuan"""# -*- coding: utf-8 -*-"""Created on Wed Oct 17 09:13:26 2018@author: fengjuan"""import pandas as pd

2018-10-18 23:15:50 147

原创 python-MovieLen数据集

# -*- coding: utf-8 -*-"""Created on Tue Oct 16 17:12:28 2018@author: fengjuan"""import pandas as pd#将各个表分别读到pandas Dataframe中unames=['user_id','gender','age','occupation','zip']users=pd.read...

2018-10-17 13:27:33 754

原创 python-基础

path='E:/python/pydata-book-2nd-edition/datasets/bitly_usagov/example.txt'print(open(path).readline())import jsonpath='E:/python/pydata-book-2nd-edition/datasets/bitly_usagov/example.txt'records=...

2018-10-15 23:15:24 145

原创 集成分类器-泰坦尼克号数据

集成分类器:综合考虑多个分类器的预测结果,从而做出决策。这种综合考虑一般分为两种:1、利用相同的巡数据同时搭建多个独立的分类模型,然后通过投票的方式,以少数服从多数的元组做出最终的分类决策。代表:随机森林分类器。2、按一定次序搭建多个分类模型,这些模型之间彼此存在依赖关系。每个后续模型的加入都要求对于现有集成模型的综合性能有所贡献,进而不短提升更新过后的集成模型的性能。代表:梯度提升决...

2018-10-14 13:54:22 387

原创 决策树

LogisticRegression和SVM都在某种程度上要求,被学习的数据特征和目标之间满足线性假设。决策树是描述非线性关系的不二选择。决策树节点代表数据特征,如年龄,身份是否为学生,信用评级等等,每个节点下的分支待变对应特征值的分类,如年龄包括年轻人,中年人,老年人,身份是否是学生等等。决策树的叶子节点代表模型的决策结果。# -*- coding: utf-8 -*-"""Cr...

2018-10-14 11:44:53 112

原创 Tableau----1

数据:全球超市数据(  Excel 文件)  数据的形状类似数据库表:第一行包含列标题。   该数据集包含购买具体产品的客户交易。       在“数据源”页面上,  从这里,可以选择使用哪些工作表或表格。 把“订单”拖到画布中。  如果要从这个数据源调出更多信息,只需将其他表拖至画布。  如果有位于另一个数据源的相关数据,我们可以单击“添加”,通过添加连接来创建整合式数据 源。...

2018-10-13 23:32:57 263

原创 K-近邻算法-iris数据集

# -*- coding: utf-8 -*-"""Created on Sat Oct 13 19:26:26 2018@author: fengjuan"""'''K-近邻算法与其他模型最大不同在于该模型没有参数训练过程,即,没有通过任何学习算法训练数据而且只是根据测试样本在训练数据的分布直接做出分类决策,因此k-近邻属于无 参数模型中非常简答的一种'''#使用加载器读取数...

2018-10-13 20:03:17 2216

原创 朴素贝叶斯模型

# -*- coding: utf-8 -*-"""Created on Sat Oct 13 13:12:52 2018@author: fengjuan"""#朴素贝叶斯模型有着广泛的实际应用环境,特别是在文本分类处理中#从sklearn.datasets导入新闻数据加载器from sklearn.datasets import fetch_20newsgroups#fr...

2018-10-13 19:25:13 95

原创 svm实现sciki-learn内部手写体分类

# -*- coding: utf-8 -*-"""Created on Sat Oct 13 10:25:38 2018@author: fengjuan"""#从sklearn.datasets导入数字加载器from sklearn.datasets import load_digitsfrom sklearn.cross_validation import train_tes...

2018-10-13 12:37:13 221

原创 python良\恶性肿瘤预测-LogisticRegression以及SGDClassifier

# -*- coding: utf-8 -*-"""Created on Fri Oct 12 16:56:56 2018@author: fengjuan"""import pandas as pdimport numpy as np#导入matplotlib工具包的pyplot并简称为plt#import matplotlib.pyplot as plt#df_train...

2018-10-13 10:16:29 756 2

原创 基础-3

根据目标预测变量的类型不同,将监督学习的认为答大体分为分类学习与回归预测两类。监督学习的基本框架和流程:准备数据---抽取特征,形成特征向量-----将特征向量及对应的标记/目标一并送入学习算法,训练出预测模型-----采用相同的特征抽取方法作用于新测试数据得到用于测试的特征想了---------用预测模型对待测试特征向量进行预测并得到结果。二分类:判断是非多分类:多个类别中选一个...

2018-10-13 10:12:36 143

原创 python良/恶性肿瘤预测问题运行代码

"""Created on Fri Oct 12 13:26:50 2018@author: fengjuan"""import pandas as pdimport numpy as np#导入matplotlib工具包的pyplot并简称为pltimport matplotlib.pyplot as pltdf_train=pd.read_csv('Breast-Cancer...

2018-10-12 16:09:45 881

原创 EMD

线性模型包括ARAM(ARMA 模型(Auto-Regressive and Moving Average Model)是研究时间序列的重要方法,由自回归模型(简称AR模型)与滑动平均模型(简称MA模型)为基础“混合”构成。在市场研究中常用于长期追踪资料的研究,如:Panel研究中,用于消费行为模式变迁研究;在零售研究中,用于具有季节变动特征的销售量、市场规模的预测等。)、ARCH(ARCH模型(

2017-11-26 01:21:34 1534

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除