自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

红叶谷 wsp_1138886114的博客

不想写了,佛系,躺平了...

  • 博客(26)
  • 资源 (27)
  • 收藏
  • 关注

原创 Pandas-Numpy-Matplotlib-PyEcharts——综合案例(豆瓣电影Top_250数据分析)

一、豆瓣电影数据分析 1.1 开发环境的准备 开发工具:pycharm/Anaconda5.1/Jupyter Notebook Python版本:3.6 第三方模块包: numpy 1.13.3 pandas 0.20.3 beautifulsoup4 4.6.0 ...

2018-05-31 14:30:51 7854 2

原创 matplotlib + pandas——数据可视化

一、利用pandas进行数据分析 + matplotlib进行可视化展示 1.1 第一个绘图 (原本在matplotlib中需要几段代码,在pandas中只需要一行代码) import pandas as pdimport numpy as npimport matplotlib.pyplot as plts = pd.Series( ...

2018-05-31 11:13:26 8676 2

转载 Markdown修改字体大小颜色

一、字体颜色的选择浅红色文字:<font color="#dd0000">浅红色文字:</font><br /> 深红色文字:<font color="#660000">深红色文字</font><br /&

2018-05-31 10:23:20 6254 2

原创 Python + PyEcharts——数据可视化

一、第一个PyEcharts图标 1 安装:    &a

2018-05-31 10:00:05 73075 28

原创 Matplotlib——综合演练

一、绘制三角函数 1.1快速创建三角函数: 用到了Matplotlib和numpy模块,linspace在(-π,π)之间绘制。 代码: import matplotlib.pyplot as plt import numpy as np X = np.linspace(-np.pi,np.pi,256,endpoint = True) #np...

2018-05-29 22:20:32 528

原创 聚类分析(K-means算法)

一、聚类分析1.1 聚类分析 聚类: 把相似数据并成一组(group)的方法。‘物以类聚,人以群分’ 不需要类别标注的算法,直接从数据中学习模式 所以,聚类是一种 数据探索 的分析方法,他帮助我们在大量数据中探索和发现数据结构1.2 相似度与距离度量 定义距离来度量表示相似度: 欧式距离,曼哈顿距离,闵氏距离...

2018-05-28 22:05:44 73385

原创 机器学习——支持向量机(SVM)

一、支持向量机(SVM)将两种特征用 一条直线或者平面 分开二、支持向量机算法基本原理线性(SVM):找到最好的决策边界最大化 Margin: 决策边界最近的距离最小的Margin之和最大化 非线性(SVM):低维映射到高维再处理,找到最优的三、支持向量机代码from sklearn.svm.import SVCsvc = SV...

2018-05-28 20:47:56 1079

原创 机器学习——KNN(K近邻)

一、K近邻(KNN)K Nearest Neighbors 1.1 什么是K近邻思想:只要知道你朋友(邻居)是什么人,就能知道你是什么人K近邻是一种 懒惰的学习方法:(基于实例学习)Lazy learners: instance-based learning新数据来时,才开始学习给出分类KNN 没有训练模型,训练和预测结合一起 1.2 K近邻的距离度量...

2018-05-28 20:47:24 875 1

原创 Numpy 中不常用函数(shift,count_nonzero,diag,spacing,tile/repmat)

一、加载csv数据import numpy as npclose,amount=np.loadtxt("./data.csv",delimiter=",",usecols=(6,7),unpack=True) #导入收盘价、成交量两列 # delimiter=: 分隔符 # usecols=(): 将所有获取数据的列索引放入元组中 # un

2018-05-28 18:47:44 4735

原创 机器学习——逻辑回归(logistic regression)

大家好! 此开篇第一个机器学习方法。逻辑回归一、逻辑回归原理 参数求解正则化方法: 损失函数中增加惩罚项:参数值越大惩罚越大-->让算法去尽量减少参数值二、代码示例 2.1 Scikit-Learn(SkLearn)http://scikit-learn.org/stable/index.html 代码:from sk...

2018-05-27 15:56:26 8434

原创 Matlab绘图

Matlab绘图强大的绘图功能是Matlab的特点之一,Matlab提供了一系列的绘图函数,用户不需要过多的考虑绘图的细节,只需要给出一些基本参数就能得到所需图形,这类函数称为高层绘图函数。此外,Matlab还提供了直接对图形句柄进行操作的低层绘图操作。这类操作将图形的每个图形元素(如坐标轴、曲线、文字等)看做一个独立的对象,系统给每个对象分配一个句柄,可以通过句柄对该图形元素进行操作,而...

2018-05-27 10:36:24 4437 1

原创 特征工程——特征构造

特征工程概述一、特征工程概述特征工程 = 数据准备(for 数据挖掘) 数据清洗、转换 1.1 特征工程主要内容 1.2 特征工程重要性好数据>多数据>好算法 数据和特征决定了模型预测的上限,而算法只是逼这个上限而已应用机器学习基本上就是特征工程二、特征构造的常用方法文本数据特征提取(类似茎叶图)图像数据特征提取用...

2018-05-26 17:51:47 7156 3

原创 Pandas——基础(创建与查看)

一、Pandas数据结构 1.1 pandas学习资料http://pandas.pydata.org/pandas-docs/stable/10min.html#operationhttp://pandas.pydata.org/pandas-docs/stable/api.html (API资料查询) 安装:推荐Anaconda ,关于Python数...

2018-05-26 09:34:50 1828

原创 Scipy 高级

一、scipy在线性代数应用 使用 scipy.linalg 模块提供标准线性代数运算 网址:http://docs.scipy.org/doc/scipy/reference/linalg.html#module-scipy.linalg 计算行列式函数: linalg.det(arr) 计算矩阵的逆矩阵函数:linalg.inv(arr) ...

2018-05-25 21:14:31 1385

原创 Scipy基础+进阶

Python科学计算库—Scipy一、Scipy 入门 1.1、Scipy 简介及安装官网:http://www.scipy.org/SciPy安装:在C:\Python27\Scripts下打开cmd执行:执行:pip install scipy 1.2、安装Anaconda及环境搭建(举例演示)创建环境:conda create -n env_name py...

2018-05-25 14:31:49 5605

原创 Numpy 距离公式,获取重复元素

统计列表重复元素from collections import defaultdictdd = defaultdict(list)cc = [1, 2, 3, 2, 4]for k, val in [(v, i) for i, v in enumerate(cc)]: dd[k].append(val)print('dd:',dd)# 访问dd:元素(重复)出现的...

2018-05-25 09:13:05 448

原创 Anaconda环境搭建

Anaconda环境搭建创建环境 创建命令:conda create -n env_name python=3.x #env_name :环境名 #python=2.x/3.x :指定python版本示例: conda create -n py36 python=3.6创建名py36...

2018-05-24 21:29:23 3727 1

原创 pyMongo+Excel+爬虫——练习题

一、读取MongoDB数据#encoding:utf-8from pymongo import MongoClient            class Connect():                                    #创建类并封装函数方便以后使用 def __init__(self,dbName,collectionName): self....

2018-05-24 11:48:20 471

原创 pyMySQL+Excel+爬虫——练习题

一、获取MySQL数据库数据写入excelimport pymysql                #导入pymysqlimport xlwt                   #导入xlwt#一、获取链接对象connect = pymysql.connect(host="localhost",user="root",password="password",db="db_name",c...

2018-05-24 11:47:50 784

原创 MongoDB安装及基本语法结构

一、MongoDB 数据库的特点        面向文档,模式自由        json数据模式(bson)(可以初略理解为字典)        多级引索        高可用复制集        水平扩展        跨平台、多种语言接口        弱事务类型        大数据、高并发、弱事务的web2.0互联网应用。        优点:弱一致性,文档格式存储方式,内置gridFS...

2018-05-22 16:04:46 378

原创 pymongo操作MongoDB数据库

一、python在MongoDB中插入数据        insert_one(doc)        insert_many(doc,ordered = True/False)    #批量插入            #ordered:  True,顺序插入,若第一条失败,则批量插入失败                              False,不启用顺序插入,插入失败的数据不影响其...

2018-05-22 16:03:06 2314 1

原创 pyMySQL操作MySQL数据库

一、利用pyMySQL模块操作MySQL数据库(利用MySQL connector,MySQLdb模块,torndb这三种模块不用了)安装pymysql pip install pymysql 导入模块 import pymysql 链接数据库 connect = pymysql.connect(host="localhost",user="root",passwo...

2018-05-20 16:33:16 2609

原创 python——基础题

注:部分 print 未带括号为 python 2.x 版本。一、中文编码问题import jsondict1 = {'School':'zhoubei','Name': '张三', 'Age': 7, 'Class': '第一班'}print dict1['School']print json.dumps(dict1).decode('unicode-escape')...

2018-05-20 11:29:32 1959

原创 python文件读写 open(),with open(),write(),with write()—数据持久化

open()open(file, mode='r', buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None)# 默认读取整个文件,即:所有字符f = open('C:/Users/xxx/Desktop/测试读取文件.txt', 'r')print(f.read())f....

2018-05-20 11:05:27 10381

原创 MySQL语法结构--数据库的管理

MySQL的语法结构一、基本语法格式​    登陆MySQL                    mysql -h localhost -P 3306 -u root -p                                          mysql -u root -p(本机登录时可用)    查看数据库                     show databases; ...

2018-05-17 17:37:46 532

原创 python入门基础--数据类型--循环控制--函数--OOP

一、Python基本数据类型 集合,数字,字符串,列表,元组,字典(集合几人捏圆子) python基本数据类型:number, None, bool, str python容器类型: list, tuple, dict...

2018-05-17 08:34:21 920

goturn-files.7z

模型文件:GOTURN模型–视频对象跟踪模型 使用方法查看文档:https://wangsp.blog.csdn.net/article/details/120260258

2021-09-17

google_class.7z

模型文件:GoogleNet数据模型为例,实现对图像常见分类模型支持1000种常见图像分类模型 使用方法查看文档:https://wangsp.blog.csdn.net/article/details/120260258

2021-09-17

face_detector_检测模型.7z

使用tensorflow的人脸检测模型:模型文件与配置文件。 使用方法查看文档:https://wangsp.blog.csdn.net/article/details/118732135

2021-09-17

华为通用表格识别格式化成excel

调用华为OCR通用表格后,将批量json文件转成excel。里面包含文件(demo_01.py,huawei_table2excel..so,huawei_table2excel.pyd)一个是win平台,一个是linux平台

2020-03-20

LC算法python实现.zip

里面共三个文件:demo_LC.cp36-win_amd64.pyd;readme.txt;test.py。使用方法在readme文件中。 源代码:https://blog.csdn.net/wsp_1138886114/article/details/102966403 参考代码:https://blog.csdn.net/wsp_1138886114/article/details/102560328

2019-11-08

psf2otf_circShift函数.zip

这是psf2otf的python实现方法。关于详情请查看文章:https://blog.csdn.net/wsp_1138886114/article/details/95024180。

2019-07-23

CT肺结节权重和临时数据

包含权重文件:unet.hd5;3dcnn.hd5。和处理的临时文件temp_dir

2019-02-19

基于RFM模型实现的零售精准营销响应预测系统代码

包含4个文件:1_从交易数据中提取RFM特征.ipynb,2_客户RFM分析.ipynb,3_响应预测模型训练和选择.ipynb,4_模型部署和应用.ipynb

2019-02-15

基于RFM模型实现的零售精准营销响应预测系统数据

基于RFM模型实现的零售精准营销响应预测系统数据:Retail_Data_Response.csv:customer_id,response Retail_Data_Transactions.csv:customer_id,trans_date,tran_amount

2018-11-01

爬虫获取的数据,一些可能能用的ip地址,化学品供应信息

主要是python 爬虫获取的数据。包括化学品供应信息.xls和西刺网站IP地址.xls 如有需要的话,请下载

2018-10-20

文本识别opencv-text-recognition

该压缩包主要包含文件:测试用的图片images,以及已经训练好的权重frozen_east_text_detection.pb,及运行代码:text_recognition.py

2018-10-16

ml-100k-ALS推荐算法数据集

该数据集为公共数据集:主要有u.data,u.genre,u.info,u.item,u.user,u.occupation 等文件

2018-09-21

工业生产流程的数据分析预测

工业故障智能预测:使用随机深林进行预测。含有:testA_suzhou,train_suzhou,测试A_20180117,测试B_20180117,训练_20180117等数据和模型代码

2018-08-29

基于聚类(Kmeans)算法实现客户价值分析系统(电信运营商)

基于聚类(Kmeans)算法实现客户价值分析系统(电信运营商)包含(custinfo.csv,custcall.csv以及输出的数据集result,还有图片)

2018-08-20

基于聚类(Kmeans)算法实现的客户价值分析系统data

基于聚类(Kmeans)算法实现的客户价值分析系统(包含custcall,custinfo,result,tariff,国内某航空公司会员数据)等数据信息

2018-08-18

基于NLP自然语言构建的文档自动分类_test_data _stopwords

对爬取的搜狐文档数据进行自动分类,主要有“体育,健康,房地产,娱乐,女人,文化,新闻”等文章类别,为测试数据和停用词

2018-08-18

基于NLP自然语言构建的文档自动分类系统_data

对爬取的搜狐文档数据进行自动分类,主要有“体育,健康,房地产,娱乐,女人,文化,新闻”等文章类别,已经标记好为训练数据

2018-08-18

贝叶斯模型LDA贝叶斯算法实现的电商行业商品评论与情感分析案例

LDA贝叶斯算法实现的电商行业商品评论与情感分析案例,数据集主要涉及‘美的’品牌的评论

2018-08-15

从新闻网站点击流中挖掘

从新闻网站点击流量中挖掘 在新闻网站上,一个会用户不断点击和浏览各种新闻报道,最终该用户的这些点击会被记录下来,成为该用户点击的历史记录。而所有用户的点击历史记录,是一个蕴含了巨大价值的数据集。

2018-08-15

卷积神经网络实现数字识别数据

卷积神经网络实现数字识别数据集,主要有t10k-images.idx3-ubyte,t10k-labels.idx1-ubyte,train-images.idx3-ubyte,train-labels.idx1-ubyte四个数据集

2018-08-14

基于Kaggle的经典AI项目——数据集

基于Kaggle的经典AI项目——数据集: 含有如下字段 MSZoning: String, // 房屋类型:农用,商用等 LotFrontage: String, // 距离街道的距离 LotArea: String, // 房屋的面积

2018-08-09

shape_predictor_68_face_landmarks和dlib

shape_predictor_68_face_landmarks用于标定脸部68个特征点和dlib库

2018-08-08

预测Titanic号上的乘客生存概率-数据集

预测Titanic号上的乘客生存概率-数据集,训练集,测试集,预测结果

2018-08-08

Pandas——练习题一:在校生饮酒消费数据分析

Pandas—练习题一:在校生饮酒消费数据分析。主要用于pandas的函数操作练习

2018-07-25

Pandas——练习题二——数据集

博客中Pandas练习题数据集。user数据集与chipotle.csv数据集

2018-07-25

pandas+matplotlib习题数据集

博客中pandas+matplot习题数据集,主要是关于pandas的数据处理操作

2018-07-23

pyspark_ml_pipeline_DecisionTreeClassifier_RF数据集

pyspark_ml_pipeline_DecisionTreeClassifier_RF数据集(day.csv/flights.csv/hour.csv/test.tsv/u.data/wc.data)

2015-06-29

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除