- 博客(26)
- 资源 (27)
- 收藏
- 关注
原创 Pandas-Numpy-Matplotlib-PyEcharts——综合案例(豆瓣电影Top_250数据分析)
一、豆瓣电影数据分析 1.1 开发环境的准备 开发工具:pycharm/Anaconda5.1/Jupyter Notebook Python版本:3.6 第三方模块包: numpy 1.13.3 pandas 0.20.3 beautifulsoup4 4.6.0 ...
2018-05-31 14:30:51 7854 2
原创 matplotlib + pandas——数据可视化
一、利用pandas进行数据分析 + matplotlib进行可视化展示 1.1 第一个绘图 (原本在matplotlib中需要几段代码,在pandas中只需要一行代码) import pandas as pdimport numpy as npimport matplotlib.pyplot as plts = pd.Series( ...
2018-05-31 11:13:26 8676 2
转载 Markdown修改字体大小颜色
一、字体颜色的选择浅红色文字:<font color="#dd0000">浅红色文字:</font><br /> 深红色文字:<font color="#660000">深红色文字</font><br /&
2018-05-31 10:23:20 6254 2
原创 Python + PyEcharts——数据可视化
一、第一个PyEcharts图标 1 安装:&amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;nbsp;&amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;nbsp;&amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;nbsp;&amp;amp;amp;amp;amp;amp;amp;amp;amp;amp;nbsp;&amp;a
2018-05-31 10:00:05 73075 28
原创 Matplotlib——综合演练
一、绘制三角函数 1.1快速创建三角函数: 用到了Matplotlib和numpy模块,linspace在(-π,π)之间绘制。 代码: import matplotlib.pyplot as plt import numpy as np X = np.linspace(-np.pi,np.pi,256,endpoint = True) #np...
2018-05-29 22:20:32 528
原创 聚类分析(K-means算法)
一、聚类分析1.1 聚类分析 聚类: 把相似数据并成一组(group)的方法。‘物以类聚,人以群分’ 不需要类别标注的算法,直接从数据中学习模式 所以,聚类是一种 数据探索 的分析方法,他帮助我们在大量数据中探索和发现数据结构1.2 相似度与距离度量 定义距离来度量表示相似度: 欧式距离,曼哈顿距离,闵氏距离...
2018-05-28 22:05:44 73385
原创 机器学习——支持向量机(SVM)
一、支持向量机(SVM)将两种特征用 一条直线或者平面 分开二、支持向量机算法基本原理线性(SVM):找到最好的决策边界最大化 Margin: 决策边界最近的距离最小的Margin之和最大化 非线性(SVM):低维映射到高维再处理,找到最优的三、支持向量机代码from sklearn.svm.import SVCsvc = SV...
2018-05-28 20:47:56 1079
原创 机器学习——KNN(K近邻)
一、K近邻(KNN)K Nearest Neighbors 1.1 什么是K近邻思想:只要知道你朋友(邻居)是什么人,就能知道你是什么人K近邻是一种 懒惰的学习方法:(基于实例学习)Lazy learners: instance-based learning新数据来时,才开始学习给出分类KNN 没有训练模型,训练和预测结合一起 1.2 K近邻的距离度量...
2018-05-28 20:47:24 875 1
原创 Numpy 中不常用函数(shift,count_nonzero,diag,spacing,tile/repmat)
一、加载csv数据import numpy as npclose,amount=np.loadtxt(&amp;quot;./data.csv&amp;quot;,delimiter=&amp;quot;,&amp;quot;,usecols=(6,7),unpack=True) #导入收盘价、成交量两列 # delimiter=: 分隔符 # usecols=(): 将所有获取数据的列索引放入元组中 # un
2018-05-28 18:47:44 4735
原创 机器学习——逻辑回归(logistic regression)
大家好! 此开篇第一个机器学习方法。逻辑回归一、逻辑回归原理 参数求解正则化方法: 损失函数中增加惩罚项:参数值越大惩罚越大--&amp;amp;amp;amp;amp;gt;让算法去尽量减少参数值二、代码示例 2.1 Scikit-Learn(SkLearn)http://scikit-learn.org/stable/index.html 代码:from sk...
2018-05-27 15:56:26 8434
原创 Matlab绘图
Matlab绘图强大的绘图功能是Matlab的特点之一,Matlab提供了一系列的绘图函数,用户不需要过多的考虑绘图的细节,只需要给出一些基本参数就能得到所需图形,这类函数称为高层绘图函数。此外,Matlab还提供了直接对图形句柄进行操作的低层绘图操作。这类操作将图形的每个图形元素(如坐标轴、曲线、文字等)看做一个独立的对象,系统给每个对象分配一个句柄,可以通过句柄对该图形元素进行操作,而...
2018-05-27 10:36:24 4437 1
原创 特征工程——特征构造
特征工程概述一、特征工程概述特征工程 = 数据准备(for 数据挖掘) 数据清洗、转换 1.1 特征工程主要内容 1.2 特征工程重要性好数据&amp;amp;amp;amp;gt;多数据&amp;amp;amp;amp;gt;好算法 数据和特征决定了模型预测的上限,而算法只是逼这个上限而已应用机器学习基本上就是特征工程二、特征构造的常用方法文本数据特征提取(类似茎叶图)图像数据特征提取用...
2018-05-26 17:51:47 7156 3
原创 Pandas——基础(创建与查看)
一、Pandas数据结构 1.1 pandas学习资料http://pandas.pydata.org/pandas-docs/stable/10min.html#operationhttp://pandas.pydata.org/pandas-docs/stable/api.html (API资料查询) 安装:推荐Anaconda ,关于Python数...
2018-05-26 09:34:50 1828
原创 Scipy 高级
一、scipy在线性代数应用 使用 scipy.linalg 模块提供标准线性代数运算 网址:http://docs.scipy.org/doc/scipy/reference/linalg.html#module-scipy.linalg 计算行列式函数: linalg.det(arr) 计算矩阵的逆矩阵函数:linalg.inv(arr) ...
2018-05-25 21:14:31 1385
原创 Scipy基础+进阶
Python科学计算库—Scipy一、Scipy 入门 1.1、Scipy 简介及安装官网:http://www.scipy.org/SciPy安装:在C:\Python27\Scripts下打开cmd执行:执行:pip install scipy 1.2、安装Anaconda及环境搭建(举例演示)创建环境:conda create -n env_name py...
2018-05-25 14:31:49 5605
原创 Numpy 距离公式,获取重复元素
统计列表重复元素from collections import defaultdictdd = defaultdict(list)cc = [1, 2, 3, 2, 4]for k, val in [(v, i) for i, v in enumerate(cc)]: dd[k].append(val)print('dd:',dd)# 访问dd:元素(重复)出现的...
2018-05-25 09:13:05 448
原创 Anaconda环境搭建
Anaconda环境搭建创建环境 创建命令:conda create -n env_name python=3.x #env_name :环境名 #python=2.x/3.x :指定python版本示例: conda create -n py36 python=3.6创建名py36...
2018-05-24 21:29:23 3727 1
原创 pyMongo+Excel+爬虫——练习题
一、读取MongoDB数据#encoding:utf-8from pymongo import MongoClient class Connect(): #创建类并封装函数方便以后使用 def __init__(self,dbName,collectionName): self....
2018-05-24 11:48:20 471
原创 pyMySQL+Excel+爬虫——练习题
一、获取MySQL数据库数据写入excelimport pymysql #导入pymysqlimport xlwt #导入xlwt#一、获取链接对象connect = pymysql.connect(host="localhost",user="root",password="password",db="db_name",c...
2018-05-24 11:47:50 784
原创 MongoDB安装及基本语法结构
一、MongoDB 数据库的特点 面向文档,模式自由 json数据模式(bson)(可以初略理解为字典) 多级引索 高可用复制集 水平扩展 跨平台、多种语言接口 弱事务类型 大数据、高并发、弱事务的web2.0互联网应用。 优点:弱一致性,文档格式存储方式,内置gridFS...
2018-05-22 16:04:46 378
原创 pymongo操作MongoDB数据库
一、python在MongoDB中插入数据 insert_one(doc) insert_many(doc,ordered = True/False) #批量插入 #ordered: True,顺序插入,若第一条失败,则批量插入失败 False,不启用顺序插入,插入失败的数据不影响其...
2018-05-22 16:03:06 2314 1
原创 pyMySQL操作MySQL数据库
一、利用pyMySQL模块操作MySQL数据库(利用MySQL connector,MySQLdb模块,torndb这三种模块不用了)安装pymysql pip install pymysql 导入模块 import pymysql 链接数据库 connect = pymysql.connect(host="localhost",user="root",passwo...
2018-05-20 16:33:16 2609
原创 python——基础题
注:部分 print 未带括号为 python 2.x 版本。一、中文编码问题import jsondict1 = {'School':'zhoubei','Name': '张三', 'Age': 7, 'Class': '第一班'}print dict1['School']print json.dumps(dict1).decode('unicode-escape')...
2018-05-20 11:29:32 1959
原创 python文件读写 open(),with open(),write(),with write()—数据持久化
open()open(file, mode='r', buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None)# 默认读取整个文件,即:所有字符f = open('C:/Users/xxx/Desktop/测试读取文件.txt', 'r')print(f.read())f....
2018-05-20 11:05:27 10381
原创 MySQL语法结构--数据库的管理
MySQL的语法结构一、基本语法格式 登陆MySQL mysql -h localhost -P 3306 -u root -p mysql -u root -p(本机登录时可用) 查看数据库 show databases; ...
2018-05-17 17:37:46 532
原创 python入门基础--数据类型--循环控制--函数--OOP
一、Python基本数据类型 集合,数字,字符串,列表,元组,字典(集合几人捏圆子) python基本数据类型:number, None, bool, str python容器类型: list, tuple, dict...
2018-05-17 08:34:21 920
goturn-files.7z
2021-09-17
google_class.7z
2021-09-17
face_detector_检测模型.7z
2021-09-17
华为通用表格识别格式化成excel
2020-03-20
LC算法python实现.zip
2019-11-08
psf2otf_circShift函数.zip
2019-07-23
基于RFM模型实现的零售精准营销响应预测系统代码
2019-02-15
基于RFM模型实现的零售精准营销响应预测系统数据
2018-11-01
文本识别opencv-text-recognition
2018-10-16
工业生产流程的数据分析预测
2018-08-29
基于聚类(Kmeans)算法实现客户价值分析系统(电信运营商)
2018-08-20
基于聚类(Kmeans)算法实现的客户价值分析系统data
2018-08-18
基于NLP自然语言构建的文档自动分类_test_data _stopwords
2018-08-18
从新闻网站点击流中挖掘
2018-08-15
卷积神经网络实现数字识别数据
2018-08-14
基于Kaggle的经典AI项目——数据集
2018-08-09
shape_predictor_68_face_landmarks和dlib
2018-08-08
pyspark_ml_pipeline_DecisionTreeClassifier_RF数据集
2015-06-29
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人