- 博客(15)
- 收藏
- 关注
原创 八大排序算法 python
# -*- coding:utf-8 -*-def insert_sort(lists): # 插入排序 for i in range(1,len(lists)): key = lists[i] j = i-1 while j >= 0: if lists[j] > key:
2017-10-20 14:44:27 285
原创 聚类和EM算法
聚类是一种无监督学习,它通过对无标记训练样本的学习来寻找这些数据的内在性质。聚类的思想:将数据集划分为若干个不相交的子集(簇),每个簇对应一类,但通常聚类算法不会告诉你这些簇分别代表什么意义,只是这样分成这些不相交的簇。聚类的作用:作为一种探索性分析方法,分析数据的内在性质,寻找数据的分布规律作为分类的预处理过程,并不直接数据分析,首先对需要分类的数据进行聚类,然后对聚类出
2017-09-24 20:39:00 2191
原创 python中文编码+html中的回调,bejson显示中文
问题一: UnicodeDecodeError: 'ascii' codec can't decode byte 0xe3 in position 0: ordinal not in range(128)解决:import sysreload(sys)sys.setdefaultencoding('utf8')http://docs.python.org/howto/un
2016-11-07 11:07:46 615
转载 TensorFlow的基本用法
基本使用TensorFlow具体流程:使用图 (graph) 来表示计算任务.在被称之为 会话 (Session) 的上下文 (context) 中执行图.使用 tensor 表示数据.通过 变量 (Variable) 维护状态.使用 feed 和 fetch 可以为任意的操作(arbitrary operation) 赋值或者从其中获取数据.
2016-10-10 01:45:33 381
原创 关于深度学习框架TensorFlow的调研
事件:2015年11月9日,Google发布人工智能系统TensorFlow并宣布开源,同日,极客学院完成在线TensorFlow中文文档翻译。在线阅读地址为:http://wiki.jikexueyuan.com/project/tensorflow-zh/ 首先感谢那些翻译人员,真心给力,给了我们这种新手方便学习的机会------------------------------
2016-10-09 23:59:56 728
原创 爬取大众点评黄焖鸡米饭的数据
学习python已经一段时间,就想着利用他爬取大众点评上的一些数据,用于分析。这里,我选择爬取国内各个地区和省份关于黄焖鸡米饭的店面数据具体的格式:店面 id,省份,城市,开店时间,店名首先声明:大众点评的数据,并不是很好爬取的。注意:他会禁止IP我通过下面方法得以解决1、UserAgent经常换一换;2、访问时间间隔设长一点,访问时间设置为随机数;sleep()3
2016-09-28 21:32:45 1018
原创 如何解决“ImportError: No module named pylab”
1. 首先 保证 python-numpy python-scipy python-matplotlib 安装完毕2.work with itfrom matplotlib import pylabfrom pylab import *亲测可行
2016-09-16 19:35:09 9999
原创 python pandas 处理日期数据
数据类型及操作Python 标准库的datetimedatetime模块中的datetime,time,calendar等类都可以用来存储时间类型以及一些其他转换与运算for example:from datetime import datetimenow=datetime.now()print now #2016-09-11 16:02:
2016-09-11 16:34:02 9492
原创 SVM
支持向量机1.基于最大间隔分隔数据优点:泛化错误率低。计算开销不大,结果易解释缺点:对参数调节和核函数的选择敏感,原始分类器不加修改仅适用于处理二类问题使用数据:数值型和标称型数据我们希望找到离分隔超平面最近的点,确保它们离分隔面的距离尽可能远在这里仅仅简单介绍,更为详细的数学需要自己去专门的书籍中学习。2 .求解(SMO)SMO表示
2016-09-10 20:55:51 405
转载 为什么使用python
软件质量: 可读写、一致性、软件质量 支持软件开发的高级重用机制提供开发者的效率: 代码只有java或C++的1/5~1/3 无须编译链接,提高了程序原的效率程序的可移植性: 用户图像界面、数据库接入、基于Web的系统等标准库的支持:组件集成: 可以调用C或C++的库 可以被C和C++程序
2016-09-06 10:25:46 402
原创 python ---numpy
本文主要包括如下内容:1.数据类型 2.数组类型 3.类型转换 4 .创建数组 5.索引 6.花式索引 7.切片(Slicing)8.处理数据的形状I.Numpy中的多维数组称为ndarray,主要包括两个部分:数据本身和 描述数据的元数据Numpy数组通常表示是由相同种类的元素组成。可以向量化处理数组。a=arange(5) a.dtype dtype('int64
2016-09-02 09:54:56 500
转载 大数据竞赛平台——Kaggle 入门篇
大数据竞赛平台——Kaggle 入门篇这篇文章适合那些刚接触Kaggle、想尽快熟悉Kaggle并且独立完成一个竞赛项目的网友,对于已经在Kaggle上参赛过的网友来说,大可不必耗费时间阅读本文。本文分为两部分介绍Kaggle,第一部分简单介绍Kaggle,第二部分将展示解决一个竞赛项目的全过程。如有错误,请指正!1、Kaggle简介Kaggle是一
2016-08-21 15:06:43 4017
原创 14数学建模竞赛D题
一.问题一1.数据预处理---->数据相关性分析-->粗大误差分析-->针对果蔬品种的营养素成分和含量,建立分级打分制度,定义‘营养价值’,‘常见度’,‘研究价值’等指标--》筛选出8种水果和6种蔬菜2.回归模型,预测各种果蔬的年产量3.Logistic模型对预测结果进行修正,改进回归模型的产量预测结果关键词:线性回归,多项式回归, Logistic 复合模型
2016-07-17 10:40:21 1033
原创 SVM Matlab工具箱的使用(一)
本次是我自己刚学习svm,并在faruto视频上学习svm的笔记。一.SVM 由Vapnik首先提出,svm的主要思想是建立一个超平面作为决策曲面,使得正例与反例之间的隔离边缘被最大化。svm的优点:1.通用性(能够在各种函数集中构造函数)2.鲁棒性(不需要微调)3.有效性(在解决实际问题中属于最好的方法之一)4.计算简单(方法的实现只需要利用简单的优化技术)5.理论上
2016-07-11 08:56:12 1178
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人