自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

huiqin08的博客

菜鸟开始!

  • 博客(28)
  • 收藏
  • 关注

原创 python数据挖掘包matplotlib绘图

原文博客:http://blog.csdn.net/pipisorry/article/details/37742423模块官网模块介绍:module matplotlib 是Python最著名的绘图库,它提供了一整套和matlab相似的命令API,十分适合交互式地进行制图。而且也可以方便地将它作为绘图控件,嵌入GUI应用程序中。它的文档相当完备,并且Gallery页面 中有上百幅缩

2017-08-28 09:51:14 498

原创 python问题集

记录一下python开发过程中,比较常见的问题python2.7matplotlibplt.savefig 保存生成的图片时,结果打开生成的图片确实一片空白import matplotlib.pyplot as plt""" 一些画图代码 """plt.show()plt.savefig("filename.png")原因:在plt.show() 后调用了

2017-08-28 09:50:55 419

原创 python数据挖掘包Sklearn

官网: http://scikit-learn.org/stable/ api: http://scikit-learn.org/stable/modules/classes.html user guide: http://scikit-learn.org/stable/user_guide.html概览优秀博客: http://www.jianshu.com/p/516f00

2017-08-28 09:50:32 465

原创 Python学习之re模块

记录re正则表达式几个常用函数~~~通常进行字符串处理时, 常用到正则表达式完成按自定义的规则对其处理. 通常这些规则称为模式, 因此正则表达式也称为模式表达. 在python中, 一般使用re模块实现python正则表达式功能.基础知识原子 正则表达式最基本组成单元,常见原子类型: * 普通字符作为原子 普通字符:数字 大小写字母 下划线:import

2017-08-28 09:47:46 309

原创 Python+Scrapy爬取数据简单实例

Python爬取数据Scrapy安装Scrapy简介及win下安装 Python开发的一个快速,高层次的屏幕抓取和web抓取框架,用于抓取web站点并从页面中提取结构化的数据 ——百度百科scapy安装+wins 以下所有软件在win下面安装方式相似,且都要对应python版本及win的操作系统位数。有的软件依赖其他软件,所以要先安装依赖。第一步:安装p

2017-08-28 09:46:32 2991

原创 Python环境布置及包安装

linux环境下python2和python3替换linux环境:ubuntu 15.04下载安装python3(本人电脑python3.4)在/usr/bin/下有各个版本的python(python2 python3 等等)修改系统默认python版本:先sudo rm /usr/bin/python这个软链接,然后 sudo ln -s /usr/bin/python3 /usr/bin/py

2017-06-08 14:59:11 385

转载 python数据挖掘包SciPy Sparse

博客原文:http://blog.csdn.net/pipisorry/article/details/41762945简介SciPy是为数学,科学和工程服务的开源软件 SciPy是建立在Numpy上的数学算法和便利函数的集合 对于那些零元素数目远远多于非零元素数目,并且非零元素的分布没有规律的矩阵称为稀疏矩阵(sparse),由于稀疏矩阵中非零元素较少,零元素较多,因此可以采用只存储非零元素的

2017-05-19 20:45:46 3123

转载 python数据挖掘包numpy基本操作

原地址英文版:https://docs.scipy.org/doc/numpy-dev/user/quickstart.html 中文版:http://blog.csdn.net/chen_shiqiang/article/details/51868115安装没有啥依赖包,普通安装模式:pip install -U numpy基础Numpy的主要对象是多维数组,数组内所有元素类型一致,在Numpy

2017-05-19 17:04:55 435

转载 python数据挖掘包Pandas基本操作

原文博客:https://zhuanlan.zhihu.com/p/25013519官网: http://pandas.pydata.org/pandas-docs/stable/ Pandas安装和使用安装方式与python安装库方式一样:pip install -U pandas (-U表示安装最新版本) 注意:要先安装numpy,因为pandas会用到此库 安装过程的问题,具体问题具体百度

2017-05-18 20:22:40 1909 1

原创 python学习之变量

记录平时学习中遇到相关类问题全局变量实例:count = 0def Fuc(count): print count count += 1for i in range(0, 10): Fuc(count)上面结果:0 0 0 0 0 0 0 0 0 0 (每个0为一行) 解决:利用全局变量global aa = 3def Fuc(

2017-05-18 10:43:04 342

转载 python学习之单元测试

原文地址:http://www.tuicool.com/articles/263m22背景: 大型软件系统的开发是一个很复杂的过程,其中因为人的因素而所产生的错误非常多,因此软件在开发过程必须要有相应的质量保证活动,而软件测试则是保证质量的关键措施。正像软件熵(software entropy)所描述的那样:一个程序从设计很好的状态开始,随着新的功能不断地加入,程序逐渐地失去了原有的结构,最终变成了

2017-05-16 11:09:51 328

原创 pycharm配置集

在一个新的环境里,一直忘记自己配置过程,特此记录下。代码根目录配置选择菜单栏File ⇒ Settings==> project: xxxx ⇒ project Interpreter ⇒ 2.7.6 右边的设置图标 ==> more==> 右边最后一个图标==>Interpreter Paths ⇒ +号==> select path代码文件模板配置选择菜单栏File ⇒ Settings==>

2017-05-16 10:55:24 484

转载 Python学习之代码规范

好看的代码撑起整个颜值命名规范参考博客python命名规范 命名 module_name, package_name, ClassName, method_name, ExceptionName, function_name, GLOBAL_VAR_NAME, instance_var_name, function_parameter_name, local_var_name.Python之父G

2017-05-15 23:27:57 319

转载 Python学习之面向对象编程

原博文地址: http://blog.csdn.net/zhoudaxia/article/details/23341261抽象是隐藏多余细节的艺术。在面向对象的概念中,抽象的直接表现形式通常为类。虽然Python是解释性语言,但是它是面向对象的,从设计之初就已经是一门面向对象的语言。Python基本上提供了面向对象编程语言的所有元素,如果你已经至少掌握了一门面向对象语言,那么利用Python进行面

2017-05-14 15:41:53 458

原创 爬虫之概述

爬爬爬~~~理论基础爬虫简介又称网络蜘蛛,可按照制定的规则(网络爬虫算法),进行自动化浏览网络中的信息. 爬虫与搜索引擎: 当用户在搜索引擎上输入关键字时,引擎将对关键字进行处理分析,从后台数据库中的网页中找出相关网页,再按照一定的排名规则呈现给用户.在此过程中,后台网页数据就是通过爬虫获取. 爬虫与数据分析: 爬虫实现自动化网络数据收集,为数据分析提供快速\实时的数据源. 现有爬虫:百度蜘蛛

2017-05-14 15:21:36 1318

转载 CSDN-markdown编辑器帮助文档

欢迎使用Markdown编辑器写博客本Markdown编辑器使用StackEdit修改而来,用它写博客,将会带来全新的体验哦:Markdown和扩展Markdown简洁的语法代码块高亮图片链接和图片上传LaTex数学公式UML序列图和流程图离线写博客导入导出Markdown文件丰富的快捷键快捷键加粗 Ctrl + B 斜体 Ctrl + I

2017-05-14 11:03:41 332

原创 Linux问题集

本博文记录生活日常Linux使用过程中的各种问题 问题排名无先后顺序UbuntuUbuntu15.04问题1:普通用户忘记密码 解决:进入recovery model==> 选择root==>进入root,对用户重新设置password: passwd 用户名问题2: 系统网络及输入法图标消失 解决:暴力法:直接重新安装:sudo apt-get install gnome (坑!) 经

2017-05-11 15:09:59 208

原创 斯坦福机器学习记录

本博客非自己,记录下别人的相关优秀博文,便于复习。监督学习应用:梯度下降监督学习应用:梯度下降 相关数学知识: 矩阵运算 矩阵迹简要复习:目的:求解下面模型,使得模型能利用实际数据集,充分模拟出实际模型 转化为经验风险最小化问题: 求解算法梯度下降 对其求导后: 批量梯度下降: 思想:对于每个 参数的每次迭代,都需要遍历所有训练样本集m。而每次迭代都需要计算n个特征的梯

2017-05-09 13:56:47 319

原创 Mysql语法大全

先尽量全面记录一下,后期再完善记录一下语法,便于以后查询用户管理新建用户及密码:foo为名,123为密码,locahost为固定地址登录# 以下为两种创建方式CREATE USER foo@localhost IDENTIFIED BY ‘123’ insert into mysql.user(Host,User,Password) values("localhost","test",pass

2017-05-07 21:12:53 15159

原创 十大经典算法之Apriori

数据挖掘十大经典算法:KNN、C4.5、Naive Bayes、CART、SVM、Kmeans、PageRank、AdaBoost、EM、AprioriAprior

2017-05-07 21:11:16 13448

转载 LDA主题模型、Word2Vec

原文地址:http://blog.csdn.net/huagong_adu/article/details/7937616背景隐含狄利克雷分配(Latent Dirichlet Allocation)是一种主题模型即从所给文档中挖掘潜在主题。LDA的出现是为了解决类似TFIDF只能从词频衡量文档相似度,可能在两个文档共同出现的单词很少甚至没有,但两个文档是相似的情形: 乔布斯、苹果。LDA通常用

2017-05-07 19:46:48 10890

原创 数据挖掘包

忙碌总是好的~背景本章主要记录一下各个语言的数据挖掘包,便于以后调用数据库连接 类别 Python R MySQL mysql-connector-python RMysql数据挖掘Python数据分析工具 扩展库 简介 Numpy 提供数组支持,以及相应的高效处理函数 Sci

2017-05-07 19:43:17 790

原创 聚类综述

尽量让自己快乐聚类分析即使很小的孩子也能很快将图片上的对象划分为车、人、建筑等,聚类就是利用机器模拟人类实现这样的划分。其目标是:聚类分析将数据划分成有意义或者有用的组(簇),组内的对象尽可能相似,组间(不同组)之间的对象差别尽可能大。 聚类:刚开始对数据集所属组(类别)并不清楚,利用每个对象个体的属性之间区别去区分所有样本所属组。聚类应用聚类分析利用数据分布进行独立

2017-05-06 22:11:03 1306

原创 十大经典算法之KNN

数据挖掘十大经典算法:KNN、C4.5、Naive Bayes、CART、SVM、Kmeans、PageRank、AdaBoost、EM、Apriori综述

2017-05-05 22:03:23 1634

转载 推荐机制

刀还未配,出门已是江湖~~~推荐引擎上图给出了推荐引擎原理:数据来源:物品信息、用户信息、用户对物品行为反馈信息推荐引擎:中间作用,多种推荐机制推荐结果:对特定用户,根据推荐算法将物品推荐给用户推荐引擎分类根据数据源不同,推荐引擎可分为: 1. 根据系统用户基本信息发现用户相关程度,称为基于人口统计学的推荐 2. 根据推荐物品或内容,发现物品间的相关性,称为基于内容的推荐 3. 根据用

2017-05-05 18:13:00 2260

原创 GitHub使用日记——基本流程

GitHub使用日记——基本流程使用GitHub进行代码管理,先记录下正确使用流程,后慢慢补充为啥。目录GitHub使用日记基本流程目录注册GitHub登录GitHubGitHub上新建项目本地代码上传GitHub建立其他分支devGit基本命令注册GitHub首先,注册一个属于自己的GitHub账户,进去注册网址,按提示完成注册及相关验证。登录GitHub进入登录页面GitHub,利

2017-05-04 20:14:23 1894

原创 Python学习之概览

Python初步了解Python 是一门优雅而健壮的编程语言,它继承了传统编译语言的强大性和通用性,同时也借鉴了简单脚本和解释语言的易用性:Python简史Python特性相关语法Python简史贵铎·范·罗萨姆(Guido van Rossum)于1989 年底始创了Python,那时,他还在荷兰的CWI(Centrum voor Wiskunde en Informatica,国家数学和

2016-09-15 22:30:11 492

原创 正则表达式学习

第一章 什么是正则表达式本章主要内容:正则表达式编辑工具匹配北美电话号码综合实例正则表达式 正则表达式是一种特殊的字符串模式,用于匹配一组字符串。如今正则表达式被广泛使用。正则表示工具-Regexpal网站 -在线测试网站 -其他自行搜索匹配北美电话号码电话号码707-827-719匹配方法 * 式1:707-827-7

2016-09-14 16:40:02 269

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除