
python
文章平均质量分 86
hjh00
这个作者很懒,什么都没留下…
展开
-
用Python学习统计学基础-6
使用相关系数检验关系、使用线性回归、卡方检验原创 2015-10-04 17:21:33 · 13720 阅读 · 0 评论 -
Python 网络抓取和文本挖掘-1 HTML 和 HTMLParser
应用urllib2和HTMLParser从网页中提取需要的数据。原创 2017-02-02 19:41:25 · 2852 阅读 · 0 评论 -
Python 网络抓取和文本挖掘-2 XML 和 JSON
XML和JSON是两个重要的网络数据交换标准。 Dr. No 1962 1.1M 59.5M Live and Let Die 1973原创 2017-02-07 19:48:31 · 1877 阅读 · 0 评论 -
Python 网络抓取和文本挖掘 - 3 XPath
XPath 是一种查询语言,用于在HTML/XML文档中定位和提取一些片段。XPath也是一个W3C标准。XPath只能处理DOM,所以必须先将HTML或XML文档加载解析成DOM。在Python中可以用lxml保的etree来 执行DOM解析和XPath查询。原创 2017-02-23 22:43:21 · 3937 阅读 · 0 评论 -
TensorflowOnSpark 安装
Tensorflow on Spark 安装原创 2017-03-21 13:14:32 · 8372 阅读 · 14 评论 -
scikit-learn K最近邻分类器 KNeighborsClassifier 使用
K最近邻(k-Nearest Neighbor,KNN)分类算法的核心思想是如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。KNN算法可用于多分类,KNN算法不仅可以用于分类,还可以用于回归。通过找出一个样本的k个最近邻居,将这些邻居的属性的平均值赋给该样本,作为预测值。KNeighborsClassifier在scikit-l原创 2017-03-24 01:21:09 · 29082 阅读 · 3 评论 -
matplotlib绘图基础
记录matplotlib的基本操作学习笔记,需要时可以直接拷贝。1. 绘制曲线用numpy的linspace() 函数获取一组数据x,用numpy的cos和sin函数获得y值,然后用matplotlib.pyplot画图。可以使用rcParams设置参数。# -*- coding:utf8 -*-import numpy as npimport matplotlib.pyplot原创 2017-03-27 14:16:21 · 2783 阅读 · 0 评论 -
pandas 基础
pandas有两个主要的数据结构DataFrame和Series。DataFrame是一个类似数据库表的二维结构,Series是一个一维结构。原创 2017-04-16 15:34:10 · 1203 阅读 · 0 评论 -
NumPy 基础
NumPy 基础原创 2017-04-17 00:22:30 · 542 阅读 · 0 评论 -
scikit-learn 常用分类算法的使用
cikit-learn机器学习的分类算法:逻辑回归、朴素贝叶斯、KNN、支持向量机、决策树和随机森林等原创 2017-06-10 20:05:02 · 4989 阅读 · 1 评论 -
使用scikit-learn进行文本分类
使用 scikit-learn 进行文本分类原创 2017-06-20 13:15:32 · 2452 阅读 · 0 评论 -
Python 网络抓取和文本挖掘 - 4 濒危世界遗产地
python urllib2 lxml 获取维基百科濒危世界遗产地数据,用Basemap绘图进行标注原创 2017-03-01 16:39:54 · 902 阅读 · 0 评论 -
Python 使用正则表达式 - 1
正则表达式 python原创 2015-08-19 16:20:56 · 1457 阅读 · 0 评论 -
python数据结构学习笔记-1
Python编程基础, python内置的类,面向对象编程,算法复杂度原创 2015-10-08 17:59:58 · 1698 阅读 · 0 评论 -
用Python学习统计学基础-5
十二、方差分析方差分析检验两个以上的群体,比较这些群体的平均成绩。方差分析的检验统计量是F统计量。比如,群体1 是训练年数在6年之内的运动员,群体2是训练年数7~10年的运动员,群体3是训练年数在10年以上的运动员。只分析一个因素(变量)的情况,称作一元方差分析(one-way analysis of variance),也称作简单方差分析(simple analysis of varianc原创 2015-09-28 17:17:48 · 9627 阅读 · 0 评论 -
用Python学习统计学基础-4
显著性的显著、两个群体的t检验原创 2015-09-26 12:27:03 · 11338 阅读 · 0 评论 -
用Python学习统计学基础-3
检验你的问题概率和概率的重要性原创 2015-09-17 16:36:18 · 5086 阅读 · 0 评论 -
用Python学习统计学基础-2
计算相关系数、信度和效度原创 2015-09-11 10:20:19 · 11649 阅读 · 1 评论 -
用Python学习统计学基础-1
一、前言早就接触到统计学的知识,一直想认真学一下,看过一些书,大多不能坚持。这种情况在我偶然看到《爱上统计学》一书时改变了,我把它看完了,而且觉得是看懂了。于是决定再看一遍,用Python完成书上的习题,记录下来。描述统计(descriptive statistics)常用于整理、描述所收集数据的特征。推论统计(inferential statistics)通常是(但并非总是)数据收集和汇原创 2015-09-05 21:46:05 · 14054 阅读 · 0 评论 -
Python 使用正则表达式 - 2
继续学习《正则表达式必知必会》一书中的使用子表达式、回溯引用、前后查找等章节。原创 2015-08-20 15:14:24 · 1967 阅读 · 0 评论 -
SQLAlchemy core 学习笔记(1) medata
在使用 Python web 框架Flask时发现很有必要学习一下SQLAlchemy。SQLAlchemy分为两部分,一是SQLAlchemy core,另一部分是SQLAlchemy ORM。使用SQLAlchemy的好处是经过SQLAlchemy抽象后很容易实现了代码在不同数据库之间兼容。SQLAlchemy core是SQLAlchemy ORM的基础。以下内容是《Essential原创 2016-11-23 23:34:03 · 2084 阅读 · 0 评论 -
python数据结构学习笔记-3-数组
数组,动态数组,list应用(积分排行榜、凯撒密码),二维数组原创 2015-10-23 09:03:58 · 5474 阅读 · 0 评论 -
python数据结构学习笔记-2-算法
穷举算法 、回溯算法、递归算法原创 2015-10-13 00:02:56 · 1411 阅读 · 0 评论 -
Flask 入门笔记(1)开发环境
Flask学习笔记(1) 准备开发测试环境本Markdown编辑器使用StackEdit修改而来,用它写博客,将会带来全新的体验哦:Markdown和扩展Markdown简洁的语法代码块高亮图片链接和图片上传LaTex数学公式UML序列图和流程图离线写博客导入导出Markdown文件丰富的快捷键快捷键加粗 Ctrl + B 斜体 Ctrl + ...原创 2018-09-22 21:58:40 · 393 阅读 · 0 评论