python
rungedu
计算机,算法,智能,机器学习,足球,易经,传统文化,诗词
展开
-
MongoDB学习
mongodb----------------------------------------------------------1.安装新建 /etc/yum.repos.d/mongodb.repo,内容为[mongodb-org]name=MongoDB Repositorybaseurl=https://mirrors.tuna.tsinghua.edu.cn/mongodb/yum/el$releasever/gpgcheck=0enabled=1执行sudo yum ma.原创 2020-05-22 19:17:45 · 281 阅读 · 0 评论 -
机器学习第九周 主成分分析PCA
机器学习 第九周 主成分分析学习目标知识点描述:无监督降维:主成分分析法学习目标:主成分分析法的思想及其原理PCA算法的实现及调用数据降维应用:降噪&人脸识别学习内容数据降维1:主成分分析法思想及原理数据降维2:PCA算法的实现及使用数据降维3:降维映射及PCA的实现与使用数据降维之应用:降噪&人脸识别学习ing主成分分析 PCA principal...原创 2020-04-26 21:10:52 · 324 阅读 · 0 评论 -
机器学习第七周 逻辑回归
机器学习第七周 逻辑回归1 学习目标知识点描述:应用广泛的二分类算法——逻辑回归学习目标:逻辑回归本质及其数学推导逻辑回归代码实现与调用逻辑回归中的决策边界、多项式以及正则化2 学习内容《出场率No.1的逻辑回归算法,是怎样“炼成”的?》《逻辑回归的本质及其损失函数的推导、求解》《逻辑回归代码实现与调用》《逻辑回归的决策边界及多项式》《sklearn中的逻辑回归中及正则...原创 2020-04-12 17:12:26 · 286 阅读 · 0 评论 -
机器学习第五周 最优化方法:梯度下降
机器学习第五周 最优化方法:梯度下降一、学习目标梯度下降:实现梯度下降、线性回归中的梯度下降随机梯度下降:相关代码即调用二、学习内容《还不了解梯度下降法?看完这篇就懂了!》《手动实现梯度下降(可视化)》《线性回归中的梯度下降》《速度更快的随机梯度下降法》《梯度下降番外:非常有用的调试方式及总结》三、开动概括总结:机器学习于千万里寻找那一个函数f(x),对这个函数进...原创 2020-03-27 23:07:38 · 286 阅读 · 0 评论 -
numpy 学习
学习自:哔哩哔哩 上 Python3 快速入门数据分析 洺宇吖import numpy as npimport randomt1 = np.arange(12)#t1.shape 一维数组是其个数;二维数组 shape两个值;三维列表则shape是三个值t1array([ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11])#...原创 2020-03-21 15:42:07 · 342 阅读 · 0 评论 -
机器学习第四周 线性回归算法
机器学习第四周 线性回归算法一、学习目标:简单线性回归:简单线性回归及最小二乘法的数据推导实践:简单线性回归实现及向量化应用多元线性回归:多选线性回归和正规方程解及实现二、参考资料:1.《模型之母:简单线性回归&最小二乘法》https://mp.weixin.qq.com/s/ESKQKi_1K_WPXNistizDVw2.《模型之母:简单线性回归的代码实现》https:...原创 2020-03-20 23:07:46 · 278 阅读 · 1 评论 -
机器学习第一周KNN k近邻分类
机器学习第一周:机器学习的敲门砖kNN算法一、学习目标kNN算法的思想及其原理使用python手动实现kNN算法,并在sklearn中调用了解监督学习和非监督学习的概念二、kNN算法的思想及其原理 KNN算法中文名称叫做K近邻算法。它是一个有监督的机器学习算法,其核心思想是未标记的样本的类别,由距离它最近的K个邻居投票来决定。(1)有已经标记的数据,需要判断一个未标记的数...原创 2020-03-01 23:41:03 · 207 阅读 · 0 评论 -
统计学第十三周 线性分析
统计学第13周-python练习线性回归研究给出数据中车辆销售与各列数据关????代码(参考自引用网站https://blog.csdn.net/qq_43315928/article/details/104150586)# -*- coding: utf-8 -*-import pandas as pdimport numpy as npfrom sklearn.model_...原创 2020-02-08 14:33:01 · 359 阅读 · 0 评论 -
统计学第十一周:利用假设检验分析
统计学第十一周:一 问题:1、人体体温的总体均值是否为98.6华氏度?2、人体的温度是否服从正态分布?3、人体体温中存在的异常数据是哪些?4、男女体温是否存在明显差异?5、体温与心率间的相关性(强?弱?中等?)引申出来的点:你要怎么向运营或者产品的同事展示数据结果?二 根据给出的数据进行验证(假设检验)原假设H0:给出数据,人体体温的总体均值μ0=98.6,备择假设H1:...原创 2020-01-11 21:56:27 · 535 阅读 · 0 评论 -
统计学第九周:参数估计python实现
统计学第九周参数估计复习参数估计,根据从总体中随机取样获得样本,根据取样样本来估计总体分布中参数的过程。方法:估计形式上分:点估计与区间估计;估计的方法有矩法估计,最小二乘法估计,似然估计,贝叶斯估计等等问题一般有:????未知参数的估计量????在一定置信度下求解估计量的精度实战2.1#coding=utf-8import pandas as pdimport nu...原创 2019-12-27 14:29:10 · 675 阅读 · 0 评论 -
python groupby分组运算
DataFrame groupby使用agg()运算多个分组A.groupby( [“班级”,“性别”]).agg([np.sum, np.mean, np.std])#一次计算了三个时间分组时间序列直接作为index或者有一列是时间序列,如果时间中有"/",需要进行转换:A[“生日”] = pd.to_datetime(A[“生日”],format ="%Y/%m/%d")#...原创 2019-12-16 21:58:43 · 849 阅读 · 0 评论 -
数据可视化第5周:常用图表对比
数据可视化第五周常用图表对比,当我们需要展示的时候,该如何选择图表?根据学习提供的思路:????可视化目标????数据集格式????图表异同????适用场景一.常用图表的对比柱状图&条形图联系:???? 两者均是两个字段,一个代表分类,另一个代表数值。????当数据的记录数不大于12条,分类字段的字符长度小于5时,两者可以互换。区别:????柱状图:如果分类字段时时间序列,可以优先使用柱状图,能更...原创 2019-12-15 23:56:24 · 2048 阅读 · 0 评论 -
统计学第七周 python验证正态分布/卡方分布/T
统计学第七周一.知识回顾上周已经学习过正态分布/卡方分布/T分布等知识,前面学习已学过,但是如何选择哪一个的问题?????正态分布????卡方分布????T分布二.实践1.场景:泰坦尼克号数据,主要是age年龄,Fare价格即船票价格,Embark登船的港口,需要验证数据师傅服从正太分布,T分布,卡方分布?具体数据如下:IDAgeFareEmbarked1227.25...原创 2019-12-13 17:25:55 · 2233 阅读 · 0 评论 -
数据可视化第4周
数据可视化第4周数据可视化数据关系的表示:(本为引自数据科学家联盟公众号,主要是数据可视化小组自己做的笔记,如引用请联系微信公众号:数据科学家联盟)对进度、关系、地理信息进行可视化一、三类数据区间型数据区间型数据一般分为两种:????????数据本身就是比例数据,一般以XX率的形式出现,用来指示某项指标的达成情况????????数据本身是数值型数据,但是根据业务需要会对数据进行区间段划分,并和一些...原创 2019-12-08 22:27:38 · 483 阅读 · 0 评论 -
可视化学习第三周-对比型和分布型数据
一.目标了解数据之间的对比关系,可以通过哪些「标记+视觉通道」映射,从而来表现差异;熟练掌握表示数据对比关系的图形类型,以及这些图形的适用场景、异同;熟悉描述性统计的相关内容,掌握分布型数据可视化的常用图表和适用场景;实践:给定2个数据集,选择合适的图表并进行可视化呈现,实现工具不限;二.如何优雅地选择数据图表:对比型和分布型数据图表2.1 对比型和分布型对比型:对比两组或两组...原创 2019-12-01 22:06:20 · 645 阅读 · 0 评论 -
统计学习第5周
统计学习第5周一、概率第四周复习1、离散变量、随机变量2、期望、方差3、离散概率分布 二项分布、伯努利分布、泊松分布4、连续概率分布 均匀分布、正态分布、指数分布二、Python实现1.在安装python及进行科学计算,建议安装anaconda 3.5.0 ,版本,可以百度搜索清华大学镜像进行下载,安装,该版本对应python3.6;对于python的IDEA ,可以安装p...原创 2019-11-29 22:47:51 · 333 阅读 · 0 评论 -
数据可视化第二周
数据可视化第二周二、离散场景和连续场景两组数据分析展示2.1离散场景1时序数据数据集1,场景某电商公司2018年销售额整体趋势情况,以及不同品类销售额的发展趋势,可用折线图。(第一次觉得用百分比堆叠图或者普通堆叠图表示较好,并列柱状图可能数据线条比较多,而且折现条数也是,用百分比堆叠图,能利用百分比堆叠图各类趋势变化,还有占比比较清楚。普通的堆叠图应该也可以,不过4个题目全看过后感觉还是用...原创 2019-11-24 22:32:54 · 205 阅读 · 0 评论 -
python的Numpy练习(python3)
#coding=utf-8import numpy as np'''numpy 数组'''data = np.arange(12).reshape(3,4) #创建一个3行4列的数组#print(data)#print(type(data))#print(data.ndim) #数组维度的个数,2维,3*4#print(data.shape) #数组的行数 列数 ...原创 2019-11-23 14:13:18 · 436 阅读 · 0 评论 -
数据可视化小组-第一周 解读数据可视化
数据可视化小组-第一周解读数据可视化对于数据可视化,还是挺有一些感触的,毕竟正在参与公司的可视化的展示。感觉小组推送的文章中4个步骤是很中肯的。> > 可视化4个过程:> >> > > > 1.确定数据可视化的主题> > > >> > > > 2.提炼可视化主题的数据> >...原创 2019-11-16 23:57:31 · 327 阅读 · 0 评论 -
统计学习第三周:描述性统计
一、python安装python安装,我们常用在windows或者linux中安装。目前经常用到的版本有python2.7,python3.6.X,不过目前python2.7在2020年将会被取消更新。网上建议升级到3.x版本,但是目前仍有些程序运行在python2.7稳定版本上,因此可能会经常安装2个版本的python。可以安装anaconda,其中自带了相关的python科学计算包...原创 2019-11-13 23:21:20 · 344 阅读 · 0 评论 -
python在web中输出word文档
前几天同学问了个问题,话说python的输出word文档,他是用win32com模块产生的word文档,但是把代码复制到view.py下面却产生了错误。我才可能这么模块利用com只是在本地产生的word,对于web方法,可能需要使用其他模块中的代码,找了好久,于是找到一个生成word的其他方法,用到了第三方组件python-docx。它是Python OpenXML中一部分,可以用它打开wor原创 2015-10-20 20:20:24 · 2002 阅读 · 0 评论 -
python学习笔记
python学习2.7或者是3.3学习笔记原创 2015-10-20 20:07:14 · 3795 阅读 · 0 评论 -
python正则表达式笔记
python正则表达式1.python中提供了正则表达式的匹配,可以使用reimport re2.re.findall(rule,content)通过rule的规则匹配得到列表 ,如果没有符合的就返回一个空列表>>> import re>>> s='123abc456eabc789'>>> re.findall(r'abc',s)['abc', 'abc']>>>原创 2015-10-20 20:25:41 · 3563 阅读 · 0 评论