自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Anne的博客

数据分析师,终身学习者,精进自己,普惠他人。

  • 博客(20)
  • 收藏
  • 关注

原创 机器学习算法1---KNN

KNN算法原理与实现

2022-08-31 21:57:38 1069 1

原创 自定义函数---根据某天日期向前或向后生成一段日期列表

import datetimedef createDates(start=None, days=30, oriented='forward'): ''' 生成年月日列表。 参数 ---- start : str, 默认是None 起始日期。 days : int, 默认是30 生成的天数。 ori...

2019-10-12 12:39:13 325

原创 python数据化运营案例---简单销售预测案例(线性回归模型)

目录1、案例概述2、案例过程3、案例总结本内容主要是《python数据分析与数据化运营》的学习笔记1、案例概述案例场景:每个公司都有一定的促销费用,促销费用可以带来销售量的显著提升,当给出一定的促销费用时,预测会带来多大的商品销售量?原始数据如下:2、案例过程#一、读取数据import pandas as pd #pandas包用来将数据读取成Da...

2019-08-02 08:27:26 3705

原创 python数据爬取---爬取文本数据并进行特征提取

1、寻找目标网站并分析结构我们这次来爬‘百思不得其姐’的内涵段子。目标网址:http://www.budejie.com/text/1网站结构:每页默认20个段子,要翻页,第2页的网址是http://www.budejie.com/text/2,由此可以推断,该网站是在最后加上数字来区分页面,这样我们可以使用for循环来爬取所有页面的信息。我们可以把目标页面锁定在1-10页。...

2019-07-05 16:31:03 8385

原创 python数据分析---数据可视化pyecharts包

pyecharts是一款将python与echarts结合的强大的数据可视化工具,用其生成的图可视化效果非常棒,而且使用起来非常简单。官方文档https://pyecharts.org使用之前需要先安装:pip install pyecharts绘图的基本步骤如下:#1、导入相关图包from pyecharts.charts import Bar 引入相关图包,柱状图引人Bar、f...

2019-07-04 19:50:46 1929

原创 python数据分析---基础知识/数据准备/数据分析/数据可视化/分析案例---报表自动化/超市数据分析/银行数据分析

本文是对《对比Excel,轻松学习数据分析》的整理总结和自己敲的代码,代码放在github上,感兴趣可以下载,感觉这本书讲的还挺有逻辑,想入门python的同学可以购买python代码下载地址:https://github.com/annewang1990/python_data_analysis...

2019-07-04 15:30:15 801 1

原创 python数据爬取---复杂一点的爬取

目录1、确定目标页面并进行分析2、Python中的正则表达式3、使用BeautifulSoup进行html解析4、对目标页面进行爬起并保存到本地1、确定目标页面并进行分析打开目标页面,右键鼠标,选择“检查”新的窗口显示的就是该网页的元素,发现我们想要的内容应该储存在“要闻列表里面”。展开下面的<ul>发现我们要的内容就在<h4>里...

2019-07-04 14:37:27 1601 2

原创 python数据爬取---简单页面的爬取

1、准备Requests和User Agentpython中能实现爬虫功能的库有若干个,而最简单最容易上手的,要数Requests库,它是一个常用的http请求库,首先用pip install requests 进行安装才能使用。User Agent一般翻译为用户代理,它的作用是向服务器自报家门。为什么要这个User Agent呢?因为我们要让爬虫假装是一个正常的用户在使用浏览器对目...

2019-07-03 18:07:04 10558 1

原创 python机器学习---数据处理---文本数据处理

目录1、将文本数据进行特征提取1.1英文文本---直接用CountVectorizer1.2中文文本---先用结巴分词工具进行分词2、将分词转为数组2.1 基本词袋模型2.2 改善词袋模型---n-Gram3、进一步优化处理3.1tf-idf模型3.2 删除文本中的停用词4、如何深入自然语言处理1、将文本数据进行特征提取1.1英文文本---直接用C...

2019-07-03 15:59:25 4313 1

原创 分析工具学习笔记系列

一、EXCELEXCEL数据分析技巧EXCEL数据分析案例二、SQLSQL数据分析技巧SQL数据分析实战案例hive sql四、pythonpython数据分析python机器学习https://blog.csdn.net/weixin_42156897/article/category/9066194五、Tableau《零售企业产品、客户、市场、时间四...

2019-07-03 14:52:59 138

原创 分析方法学习笔记系列

1、分析思维类笔记数据分析思维《谁说菜鸟不会数据分析-入门篇》2、统计学学习笔记数据分析的统计学基础假设检验的原理ABtest实验注意点-辛普森悖论《统计数据会说谎》《魔鬼数学》3、个人总结如何快速收集业务部门需求,设计切中需求又好用的报表...

2019-07-03 14:49:01 135

原创 商业思维学习笔记系列

一、1111法混沌大学学习笔记1111指1分钟了解主要框架;10分钟熟悉主要内容;1小时理解演讲视频;1星期扩展演讲内容。本读书笔记系列文章旨在帮助听过演讲的人快速全面回忆演讲内容,帮助没有听过演讲的人快速全面理解本次演讲。1、战略混沌大学深圳开学典礼社长贾光《创业七决》1111法《樊登:低风险创业》学习笔记2、组织3、财务4、产品1111法《吴毅:产品指数型增长的...

2019-07-03 14:46:12 1535

原创 美国Udacity数据分析网络课程作品

美国Udacity数据分析网络课程作品 《统计学测试心理学现象项目》,链接:https://zhuanlan.zhihu.com/p/32560644 《利用python探索Titanic数据集项目》,链接:https://zhuanlan.zhihu.com/p/32582696 《电影数据Tableau可视化项目》,链接:https://zhuanlan.zhihu...

2019-07-03 14:43:01 1314

原创 python机器学习---监督学习---神经网络(用于分类和回归)

目录1、神经网络算法的原理2、神经网络算法的参数说明3、神经网络算法的优缺点4、使用神经网络算法进行手写识别案例1、神经网络算法的原理 在本次人工智能大潮中,深度学习(多层神经网络算法)占据了统治地位,不管是在图像识别、语音识别、自然语音处理、无人驾驶等领域,都有非常广泛的应用。本章主要介绍“多层感知器”MLP算法。 在介绍神经网络的原理之前...

2019-07-02 19:05:43 5470

原创 python机器学习---监督学习---支持向量机SVM(多用于分类)

目录1、支持向量机的基本原理2、支持向量机的核函数和参数选择3、支持向量机实例---对波士顿房价进行回归分析备注:本文主要来自于对《深入浅出python机器学习》书籍的学习总结笔记,感兴趣的同学可以购买本书学习1、支持向量机的基本原理 由于现实生活中,很多事情不是线性可分的(即画一条直线就能分类的),而SVM就是专治线性不可分,把分类问题转化为平面分类问题。不过...

2019-06-30 23:02:36 11180 2

原创 python机器学习---监督学习---线性回归模型(用于回归)

目录1、线性模型基本原理1.1 线性模型一般公式1.2 线性模型图形表示2、线性模型分类及模型实现​3、线性模型的优缺点备注:本文主要来自于对《深入浅出python机器学习》书籍的学习总结笔记,感兴趣的同学可以购买本书学习1、线性模型基本原理1.1 线性模型一般公式线性模型在拟合数据集时,会让自己距离每个数据点的加和为最小值,即找到找到训练数据集中y的预测值...

2019-06-29 12:43:05 1164

原创 python机器学习---监督学习---决策树和随机森林(用于分类和回归)

目录1、决策树1.1决策树的基本原理1.2 决策树的优势和不足2、随机森林2.1随机森林的基本原理2.2 随机森林的优势和不足3、实战案例---收入预测案例备注:本文主要来自于对《深入浅出python机器学习》书籍的学习总结笔记,感兴趣的同学可以购买本书学习,学习的本质就是形成自己的逻辑。1、决策树1.1决策树的基本原理决策树有分类树---对离散...

2019-06-28 21:56:08 3970

原创 python机器学习---监督学习---朴素贝叶斯(用于分类)

目录1、朴素贝叶斯算法基本原理1.1 思想基础1.2 简单应用案例1.3 朴素贝叶斯的不同方法2、朴素贝叶斯算法实战3、朴素贝叶斯算法优缺点备注:本文主要来自于对《深入浅出python机器学习》书籍的学习总结笔记,感兴趣的同学可以购买本书学习,学习的本质就是形成自己的逻辑。1、朴素贝叶斯算法基本原理1.1 思想基础对于给出的待分类项x={a1,a2....a...

2019-06-28 11:53:22 710

原创 python机器学习---监督学习---K最近邻算法(用于分类和回归)

目录1.K最近邻算法原理2.K最近邻算法项目实战2.1 电影分类2.2 酒分类3.K最近邻算法优缺点备注:本文主要来自于对《深入浅出python机器学习》书籍的学习总结笔记,感兴趣的同学可以购买本书学习,学习的本质就是形成自己的逻辑。1.K最近邻算法原理基本思想:一个样本在特征空间中,总会有k个最临近的样本。如在左边的图中,最近邻数k=1,即找到与问...

2019-06-27 15:13:14 1849

原创 python机器学习基础

1、什么是机器学习卡耐基梅隆大学的著名教授Tom Mitchell曾这样定义:如果一个程序在使用即有经验执行某类任务的过程中被认定是“具备学习能力的”,那么它一定需要展现出—利用现有经验,不断完善其完成既定任务的性能的特质。那么我们会发现3个关键术语:经验-Experience,任务-Task,性能-Performance。代码块任务机器学习的任务种类有很多,经典的两类任务是监督学习...

2019-06-27 13:01:40 193

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除