自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(134)
  • 收藏
  • 关注

原创 黑马-数据分析

4. Excel-基本函数

2024-02-29 13:25:15 377

原创 智能风控实践指南从模型特征到决策

智能风控实践指南从模型特征到决策

2024-01-15 15:27:10 415

原创 5.一维数组与字符数组

数组:指一组具有相同数据类型的数据的有序集合。类型说明符 数组名[常量表达式];一维数组的定义格式为。

2023-07-03 18:52:44 192

原创 4.选择、循环

4.选择、循环

2023-06-30 12:12:20 150

原创 3.运算符与表达式

算术运算符>关系运算符>&&>||>赋值运算符。

2023-06-29 18:31:27 160

原创 2.数据的类型、数据的输入输出

2.数据的类型、数据的输入输出2.1 数据类型-常量-变量(整型-浮点-字符)2.1.1 数据类型2.1 数据类型-常量-变量(整型-浮点-字符)2.1.1 数据类型

2023-06-26 14:00:10 224

原创 概率论与数理统计

概率论

2022-08-11 16:18:47 151 1

原创 Python数据科学手册

Python数据科学手册3.Pandas数据处理3.1 安装并使用Pandas3.Pandas数据处理3.1 安装并使用Pandas

2021-07-28 19:54:28 668

原创 进阶三方库

进阶三方库JiebaJieba函数作用备注jieba.lcut(seg_str)精简模式,返回一个列表类型的结果试图将句子最精确地切开,适合文本分析jieba.lcut(seg_str, cut_all=True)))全模式,使用 ‘cut_all=True’ 指定句子中所有的可以成词的词语都扫描出来, 速度非常快,但是不能解决歧义jieba.lcut_for_search(seg_str)))搜索引擎模式在精确模式的基础上,对长词再次切分,提高召回率,适合

2021-07-15 09:23:05 136

原创 Pandas

Pandas(数据科学手册)一级目录一级目录

2021-07-06 15:17:08 170

原创 PyMySQL

# 定义返回函数def get_df_from_mysql(sql): import pymysql conn = pymysql.connect( host="17......", port=3306, user="user", passwd="passwd", db="db_name", charset='utf8' ) df = pd.read_sql(sql,conn)

2021-07-05 17:15:12 124

原创 项目图片地址

6.27-电信用户流失预测模型

2021-06-29 18:26:16 89

原创 统计学常用库

统计学常用库1. Scipy1.1 Scipy.stats常见分布常用函数1. ScipyScipy是一个用于数学、科学、工程领域的常用软件包,可以处理插值、积分、优化、图像处理、常微分方程数值解的求解、信号处理等问题。模块名应用领域scipy.cluster向量计算/Kmeansscipy.constants物理和数学常量scipy.fftpack傅立叶变换scipy.integrate积分程序scipy.interpolate插值scip

2021-06-29 09:36:13 540

原创 常用可视化库

常用可视化库1. Matplotlib1.1 matplotlib库1.1.1 绘图1.1.2 图像、文字设置1.1.3 图像IO1.1.4 Axes轴面设置1.1.5 Figure对象设置1.2 plt.plot()属性设置图像风格和样式1.3 plt.rcParams1.4 常用实参字符标记字符线型字符颜色字符1.5 pie()属性2. Pyecharts2.1 Pyecharts库2.1.1 导入2.1.2 常用图表2.1.3 其他图表2.1.4 图像设置及渲染2.1.5 Pyecharts.Opti

2021-06-29 07:58:35 891

原创 机器学习术语

特征提取(特征工程)旨在去除原始数据中的杂质和冗余,设计更高效的特征以刻画求解问题与预测模型之间的关系。

2021-06-22 08:17:07 88

原创 Python机器学习基础教程

Python机器学习基础教程1. 引言1.1 机器学习能够解决的问题1.3 scikit-learn1.4 必要的库和工具1.4.3 Scipy1.4.4 matplotlib1.4.6 mglearn1.7 第一个应用:鸢尾花分类1.7.1 初识数据1.7.2 衡量模型是否成功:训练数据与测试数据1.7.3 要事第一:观察数据1.7.4 构建第一个模型:k近邻算法1.7.5 做出预测1.7.6 评估模型2. 监督学习1. 引言监督学习(supervised learning)的方法中,用户将成对的输入

2021-06-19 11:54:54 7238 7

原创 BI面试题

tableau有哪些产品桌面分析工具——tableau desktop数据清洗工具——tableau prep分析发布用的——tableau server/online个人试用的精简版数据分析工具——tableau publictableau连接数据有哪两种方式实时:直接从数据源实时查询获取数据信息,Tableau不对源数据进行存储。数据提取:将数据源的数据保存到本地计算机,大幅缩短Tableau查询载入源数据的时间。tableau文件的保存方式.twb ——工作簿未打包数据本身.twb

2021-06-17 18:34:31 1102

原创 Scrapy框架 & XPath

Scrapy Shell指令功能scrapy shell -s USER_AGENT=“Mozilla/5.0” URL地址基本URL请求scrapy shell --pdb URL地址交互式调试scrapy startproject 项目名称创建Scrapy项目Ctrl+D退出Scrapy ShellResponse指令功能response.body响应体内容response.xpath(xpath路径)根据xpath

2021-06-17 16:58:35 191

原创 《精通Python爬虫框架Scrapy》

精通Python爬虫框架Scrapy1. 简介(略)2. 理解HTML和XPath2.1 HTML、DOM树表示以及XPath2.1.1 URL2.1.2 HTML文档1. 简介(略)2. 理解HTML和XPath2.1 HTML、DOM树表示以及XPath2.1.1 URL如下图,URL分为两个部分:DNS(域名系统)定位到服务器使服务器理解具体的请求(此处为约翰肯尼迪的百度百科网页)2.1.2 HTML文档服务器读取URL请求后,大多时候会回应一个HTML文档浏览器使用Ctrl

2021-06-08 22:35:00 550 1

原创 《数据分析思维》猴子

《数据分析思维》猴子---------------方法篇---------------1. 业务指标1.1 如何理解业务指标?1.2 常用的指标---------------方法篇---------------1. 业务指标1.1 如何理解业务指标?第一步,弄清每一列的含义第二步,数据分类用户数据:我是谁行为数据:我做了什么产品数据:卖什么1.2 常用的指标...

2021-06-08 22:14:30 5612

原创 机器学习公式

基础参数参数符号公式常用参数参数符号公式说明错误率EE=a/mm样本量,a分类错误的样本精度1-a/m...

2021-06-07 15:07:22 178

原创 8.2 无监督学习

无监督学习算法无监督学习算法聚类vs分类1. K-Means的基本原理1.1 K-Means 是如何工作的?1.2 簇内误差平方和的定义2. Python实现2.1 导入数据集2.2 编写距离计算函数2.3 编写随机生成质心函数2.4 编写 K-Means 聚类函数(了解)2.5 算法验证3. 使用sklearn实现K-Means3.1 重要参数:n_clusters3.2 重要属性 cluster.labels_3.3 重要属性 cluster.cluster_centers_3.4 重要属性 clust

2021-06-07 10:28:49 793

原创 《机器学习》

机器学习1. 绪论1.1 引言1.2 基本术语1. 绪论1.1 引言机器学习定义:致力于研究如何通过计算的手段,利用经验来改善系统自身的性能的一门科学研究的主要内容:关于在计算机上从数据中产生“模型”的算法,即“学习算法”1.2 基本术语...

2021-06-05 07:30:31 129

原创 Sklearn

Sklearn导入KNeighborsClassifier类型属性数据集处理导入函数说明from sklearn.neighbors import KNeighborsClassifier导入KNN分类器from sklearn.datasets import load_breast_cancer导入Sklearn案例数据from sklearn.model_selection import train_test_split划分测试集与训练集

2021-06-04 12:54:04 239

原创 9.1 电商B2C商铺新用户复购预测

电商B2C商铺新用户复购预测1. 电商主要业务模式1. 电商主要业务模式

2021-06-02 19:33:22 933

原创 8.1 有监督学习算法

有监督学习算法0. 机器学习理论基础根据酒精浓度、颜色深度判断红酒类别常用机器学习算法体系0. 机器学习理论基础根据酒精浓度、颜色深度判断红酒类别常用机器学习算法体系机器学习的方法是基于数据产生的"模型"(model)的算法,也称"学习算法"(learning algorithm)。包括:有监督学习(supervised learning)无监督学习(unsupervised learning)半监督学习(semi-supervised learning)强化学习(reinforcem

2021-06-02 19:30:16 5013 1

原创 2021年518畜博会活动数据报告

2021-06-01 09:41:06 67

原创 统计学软件SPSS

1. 软件设置1.2 语言设置编辑-选项-语言2. 视图2.1 数据视图2.2 变量视图2.2.1 测量尺度定类变量——名义(Nominal)定序变量——有序(Ordinal)连续变量——标度(Scale)2.3 输出视图3. 操作3.1 打开文件3.1.1 导入模板数据文件-打开-在安装目录下找到Samples文件夹3.2 分析3.2.1 非参数检验...

2021-05-30 17:22:44 2086

原创 数学面试题

1. 排列组合共有50名员工,其中36名会C语言,32名会java,还有42名会python,请问至少有多少名员工这三种语言都会?答:2. 拿球策略题共有200个球,两人轮流拿,一次至少拿一个,最多拿6个(1)如果最后一个拿球的人算输,你先拿球,第一次那几个才能稳赢?(2)如果最后一个拿球的人算赢,你先拿球,第一次那几个才能稳赢?答:...

2021-05-26 13:35:41 548

原创 Python实用功能笔记

Python实用功能笔记1. python项目打包成exe1. python项目打包成exe安装pyinstallerpip install pyinstaller切换到打包程序目录,打包py文件>>> cd "D:py_project\decode">>> pyinstaller -F decode.py3. 在生成的文件中找到dist文件夹,打包后的exe文件就存在于其中注意:这时python语句中的相对路径以生成的exe文件为根据,

2021-05-20 16:47:44 66

原创 统计学流程

2021-05-15 09:34:42 143

原创 Mysql优化

1. char、varchar和textcharvarchartext长度固定可变,设置最大不设长度查询速度快中等慢适用身份证、手机号等定长数据可变但有限定长度的数据长度未知的数据总结:char只在特定情况下使用,一般来说,能用varchar就不用text...

2021-05-14 13:28:37 61

原创 python中的正则表达式

1. 函数括号内使用func(r'正则表达式')2. re模块

2021-05-01 10:30:01 51

原创 python常用三方库

处理excelxlrdxlwtxlutils

2021-04-27 16:22:07 134

原创 5.2 办公自动化&爬虫讲义

5.2 办公自动化&爬虫讲义1. 办公自动化1. 办公自动化

2021-04-26 17:06:00 422 2

原创 Python基础函数

函数函数说明print()输出print(content,end=’’)输出时定义每条语句的结尾(为空或字符串)

2021-04-25 15:33:36 186

原创 Python基础知识

Python基础知识1. 数据类型1.1 数值1.1.1 整数1.2.2 浮点数1.2 字符串1.2.1 单引号、双引号、三引号1.2.2 转义字符1.2.3 字符串格式化1.2.3.1 %格式化1.2.3.2 format格式化函数1.3 布尔值1.4 空值 None1.5 类型转换1.6 运算符1.6.1 算术运算符1.6.2 赋值比较运算符1. 数据类型1.1 数值1.1.1 整数1.2.2 浮点数加减乘运算的时候,只要有浮点数参与,结果就是浮点数除法运算,结果都为浮点数1.2 字

2021-04-24 11:27:36 510 2

原创 python将txt中文文本转二进制文本及转回

一些txt文档涉及隐秘或敏感信息的时候,保存到云端存在危险或可能被后台误识别后丢失,这里通过将中文文本转为二进制的存到新文档的方式,应该避免以上情况转为二进制f = open('1.txt', 'r', encoding="gb18030").read()#定义转码函数def encode(s): tmp = [] for c in s: tmp.append(bin(ord(c)).replace('0b', '')) str_bin = ' '.join

2021-04-23 16:14:01 6391 2

原创 Tableau函数

数字函数函数说明abs绝对值celling向上取整floor向下取整round四舍五入exp对数文本函数tableau函数文本索引是从1开始的函数说明STARTSWITH(“Joker”, “Jo”)判断开头ENDSWITH(“Tableau”, “leau”)判断结尾CONTAINS(“Calculation”, “alcu”)判断含有FIND(“Calculation”, “alcu”)查

2021-04-22 14:41:02 717 1

原创 统计学参数

值符号公式平均值Xˉ\bar{X}XˉXˉ=∑i=1nxin\bar{X}=\frac{\sum_{i=1}^{n}x_{i}}{n}Xˉ=n∑i=1n​xi​​总体标准差σσ=∑i=1n(xi−xˉ)2n\sigma = \sqrt{\frac{\sum_{i=1}^{n}(x_i-\bar{x})^{2}}{n}}σ=n∑i=1n​(xi​−xˉ)2​​样本标准差SS=∑i=1n(xi−xˉ)2n−1S = \sqrt{\frac{\sum_{i=1}^{n...

2021-04-19 15:10:21 1694

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除