- 博客(136)
- 收藏
- 关注
原创 2.数据的类型、数据的输入输出
2.数据的类型、数据的输入输出2.1 数据类型-常量-变量(整型-浮点-字符)2.1.1 数据类型2.1 数据类型-常量-变量(整型-浮点-字符)2.1.1 数据类型
2023-06-26 14:00:10
310
原创 Python数据科学手册
Python数据科学手册3.Pandas数据处理3.1 安装并使用Pandas3.Pandas数据处理3.1 安装并使用Pandas
2021-07-28 19:54:28
793
原创 进阶三方库
进阶三方库JiebaJieba函数作用备注jieba.lcut(seg_str)精简模式,返回一个列表类型的结果试图将句子最精确地切开,适合文本分析jieba.lcut(seg_str, cut_all=True)))全模式,使用 ‘cut_all=True’ 指定句子中所有的可以成词的词语都扫描出来, 速度非常快,但是不能解决歧义jieba.lcut_for_search(seg_str)))搜索引擎模式在精确模式的基础上,对长词再次切分,提高召回率,适合
2021-07-15 09:23:05
189
原创 PyMySQL
# 定义返回函数def get_df_from_mysql(sql): import pymysql conn = pymysql.connect( host="17......", port=3306, user="user", passwd="passwd", db="db_name", charset='utf8' ) df = pd.read_sql(sql,conn)
2021-07-05 17:15:12
195
原创 统计学常用库
统计学常用库1. Scipy1.1 Scipy.stats常见分布常用函数1. ScipyScipy是一个用于数学、科学、工程领域的常用软件包,可以处理插值、积分、优化、图像处理、常微分方程数值解的求解、信号处理等问题。模块名应用领域scipy.cluster向量计算/Kmeansscipy.constants物理和数学常量scipy.fftpack傅立叶变换scipy.integrate积分程序scipy.interpolate插值scip
2021-06-29 09:36:13
607
原创 常用可视化库
常用可视化库1. Matplotlib1.1 matplotlib库1.1.1 绘图1.1.2 图像、文字设置1.1.3 图像IO1.1.4 Axes轴面设置1.1.5 Figure对象设置1.2 plt.plot()属性设置图像风格和样式1.3 plt.rcParams1.4 常用实参字符标记字符线型字符颜色字符1.5 pie()属性2. Pyecharts2.1 Pyecharts库2.1.1 导入2.1.2 常用图表2.1.3 其他图表2.1.4 图像设置及渲染2.1.5 Pyecharts.Opti
2021-06-29 07:58:35
964
原创 Python机器学习基础教程
Python机器学习基础教程1. 引言1.1 机器学习能够解决的问题1.3 scikit-learn1.4 必要的库和工具1.4.3 Scipy1.4.4 matplotlib1.4.6 mglearn1.7 第一个应用:鸢尾花分类1.7.1 初识数据1.7.2 衡量模型是否成功:训练数据与测试数据1.7.3 要事第一:观察数据1.7.4 构建第一个模型:k近邻算法1.7.5 做出预测1.7.6 评估模型2. 监督学习1. 引言监督学习(supervised learning)的方法中,用户将成对的输入
2021-06-19 11:54:54
8210
7
原创 BI面试题
tableau有哪些产品桌面分析工具——tableau desktop数据清洗工具——tableau prep分析发布用的——tableau server/online个人试用的精简版数据分析工具——tableau publictableau连接数据有哪两种方式实时:直接从数据源实时查询获取数据信息,Tableau不对源数据进行存储。数据提取:将数据源的数据保存到本地计算机,大幅缩短Tableau查询载入源数据的时间。tableau文件的保存方式.twb ——工作簿未打包数据本身.twb
2021-06-17 18:34:31
1195
原创 Scrapy框架 & XPath
Scrapy Shell指令功能scrapy shell -s USER_AGENT=“Mozilla/5.0” URL地址基本URL请求scrapy shell --pdb URL地址交互式调试scrapy startproject 项目名称创建Scrapy项目Ctrl+D退出Scrapy ShellResponse指令功能response.body响应体内容response.xpath(xpath路径)根据xpath
2021-06-17 16:58:35
238
原创 《精通Python爬虫框架Scrapy》
精通Python爬虫框架Scrapy1. 简介(略)2. 理解HTML和XPath2.1 HTML、DOM树表示以及XPath2.1.1 URL2.1.2 HTML文档1. 简介(略)2. 理解HTML和XPath2.1 HTML、DOM树表示以及XPath2.1.1 URL如下图,URL分为两个部分:DNS(域名系统)定位到服务器使服务器理解具体的请求(此处为约翰肯尼迪的百度百科网页)2.1.2 HTML文档服务器读取URL请求后,大多时候会回应一个HTML文档浏览器使用Ctrl
2021-06-08 22:35:00
947
1
原创 《数据分析思维》猴子
《数据分析思维》猴子---------------方法篇---------------1. 业务指标1.1 如何理解业务指标?1.2 常用的指标---------------方法篇---------------1. 业务指标1.1 如何理解业务指标?第一步,弄清每一列的含义第二步,数据分类用户数据:我是谁行为数据:我做了什么产品数据:卖什么1.2 常用的指标...
2021-06-08 22:14:30
6343
原创 8.2 无监督学习
无监督学习算法无监督学习算法聚类vs分类1. K-Means的基本原理1.1 K-Means 是如何工作的?1.2 簇内误差平方和的定义2. Python实现2.1 导入数据集2.2 编写距离计算函数2.3 编写随机生成质心函数2.4 编写 K-Means 聚类函数(了解)2.5 算法验证3. 使用sklearn实现K-Means3.1 重要参数:n_clusters3.2 重要属性 cluster.labels_3.3 重要属性 cluster.cluster_centers_3.4 重要属性 clust
2021-06-07 10:28:49
898
原创 《机器学习》
机器学习1. 绪论1.1 引言1.2 基本术语1. 绪论1.1 引言机器学习定义:致力于研究如何通过计算的手段,利用经验来改善系统自身的性能的一门科学研究的主要内容:关于在计算机上从数据中产生“模型”的算法,即“学习算法”1.2 基本术语...
2021-06-05 07:30:31
169
原创 Sklearn
Sklearn导入KNeighborsClassifier类型属性数据集处理导入函数说明from sklearn.neighbors import KNeighborsClassifier导入KNN分类器from sklearn.datasets import load_breast_cancer导入Sklearn案例数据from sklearn.model_selection import train_test_split划分测试集与训练集
2021-06-04 12:54:04
290
原创 8.1 有监督学习算法
有监督学习算法0. 机器学习理论基础根据酒精浓度、颜色深度判断红酒类别常用机器学习算法体系0. 机器学习理论基础根据酒精浓度、颜色深度判断红酒类别常用机器学习算法体系机器学习的方法是基于数据产生的"模型"(model)的算法,也称"学习算法"(learning algorithm)。包括:有监督学习(supervised learning)无监督学习(unsupervised learning)半监督学习(semi-supervised learning)强化学习(reinforcem
2021-06-02 19:30:16
5490
1
原创 统计学软件SPSS
1. 软件设置1.2 语言设置编辑-选项-语言2. 视图2.1 数据视图2.2 变量视图2.2.1 测量尺度定类变量——名义(Nominal)定序变量——有序(Ordinal)连续变量——标度(Scale)2.3 输出视图3. 操作3.1 打开文件3.1.1 导入模板数据文件-打开-在安装目录下找到Samples文件夹3.2 分析3.2.1 非参数检验...
2021-05-30 17:22:44
2626
原创 数学面试题
1. 排列组合共有50名员工,其中36名会C语言,32名会java,还有42名会python,请问至少有多少名员工这三种语言都会?答:2. 拿球策略题共有200个球,两人轮流拿,一次至少拿一个,最多拿6个(1)如果最后一个拿球的人算输,你先拿球,第一次那几个才能稳赢?(2)如果最后一个拿球的人算赢,你先拿球,第一次那几个才能稳赢?答:...
2021-05-26 13:35:41
606
原创 Python实用功能笔记
Python实用功能笔记1. python项目打包成exe1. python项目打包成exe安装pyinstallerpip install pyinstaller切换到打包程序目录,打包py文件>>> cd "D:py_project\decode">>> pyinstaller -F decode.py3. 在生成的文件中找到dist文件夹,打包后的exe文件就存在于其中注意:这时python语句中的相对路径以生成的exe文件为根据,
2021-05-20 16:47:44
103
原创 Mysql优化
1. char、varchar和textcharvarchartext长度固定可变,设置最大不设长度查询速度快中等慢适用身份证、手机号等定长数据可变但有限定长度的数据长度未知的数据总结:char只在特定情况下使用,一般来说,能用varchar就不用text...
2021-05-14 13:28:37
90
原创 Python基础知识
Python基础知识1. 数据类型1.1 数值1.1.1 整数1.2.2 浮点数1.2 字符串1.2.1 单引号、双引号、三引号1.2.2 转义字符1.2.3 字符串格式化1.2.3.1 %格式化1.2.3.2 format格式化函数1.3 布尔值1.4 空值 None1.5 类型转换1.6 运算符1.6.1 算术运算符1.6.2 赋值比较运算符1. 数据类型1.1 数值1.1.1 整数1.2.2 浮点数加减乘运算的时候,只要有浮点数参与,结果就是浮点数除法运算,结果都为浮点数1.2 字
2021-04-24 11:27:36
567
2
原创 python将txt中文文本转二进制文本及转回
一些txt文档涉及隐秘或敏感信息的时候,保存到云端存在危险或可能被后台误识别后丢失,这里通过将中文文本转为二进制的存到新文档的方式,应该避免以上情况转为二进制f = open('1.txt', 'r', encoding="gb18030").read()#定义转码函数def encode(s): tmp = [] for c in s: tmp.append(bin(ord(c)).replace('0b', '')) str_bin = ' '.join
2021-04-23 16:14:01
6778
2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人