自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 资源 (2)
  • 收藏
  • 关注

原创 10- 30简单爬虫 - 静态网页爬取

#soup的两个方法 #find--找第一条满足条件的内容 返回str#find_all-满足条件的所有内容 返回listsoup.find('li')soup.find('div',class_="artview") soup.find('div',class_="artview").find('h1')<h1>修养是一个人最体面的外衣</h1>```pythonsoup.find('div',class_="artview").find('h1

2020-10-31 21:37:28 570

原创 10- 25 python之函数总结

1.绝对值函数ads(x) 求x的绝对值注意: 函数也可以赋值于变量`a=abs() # 错误的a=absprint(a(-129))#返回值为 129由上可知函数可以赋值于变量`变量可以做函数的参数,因此函数也可以作为函数的参数下述函数的参数都为一个func和一个listmap() map(func,list)对list内的每一个参数执行函数func后返回一个新的list3.filter()filter(func,list)同理对list内的每一个元素执

2020-10-24 19:56:22 105

原创 10 - 25 python 复习总结(基本语法+内置函数)

Python提供的基本数据类型有六种: • 数字(Number)-整型int,浮点型float,bool ,complex 不可变 • 字符串(String) 不可变 • 元组(Tuple) 不可变 • 集合(Set) 可变 ..

2020-10-24 14:18:27 228 1

原创 10-24 python 小知识点:

1、模块中有__name__时:即 if __name__=='__main__':运行情况分为两种1.直接运行该模块时,__name__为__main__,代码块可直接运行下去2.调用该模块时,__name__为被调用模块的模块名切片超限时,不会引起下标越界异常:python中对象的赋值实际是对对象的引用,即多个变量都指向同一个内存地址,如: a='121' b=a a和b指向同一个地址。 ‘=’表示内容一样,‘is’是指向同一个地址。...

2020-10-24 10:50:08 63

原创 10-24 python闭包小练习

1、闭包实例定义:一个函数定义在另一个函数内,且使用了函数的参数,则整个代码块可以称之为闭包,外部函数的参数可重复引用,降低cpu和内存的消耗使用;def adder(x): def wrapper(y): return x+y return wrapper​adder5=adder(5)print(adder5(adder5(6)))#返回值 16print(adder5(6))#返回值 11解析如下: adder5=adder(5)时 返回

2020-10-24 10:34:42 383

原创 10-24 聚类算法二

Kmeans算法——又称K均值聚类(Kmeans)算法,作为无监督聚类算法中的代表,该算法的主要作用是将相似的样本自动归到一个类别中。所谓的监督算法,就是输入样本没有对应的输出或标签。聚类(clustering)试图将数据集中的样本划分为若干个通常是不相交的子集,每个子集称为一个“簇(cluster)”,聚类既能作为一个单独过程,用于找寻数据内在的分布结构,也可作为分类等其他学习任务的前去过程。...

2020-10-24 09:56:33 415

原创 10-10 采用k-means算法进行聚类分析 -R实现

背景:回归分析:训练出已知的两个不同的数组间的函数关系,并作出预测;分类分析:从一组样本中,找出方法作出分类,并对未参与训练的个体作出预测;聚类分析: 对一组样本作出区分,成为继续探索几个簇间差异的依据。聚类摘要:很多问题没法给出明确的解决方法;聚类是一种无监督的学习算法,没有严格意义的对错之分,不同的人或者方法,聚类的结果很可能不一样;对噪点敏感,需要提剔除噪点;数据形状大都不会是规则的球形,分类算法需要能处理特殊形状的数据。重点:1.k-means是最常用的聚类算法;2.k-

2020-10-18 23:10:06 1364

原创 10-17项目二 -Power BI实现

1.数据来源,新建工作表

2020-10-17 21:37:28 166

原创 10.14 各地区销售概览-Tableau 实现

数据来源:示例超市1. 新建工作表,加载数据源2. 处理数据新建利润率字段:利润率=sum(利润)/sum(销售额)图13.各地区销售概览-可视化3.1可视化了解公司在国内各个地区的销售情况:细节备注: (销售额,数量,利润,利润率) 地区-行 调整颜色(度量指标拖拽到颜色中,编辑颜色) 数值标记(销售额拖拽到标签中,图表显示数值额度,标签值的显示修改(K,百万等)) 排序(不同治标为准排序不同) 图比例调整(柱状图和空白处比例调整,通过大小) 筛选器制作(订单日期至筛选器

2020-10-13 23:33:54 2493

原创 10-13 python小练习

import pandas as pddf=pd.read_excel("C:/Users/10110096c/AppData/Roaming/Foxmail7/Temp-6668-20201012201231/test001.xlsx")读取失败,

2020-10-13 03:30:58 104

原创 10-13 C语言例题练习

1、是否会输出 “hello-std-out”?#include<stdio/h>#include<windows.h>int main(){ while(1) { fprintf(stdout,"hello-std-put"); fprintf(stderr,"hello-std-out"); sleep(1); } return 0;}备注:stdout和stderr是不同设备描述符。stdout时块设备,stderr不是。对于块设备,只有当以下

2020-10-13 02:16:17 98

原创 10-03 时间序列

时间分析的基本概念- 与时间相关的稳定关系1.1 时间序列的基本定义指随着时间,按照一定规律波动的数列。一个具有分析价值的时间序列往往可以分解成一下趋势:趋势:趋势是时间序列在某一方向上的持续运动的上升,下降趋势;季节变换:往往指在一年中与季节/月份强相关的周期性波动;周期变化:一般指跨越多年的周期性变化,较常见的经济周期,冰川期;不规则变化:即常见的随机扰动;时间序列分解的成功与否,取决于两个因素:1:数据序列本身是隐藏着规律的,不可预测的部分只是其中的一小部分;2:分解的

2020-10-12 22:30:12 396

原创 10-01 因子分析

因子分析因子分析基本概念—面向业务降维 背景: 主成分分析能够实现很好的指标降维,但算法本身并没有机制保证降维后的指标具有业务含义,因此往往会遇到降维后结果不可解读的情况,而因子分析则通过以下特点,保证结果具有业务含义: 依据变量间的相关系数做参数估计,会将相关系数较高的指标有限打包; 因子载荷矩阵不唯一,可通过正交变换求得最适合的举证;电商用户因子分析加分类:(目的:通过刻画出每一个用户对每一个品类的粘性,进而猜你喜欢)业务背景:用户画像点击,阅读,购买来判断用户对这

2020-10-02 05:08:47 565

2021-05-27function.py

匹配文件的配置文件

2021-05-27

2021-05-27 查询客户邮箱.py

python链接数据库,抓取数据及处理后存入excel或MySQL的脚本(20)

2021-05-27

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除