基础知识
XIAOTWOB
在世界面前,堂堂正正的站立;
永远永远不再畏惧,即使在寒冷的街头
展开
-
第五章:循环迭代处理(注意点)
111原创 2020-08-20 17:59:36 · 1262 阅读 · 0 评论 -
第四章:条件与顺序控制(注意点)
1、IF语句的语法要点一个IF永远与一个END IF 相匹配在END 和 IF 之间必须有个空格ELSIF关键词只在END IF 后面放一个分好,THEN 、ELSE、ELSIF后面都不带分号2、短路估算存在两个条件判断时,将判断复杂的放在后面3、CASE语句与表达式CASE expressionWHEN result1 THEN statements1WHEN result2 THEN statements2...ELSE statements_elseEND CA原创 2020-08-19 17:12:44 · 286 阅读 · 0 评论 -
PL/SQL 语言基础(标签的作用)
1、规范SQL语句中对变量和列的引用PACKAGE BODY scope_demoIS PROCEDURE set_global (number_in IN NUMBER) IS 1_salary NUMBER := 10000; 1_count PLS_INTEGER; BEGIN <<local_block>> DECLARE 1_inner PLS_INTEGER; BEGIN SELECT COUNT(*) INTO set原创 2020-08-18 17:00:15 · 422 阅读 · 0 评论 -
关于时间格式数据的保留问题
--保存年月日格式的时间数据SELECT TRUNC(SYSDATE) FROM DUAL;--时间格式可以直接进行加减数字SELECT TRUNC(SYSDATE)-3 FROM DUAL;--时间相减SELECT TRUNC(SYSDATE)- TO_DATE('2020/1/1','YYYY/MM/DD') FROM DUAL;--TO_DATE里面可以放查询的字段SEL...原创 2020-03-24 17:11:28 · 324 阅读 · 0 评论 -
oracle的空值处理函数
1、NVLNVL(expr1,expr2)如果expr1为空,则显示expr2;否则显示expr12、NVL2NVL(expr1,expr2,expr3)如果expr1不为空,则显示expr2;否则显示expr33、NULLIFNULLIF(exp1,expr2)如果exp1和exp2相等则返回空(NULL),否则返回第一个值。4、COALESCECoalesce(...原创 2020-01-21 18:06:35 · 1702 阅读 · 0 评论 -
十分钟入门pandas
对象创建通过传入一些值来创建一个Series,pandas会自动创建一个默认的整数索引(从0开始)pd.Series([1,3,5,np.nan,6,8])----------0 1.01 3.02 5.03 NaN4 6.05 8.0dtype: float64通过传递带有日期时间索引和带标签列的NumPy数组来创建DataFra...原创 2019-09-13 15:38:14 · 252 阅读 · 0 评论 -
认识数据
摘自数据挖掘-概念与技术中心趋势度量:均值、中位数和众数截尾均值:丢弃高低极端值后的均值。对于非对称数据,数据中心的更好度量是中位数众数是另一种中心趋势度量。众数是数据集中出现最频繁的值。中列数是最大值与最小值的平均值。评估数据发散程度:极差、四分位数、方差、标准差和四分位数极差极差是最大值与最小值之差;四分位数是指将数据分成均匀四份。四分位数极差(IQR)是Q3-Q1;对倾斜(...原创 2019-09-13 23:12:04 · 431 阅读 · 0 评论 -
数据预处理
摘自数据挖掘-概念与技术数据预处理数据质量:准确性、完整性、一致性、时效性、可信性和可解释性质量基于数据的应用目的评估。方法数据清理:试图填补缺失值,光滑噪声同时识别离群点,并纠正数据的不一致性。通常是一个两步的迭代过程,包括偏差检测和数据变换。如何处理缺失值1.使用一个全局常量来填充缺失值:简单但不是十分可靠2. 使用他属性的中心度量(如均值或中位数)填充缺失值:对于对称的数据...原创 2019-09-14 23:47:30 · 425 阅读 · 0 评论 -
数据仓库与联机分析处理
数据仓库与联机分析处理数据仓库是面向主题的、集成的、时变的和非易失的有组织的数据集合,支持管理决策制定。有一些要素区别数据仓库与操作数据库。由于两种系统提供很不相同的功能,需要不同类型的数据,因此有必要将数据仓库与操作数据库分开维护。面向主题的(subject-oriented):数据仓库围绕一些重要的主题,如顾客、供应商、产品和销售组织。数据仓库关注决策者的数据建模与分析,而不是单位的日常...原创 2019-09-16 23:17:50 · 1201 阅读 · 0 评论 -
Python语言特性
1、迭代器与生成器 迭代器是遵循迭代协议的对象,用户可以使用iter()以从任何序列得到迭代器(如list,tuple,dictionary,set等) 生成器(Generator),只是在需要返回数据的时候使用yield语句。每次next()语句被调用时,生成器会返回它脱离的位置(它会记忆语句最后一次执行的位置和所有的数据值。)生成器能做到迭代器能做的所有事...原创 2019-09-11 15:33:03 · 196 阅读 · 0 评论 -
numpy、pandas基础补充
三层结构容器层:canvas、figure、axes画板层(canvas):用户接触不到画布层(figure):plt.figure(figsize=(),dpi=) figsize:画布大小 dpi:清晰度plt.savefig('文件名'):以文件名的形式保存一个画布可以包含多个绘图区绘图区(axes):plt.subplots()辅助显示层:图例(legend)、网...原创 2019-09-10 09:24:07 · 900 阅读 · 0 评论 -
NumPy基础:数组和矢量计算
NumPy(Numerical Python)是高性能科学计算和数据分析的基础包。部分功能如下:1.ndarray,一个具有矢量算术运算和复杂广播能力的快速且节省空间的多维数组。2.用于对整组数据进行快速运算的标准数学函数(无需编写循环)。3.用于读写磁盘数据的工具以及用于操作内存映射文件的工具。4.线性代数、随机数生成以及傅里叶变换功能。5.用于集成由C、C++、Fortan等语言编...原创 2019-08-22 19:41:07 · 381 阅读 · 0 评论 -
爬虫相关基础知识
摘自《Python3网络爬虫开发实战》 崔庆才著08-271、cookie和session都用来保存状态信息,都是保存客户端状态的机制,他们都是为了解决HTTP无状态的问题所做的努力。对于爬虫开发来说,我们更关注的是cookie,因为cookie将状态保存在客户端,session将状态保存在服务器端。cookie是服务器在本地机器上存储的小段文本并随没一个请求发送至同一个服务器。网络服务器用...原创 2019-08-27 16:05:10 · 280 阅读 · 0 评论 -
requests库
response = requests.get(url) 得到的是响应类型response.text 得到的是字符串类型response.json()与json.loads(response.text)得到的结果是一样的,都是字典类型响应类型可以直接调用json()跟loads调用response.text类型的效果是一样的,但是两者的参数不同获取二进制数据response = requ...原创 2019-08-28 15:12:32 · 236 阅读 · 0 评论 -
正则表达式
re.match从字符串的开始位置进行匹配,起始位置不匹配则停止最常规的匹配re.match(正则表达式字符串,待匹配对象,匹配模式)import recontent='hello 123 4567 world'result=re.match('^hello\s\d{3}\s\d{4}\sworld$',content)print(result)print(type(result)...原创 2019-08-28 17:50:05 · 126 阅读 · 0 评论 -
Python中的yield
摘自公众号–恋习Python,作者丁彦军以及https://www.runoob.com/python3/python3-iterator-generator.html一、迭代器(iterator)迭代是Python最强大的功能之一,是访问集合元素的一种方式。迭代器是一个可以记住遍历的位置的对象。迭代器对象从集合的第一个元素开始访问,直到所有的元素被访问完结束。迭代器只能往前不会后退。迭代...原创 2019-08-29 10:08:50 · 107 阅读 · 0 评论 -
Selenium的基本使用
Selenium(对位于elements的源码进行操作)自动化测试工具,支持多种浏览器爬虫中主要用来解决JavaScript渲染的问题安装 pip3 install selenium基本使用声明浏览器对象from selenium import webdriver实例化浏览器对象browser = webdriver.Firefox()browser = webdriver.Ch...原创 2019-08-29 10:52:14 · 156 阅读 · 0 评论 -
A/B test
转载自公众号:数据管道,作者:爱德宝器1、A/B test是什么A/B测试(也成为分割测试或桶测试)是一种将网页或应用程序的两个版本相互比较以确定哪个版本的性能更好的方法。A/B测试本质上是一个实验,其中页面的两个或多个变体随机显示给用户,统计分析确定哪个变体杜宇给定的转换目标(指标如CTR)效果更好。2、A/B test工作原理在A/B test中,你可以设置访问网页或应用程序屏幕并对其...原创 2019-08-29 18:01:34 · 619 阅读 · 0 评论 -
Python一些字符串方法
1、center()对一个字符串进行对齐。使用指定的字符进行对齐(默认为空白)。语法:str.center(length,fillchar)length是字符串的长度(必需参数)fillchar是指定填充的字符(可选参数)2、count()返回一个特定值在字符串中出现的次数。语法:str.count(value,start,end)value是待搜索的目标子串(必需参数)start、...原创 2019-08-30 18:51:09 · 112 阅读 · 0 评论 -
静态页面与动态页面
静态网页:(1)静态网页不能简单地理解成静止不动的网页,它主要指的是网页中没有程序代码,只有HTML(即:超文本标记语言),一般后缀为.html,.htm,或者.xml等。虽然静态网页的页面一旦做成,内容就不会再改变了。但是,静态网页也包括一些能动的部分,这些主要是一些GIF动画等(2)静态网页的打开,用户可以直接双击,并且不管任何人任何时间打开的页面的内容都是不变的。动态网页:(1)动态...原创 2019-08-21 20:14:28 · 1872 阅读 · 0 评论