自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(19)
  • 收藏
  • 关注

原创 Pyhton零基础投喂(综合练习:5.作者信息关联)

# 导⼊所需的packageimport seaborn as sns #⽤于画图from bs4 import BeautifulSoup #⽤于爬取arxiv的数据import re #⽤于正则表达式,匹配字符串的模式import requests #⽤于⽹络连接,发送⽹络请求,使⽤域名获取对应信息import json #读取数据,我们的数据为json格式的import pandas as pd #数据处理,数据分析import matplotlib.pyplot as plt #画图⼯

2021-01-25 22:15:18 145

原创 Pyhton零基础投喂(综合练习:4.论⽂文种类分类).py

# 导⼊所需的packageimport seaborn as sns #⽤于画图from bs4 import BeautifulSoup #⽤于爬取arxiv的数据import re #⽤于正则表达式,匹配字符串的模式import requests #⽤于⽹络连接,发送⽹络请求,使⽤域名获取对应信息import json #读取数据,我们的数据为json格式的import pandas as pd #数据处理,数据分析import matplotlib.pyplot as plt #画图⼯

2021-01-22 21:17:51 175

原创 Pyhton零基础投喂(综合练习:3.论⽂文代码统计)

# 导⼊所需的packageimport seaborn as sns #⽤于画图from bs4 import BeautifulSoup #⽤于爬取arxiv的数据import re #⽤于正则表达式,匹配字符串的模式import requests #⽤于⽹络连接,发送⽹络请求,使⽤域名获取对应信息import json #读取数据,我们的数据为json格式的import pandas as pd #数据处理,数据分析import matplotlib.pyplot as plt #画图⼯

2021-01-20 09:47:54 154 2

原创 Pyhton零基础投喂(综合练习:2:论⽂作者统计)

1.任务说明''' 任务说明任务主题:论⽂作者统计,统计所有论⽂作者出现评率Top10的姓名;任务内容:论⽂作者的统计、使⽤ Pandas 读取数据并使⽤字符串操作;任务成果:学习 Pandas 的字符串操作;'''' 任务说明\n任务主题:论⽂作者统计,统计所有论⽂作者出现评率Top10的姓名;\n任务内容:论⽂作者的统计、使⽤ Pandas 读取数据并使⽤字符串操作;\n任务成果:学习 Pandas 的字符串操作;'2.数据处理步骤'''在原始arxiv数据集中论⽂作者 authors

2021-01-16 18:22:17 823

原创 Pyhton零基础投喂(综合练习:1.论⽂数据统计)

1.导⼊package并读取原始数据# 导⼊所需的packageimport seaborn as sns #⽤于画图from bs4 import BeautifulSoup #⽤于爬取arxiv的数据import re #⽤于正则表达式,匹配字符串的模式import requests #⽤于⽹络连接,发送⽹络请求,使⽤域名获取对应信息import json #读取数据,我们的数据为json格式的import pandas as pd #数据处理,数据分析import matplotlib

2021-01-13 23:25:47 212

原创 Task06:综合练习

Task06:综合练习练习⼀: 各部⻔⼯资最⾼的员⼯(难度:中等)创建Employee 表,包含所有员⼯信息,每个员⼯有其对应的 Id, salary 和 department Id。1 ±—±------±-------±-------------+2 | Id | Name | Salary | DepartmentId |3 ±—±------±-------±-------------+4 | 1 | Joe | 70000 | 1 |5 | 2 | Henry | 80000 | 2

2020-12-26 09:58:30 139

原创 SQL零基础投喂(SQL⾼级处理)

Task05:SQL⾼级处理5.1 窗⼝函数5.1.1 窗⼝函数概念及基本的使⽤⽅法窗⼝函数也称为 OLAP 函数 。OLAP 是 OnLine Analytical Processing 的简称,意思是对数据库数据进⾏实时分析处理。为了便于理解,称之为窗⼝函数。常规的SELECT语句都是对整张表进⾏查询,⽽窗⼝函数可以让我们有选择的去某⼀部分数据进⾏汇总、计算和排序。窗⼝函数的通⽤形式:<窗口函数> OVER ([PARTITION BY <列名>]ORDER BY

2020-12-26 09:55:01 98

原创 SQL零基础投喂(集合运算)

Task04: 集合运算4.1 表的加减法4.1.1 什么是集合运算集合 在数学领域表示“各种各样的事物的总和”, 在数据库领域表示记录的集合. 具体来说,表、视图和查询的执⾏结果都是记录的集合, 其中的元素为表或者查询结果中的每⼀⾏.在标准 SQL 中, 分别对检索结果使⽤ UNION , INTERSECT, EXCEPT 来将检索结果进⾏并,交和差运算, 像 UNION , INTERSECT , EXCEPT 这种⽤来进⾏集合运算的运算符称为集合运算符.4.1.2 表的加法–UNIO

2020-12-22 17:37:52 234

原创 Python零基础投喂(索引器)

import numpy as npimport pandas as pd3.1 索引器3.1.1 表的列索引# 列索引是最常见的索引形式,一般通过 [] 来实现。通过 [列名] 可以从 DataFrame 中取出相应的列,返回值# 为 Series ,例如从表中取出姓名一列:df=pd.read_csv('E:/DW学习/Python 学习代码/joyful-pandas-master/data/learn_pandas.csv', usecols=['Scho

2020-12-22 17:35:22 365

原创 SQL零基础投喂(复杂⼀点的查询)

Task03:复杂⼀点的查询之前接触了sql基本的查询⽤法,接下来介绍⼀些相对复杂的⽤法。3.1 视图我们先来看⼀个查询语句1 SELECT stu_name FROM view_students_info;单从表⾯上看起来这个语句是和正常的从数据表中查询数据是完全相同的,但其实我们操作的是⼀个视图。所以从SQL的⻆度来说操作视图与操作表看起来是完全相同的,那么为什么还会有视图的存在呢?视图到底是什么?视图与表有什么不同呢?3.1.1 什么是视图视图是⼀个虚拟的表,不同于直接操作数据表,视

2020-12-20 20:00:33 960

原创 Python零基础投喂(Pandas基础)

PANDAS 基础import numpy as npimport pandas as pdpd.__version__'1.1.5'2.1 文件的读取和写入2.1.1 文件读取# pandas 可以读取的文件格式有很多,这里主要介绍读取 csv, excel, txt 文件df_csv = pd.read_csv('E:/DW学习/Python 学习代码/joyful-pandas-master/data/my_csv.csv')df_csv

2020-12-19 23:44:30 464 1

原创 SQL零基础投喂(基础查询与排序)

**Task02:基础查询与排序**2.1.1 从表中选取数据SELECT语句从表中选取数据时需要使⽤SELECT语句,也就是只从表中选出(SELECT)必要数据的意思。通过SELECT语句查询并选取出必要数据的过程称为匹配查询或查询(query)。基本SELECT语句包含了SELECT和FROM两个⼦句(clause)。示例如下:SELECT <列名> FROM <表名>;其中,SELECT⼦句中列举了希望从表中查询出的列的名称,⽽FROM⼦句则指定了选取出数据

2020-12-17 20:09:39 145

原创 Python零基础投喂(Pandas预备知识)

1.1 Python 基础1.1.1 列表推导式与条件赋值# 在生成一个数字序列的时候,在 Python 中可以如下写出:L = []def my_func(x): return 2+xfor i in range(5): L.append(my_func(i))L[2, 3, 4, 5, 6]#事实上可以利用列表推导式进行写法上的简化:[* for i in *] 。其中,第一个 * 为映射函数,其输入为后面 i#指代的内容,第二个 * 表示迭代的对象。[my_f

2020-12-16 21:56:39 148

原创 SQL零基础投喂(初识数据库)

1.1 初识数据库数据库是将大量数据保存起来,通过计算机加工而成的可以进行高效访问的数据集合。该数据集合称为数据库(Database,DB)。用来管理数据库的计算机系统称为数据库管理系统(Database Management System,DBMS)。``1.1.1 DBMS的种类DBMS 主要通过数据的保存格式(数据库的种类)来进行分类,现阶段主要有以下 5 种类型.层次数据库(Hierarchical Database,HDB)关系数据库(Relational Database,RDB)

2020-12-15 21:33:06 160 1

原创 Python零基础投喂(前四节回顾练习)

回顾练习'''本次练习使用 鸢尾属植物数据集 .\iris.data ,在这个数据集中,包括了三类不同的鸢尾属植物:Iris Setosa,Iris Versicolour,Iris Virginica。每类收集了50个样本,因此这个数据集一共包含了150个样本。sepallength:萼片长度sepalwidth:萼片宽度petallength:花瓣长度petalwidth:花瓣宽度'''# 1.导入鸢尾属植物数据集,保持文本不变。import numpy as npoutfile

2020-12-01 22:52:23 185

原创 python零基础投喂(4.线性代数)

线性代数'''Numpy 定义了 matrix 类型,使用该 matrix 类型创建的是矩阵对象,它们的加减乘除运算缺省采用矩阵方式计算,因此用法和Matlab十分类似。但是由于 NumPy 中同时存在 ndarray 和 matrix对象,因此用户很容易将两者弄混。这有违 Python 的“显式优于隐式”的原则,因此官方并不推荐在程序中使用 matrix 。在这里,我们仍然用 ndarray 来介绍。'''一、矩阵和向量积# 矩阵的定义、矩阵的加法、矩阵的数乘、矩阵的转置与二维数组完全一

2020-11-29 20:48:09 341

原创 Python零基础投喂(3.统计相关)

统计相关一、次序统计量1.计算最小值# numpy.amin(a[, axis=None, out=None, keepdims=np._NoValue, initial=np._NoValue,# where=np._NoValue]) Return the minimum of an array or minimum along an axis.# 【例】计算最小值import numpy as npx=np.array([[11,12,13,14,15], [1

2020-11-27 17:31:11 221

原创 Python零基础投喂(2.随机抽样)

随机抽样'''numpy.random 模块对 Python 内置的 random 进行了补充,增加了一些用于高效生成多种概率分布的样本值的函数,如正态分布、泊松分布等。numpy.random.seed(seed=None) Seed the generator.seed() 用于指定随机数生成时所用算法开始的整数值,如果使用相同的 seed() 值,则每次生成的随机数都相同,如果不设置这个值,则系统根据时间来自己选择这个值,此时每次生成的随机数因时间差异而不同。*注意:在对数据进行预处理

2020-11-25 21:19:49 298

原创 Python零基础投喂(1.数据的输入和输出)

1输入和输出1.1numpy 二进制文件建立import numpy as np#save() 、 savez() 和 load() 函数以 numpy 专用的二进制类型(npy、npz)保存和读取数据,这#三个函数会自动处理ndim、dtype、shape等信息,使用它们读写数组非常方便,但是 save() 输出#的文件很难与其它语言编写的程序兼容。#npy格式:以二进制的方式存储文件,在二进制文件第一行以文本形式保存了数据的元信息(ndim,#dtype,shape等),可以用二进制工具

2020-11-23 19:03:24 287

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除