Python零基础投喂
文章平均质量分 74
心有猛虎嗷嗷待哺
文良而颜丑
展开
-
Pyhton零基础投喂(综合练习:5.作者信息关联)
# 导⼊所需的packageimport seaborn as sns #⽤于画图from bs4 import BeautifulSoup #⽤于爬取arxiv的数据import re #⽤于正则表达式,匹配字符串的模式import requests #⽤于⽹络连接,发送⽹络请求,使⽤域名获取对应信息import json #读取数据,我们的数据为json格式的import pandas as pd #数据处理,数据分析import matplotlib.pyplot as plt #画图⼯原创 2021-01-25 22:15:18 · 158 阅读 · 0 评论 -
Pyhton零基础投喂(综合练习:4.论⽂文种类分类).py
# 导⼊所需的packageimport seaborn as sns #⽤于画图from bs4 import BeautifulSoup #⽤于爬取arxiv的数据import re #⽤于正则表达式,匹配字符串的模式import requests #⽤于⽹络连接,发送⽹络请求,使⽤域名获取对应信息import json #读取数据,我们的数据为json格式的import pandas as pd #数据处理,数据分析import matplotlib.pyplot as plt #画图⼯原创 2021-01-22 21:17:51 · 202 阅读 · 0 评论 -
Pyhton零基础投喂(综合练习:3.论⽂文代码统计)
# 导⼊所需的packageimport seaborn as sns #⽤于画图from bs4 import BeautifulSoup #⽤于爬取arxiv的数据import re #⽤于正则表达式,匹配字符串的模式import requests #⽤于⽹络连接,发送⽹络请求,使⽤域名获取对应信息import json #读取数据,我们的数据为json格式的import pandas as pd #数据处理,数据分析import matplotlib.pyplot as plt #画图⼯原创 2021-01-20 09:47:54 · 230 阅读 · 2 评论 -
Pyhton零基础投喂(综合练习:2:论⽂作者统计)
1.任务说明''' 任务说明任务主题:论⽂作者统计,统计所有论⽂作者出现评率Top10的姓名;任务内容:论⽂作者的统计、使⽤ Pandas 读取数据并使⽤字符串操作;任务成果:学习 Pandas 的字符串操作;'''' 任务说明\n任务主题:论⽂作者统计,统计所有论⽂作者出现评率Top10的姓名;\n任务内容:论⽂作者的统计、使⽤ Pandas 读取数据并使⽤字符串操作;\n任务成果:学习 Pandas 的字符串操作;'2.数据处理步骤'''在原始arxiv数据集中论⽂作者 authors原创 2021-01-16 18:22:17 · 879 阅读 · 0 评论 -
Pyhton零基础投喂(综合练习:1.论⽂数据统计)
1.导⼊package并读取原始数据# 导⼊所需的packageimport seaborn as sns #⽤于画图from bs4 import BeautifulSoup #⽤于爬取arxiv的数据import re #⽤于正则表达式,匹配字符串的模式import requests #⽤于⽹络连接,发送⽹络请求,使⽤域名获取对应信息import json #读取数据,我们的数据为json格式的import pandas as pd #数据处理,数据分析import matplotlib原创 2021-01-13 23:25:47 · 236 阅读 · 0 评论 -
Python零基础投喂(索引器)
import numpy as npimport pandas as pd3.1 索引器3.1.1 表的列索引# 列索引是最常见的索引形式,一般通过 [] 来实现。通过 [列名] 可以从 DataFrame 中取出相应的列,返回值# 为 Series ,例如从表中取出姓名一列:df=pd.read_csv('E:/DW学习/Python 学习代码/joyful-pandas-master/data/learn_pandas.csv', usecols=['Scho原创 2020-12-22 17:35:22 · 382 阅读 · 0 评论 -
Python零基础投喂(Pandas基础)
PANDAS 基础import numpy as npimport pandas as pdpd.__version__'1.1.5'2.1 文件的读取和写入2.1.1 文件读取# pandas 可以读取的文件格式有很多,这里主要介绍读取 csv, excel, txt 文件df_csv = pd.read_csv('E:/DW学习/Python 学习代码/joyful-pandas-master/data/my_csv.csv')df_csv原创 2020-12-19 23:44:30 · 497 阅读 · 1 评论 -
Python零基础投喂(Pandas预备知识)
1.1 Python 基础1.1.1 列表推导式与条件赋值# 在生成一个数字序列的时候,在 Python 中可以如下写出:L = []def my_func(x): return 2+xfor i in range(5): L.append(my_func(i))L[2, 3, 4, 5, 6]#事实上可以利用列表推导式进行写法上的简化:[* for i in *] 。其中,第一个 * 为映射函数,其输入为后面 i#指代的内容,第二个 * 表示迭代的对象。[my_f原创 2020-12-16 21:56:39 · 164 阅读 · 0 评论 -
Python零基础投喂(前四节回顾练习)
回顾练习'''本次练习使用 鸢尾属植物数据集 .\iris.data ,在这个数据集中,包括了三类不同的鸢尾属植物:Iris Setosa,Iris Versicolour,Iris Virginica。每类收集了50个样本,因此这个数据集一共包含了150个样本。sepallength:萼片长度sepalwidth:萼片宽度petallength:花瓣长度petalwidth:花瓣宽度'''# 1.导入鸢尾属植物数据集,保持文本不变。import numpy as npoutfile原创 2020-12-01 22:52:23 · 203 阅读 · 0 评论 -
python零基础投喂(4.线性代数)
线性代数'''Numpy 定义了 matrix 类型,使用该 matrix 类型创建的是矩阵对象,它们的加减乘除运算缺省采用矩阵方式计算,因此用法和Matlab十分类似。但是由于 NumPy 中同时存在 ndarray 和 matrix对象,因此用户很容易将两者弄混。这有违 Python 的“显式优于隐式”的原则,因此官方并不推荐在程序中使用 matrix 。在这里,我们仍然用 ndarray 来介绍。'''一、矩阵和向量积# 矩阵的定义、矩阵的加法、矩阵的数乘、矩阵的转置与二维数组完全一原创 2020-11-29 20:48:09 · 381 阅读 · 0 评论 -
Python零基础投喂(3.统计相关)
统计相关一、次序统计量1.计算最小值# numpy.amin(a[, axis=None, out=None, keepdims=np._NoValue, initial=np._NoValue,# where=np._NoValue]) Return the minimum of an array or minimum along an axis.# 【例】计算最小值import numpy as npx=np.array([[11,12,13,14,15], [1原创 2020-11-27 17:31:11 · 238 阅读 · 0 评论 -
Python零基础投喂(2.随机抽样)
随机抽样'''numpy.random 模块对 Python 内置的 random 进行了补充,增加了一些用于高效生成多种概率分布的样本值的函数,如正态分布、泊松分布等。numpy.random.seed(seed=None) Seed the generator.seed() 用于指定随机数生成时所用算法开始的整数值,如果使用相同的 seed() 值,则每次生成的随机数都相同,如果不设置这个值,则系统根据时间来自己选择这个值,此时每次生成的随机数因时间差异而不同。*注意:在对数据进行预处理原创 2020-11-25 21:19:49 · 332 阅读 · 0 评论 -
Python零基础投喂(1.数据的输入和输出)
1输入和输出1.1numpy 二进制文件建立import numpy as np#save() 、 savez() 和 load() 函数以 numpy 专用的二进制类型(npy、npz)保存和读取数据,这#三个函数会自动处理ndim、dtype、shape等信息,使用它们读写数组非常方便,但是 save() 输出#的文件很难与其它语言编写的程序兼容。#npy格式:以二进制的方式存储文件,在二进制文件第一行以文本形式保存了数据的元信息(ndim,#dtype,shape等),可以用二进制工具原创 2020-11-23 19:03:24 · 323 阅读 · 0 评论