关闭
当前搜索:

合并数据

1、concat合并数据 import numpy as np import pandas as pd df1 = pd.DataFrame(np.ones((3,4))*1, columns=['A','B','C','D']) df2 = pd.DataFrame(np.ones((3,4))*2, columns=['A','B','C','D']) df3 = pd.Da...
阅读(2) 评论(0)

python设置值及NaN值处理

python 设置值 import pandas as pd import numpy as np dates = pd.date_range('20180101',periods=6) df = pd.DataFrame(np.arange(24).reshape(6,4),index=dates,columns=['A','B','C','D']) print(df)...
阅读(12) 评论(0)

Pandas创建及基本操作

Pandas创建及基本操作 一、Series类型由一组数据及与之相关的数据索引组成。创建的几种方式: import pandas as pd import numpy as np a = pd.Series([1,3,4,np.nan,45]) #1、列表生成 print(a) 0 1.0 1 3.0 2 4.0 3 N...
阅读(16) 评论(0)

pandas数据选择(索引)

import pandas as pd import numpy as np dates = pd.date_range('20180101',periods=6) df = pd.DataFrame(np.arange(24).reshape(6,4),index=dates,columns=['A','B','C','D']) print(df) #基本数据...
阅读(23) 评论(0)

pandas

一、Series类型 Series类型由一组数据及与之相关的数据索引组成。创建: 1、列表 a = pd.Series([5,4,3],index=['a','b','c']) 2、字典 b = pd.Series({'a':5,'b':4,'c':3}, index=['c','a','b','d']) #按index顺序输出,d的值为NaN 3、从ndarray类型创建...
阅读(24) 评论(0)

爬取当当网图书信息

大体思路: 列表页数据条数完整,但单条数据信息不完整,所以先爬取列表页单条数据的url; 再从这个url中提取每条数据的详细信息。import requests import re from bs4 import BeautifulSoup import pandas as pdn=0 name_list=[] price_list=[] r = requests.get("http://sea...
阅读(51) 评论(0)

数学题

寻找质数: for num in range(10,500): for i in range(2,num): if num%i == 0: j = num/i print ('%d = %d x %d' % (num,i,j))#格式可借鉴,用%连接。 break #跳出本循环 else:...
阅读(92) 评论(0)

matplotlib函数

matplotlib函数import matplotlib.pyplot as plt plt.plot(x, y, fortmat_string, **kwargs) 参数说明: ·x,y是数值列表 ·fortmat_string:颜色字符、风格字符、标记字符(可选) ·kwargs:(统一修改) linestyle='dashed'--线型;color='green'--颜色;marker='o...
阅读(59) 评论(0)

Numpy数组

1、列表和数组:列表数据类型可以不同;数组的数据类型相同 2、N维数组对象:ndarray Python已有列表类型,为什么需要一个数组对象(类型)? • 数组对象可以去掉元素间运算所需的循环,使一维向量更像单个数据 • 设置专门的数组对象,经过优化,可以提升这类应用的运算速度 • 数组对象采用相同的数据类型,有助于节省运算和存储空间3、N维数组对象:ndarray ndarray是一...
阅读(81) 评论(0)

CD数据分析

import pandas as pd import numpy as np import matplotlib.pyplot as plt%matplotlib inline plt.style.use('ggplot')columns = ['UID','order_dt','product','amount'] df = pd.read_csv(r'C:\Users\shanminghuo\D...
阅读(43) 评论(0)

爬取当当网图书图片

import requests from bs4 import BeautifulSoup import redef getHTMLText(url): try: r = requests.get(url) r.encoding = r.apparent_encoding r.raise_for_status() return...
阅读(75) 评论(0)

merge, datime64

merge函数使用: http://pandas.pydata.org/pandas-docs/stable/merging.htmltimestamp解释:瘳雪峰Datetimes and Timedeltas: https://docs.scipy.org/doc/numpy/reference/arrays.datetime.html timedelta64帮助完善Datetimes功能...
阅读(62) 评论(0)

数据分析

import pandas as pd import numpy as np import matplotlib.pyplot as plt%matplotlib inline plt.style.use('ggplot')columns = ['UID','order_dt','product','amount'] df = pd.read_csv(r'C:\Users\think\Desktop...
阅读(59) 评论(0)

datetime

一、pandas库中的to_datetime函数:pandas.to_datetime: pandas.to_datetime(arg, errors=’raise’, dayfirst=False, yearfirst=False, utc=None, box=True, format=None, exact=True, unit=None, infer_datetime_format=Fals...
阅读(55) 评论(0)

爬取天气数据+热力图

第一次用旧知识爬取天气网站数据。import requests from bs4 import BeautifulSoup import bs4def getHTMLText(url): try: r = requests.get(url) r.raise_for_status() r.encoding = r.apparent_encodin...
阅读(127) 评论(0)

正则表达式

常用操作符: 正则表达式表达类型:原生字符串类型(不包含转义符的字符串,即\;可在字符串前加r,如:r’text’re 库函数: re库的另一种用法:编译后多次操作 pattern = re.compile(r’[1-9]\d{5}’) rst = pattern.search(‘BIT 100081’)match对象: 最小匹配: re库默认贪婪匹配,即输出匹配最长的子...
阅读(62) 评论(0)

大学排名信息爬取

import requests from bs4 import BeautifulSoup import bs4def getHTMLText(url): try: r = requests.get(url) r.raise_for_status() r.encoding = r.apparent_encoding return...
阅读(96) 评论(0)

format函数

format 函数可以接受不限个参数,位置可以不按顺序>>>"{} {}".format("hello", "world") # 不设置指定位置,按默认顺序 'hello world'>>> "{0} {1}".format("hello", "world") # 设置指定位置 'hello world'>>> "{1} {0} {1}".format("hello", "world")...
阅读(81) 评论(0)

BeautifulSoup0929

Beautiful Soup类基本元素: 例、… …:标签Tag ‘p’:标签名字name class=”title”:属性Attributes,通常以键值对形式出现 标签内非属性字符串NavigableString 标签内字符串注释部分CommentBeautifulSoup库: 引用方式:from bs4 import BeautifulSoup...
阅读(66) 评论(0)

Requests20170928

HTTP协议: URL格式:http://host:port[path] host:合法的Internet主机域名或IP地址 path:请求资源的路径URL是通过HTTP协议存取资源的Internet路径。requests库的主要方法: 1、r = requests.request():构造一个请求,支撑以下各方法的基础方法 2、r = requests.get():获取HTML网页的主要...
阅读(51) 评论(0)
22条 共2页1 2 下一页 尾页
    个人资料
    • 访问:1297次
    • 积分:218
    • 等级:
    • 排名:千里之外
    • 原创:21篇
    • 转载:1篇
    • 译文:0篇
    • 评论:0条