python dataframe函数
主要是介绍dataframe和python常数常用的
所有使用到的包
from cmath import isnan
from typing import List
import requests,json,pandas as pd,time,numpy as np,pymysql,os,configparser,datetime,re,random
from sqlalchemy import create_engine
from lxml import etree
from requests.adapters import HTTPAdapter
from queue import Queue
from difflib import SequenceMatcher#导入库
Merge
合并,将两个dataframe进行合并相当于sql中的表连接(left join ,inner join ,right join等)
df = pd.merge(df1, df2, how='left', on=['id'])
ps : pd.merge 函数名字
-------- df1、df2 dataframe
-------- how 那种链接方式
-------- on 连接条件
Rename
重命名,修改dataframe中的表头名 : 将id修改为iid
df.rename(columns={
'id':'iid'},inplace=True)
创建Dataframe
创建指定字段的空白的Dataframe
df = pd.DataFrame(columns=['url','reg','city','floor_name','address','business','code','date','area','buil_co','room_sum'])
根据数据创建Dataframe,并将字符串添加到Dataframe中
new=pd.DataFrame({
'url':chil_url,'reg':reg,'city':city_name,'floor_name':fang_name,'address':location,'business':busniss,'code':code,'date':start_date,'area':area,'buil_co':buil_co,'room_sum':room_num},index=[0])
根据数据创建Dataframe的另外一种写法
df = pd.DataFrame([[qqqq,bbb,ccc]],columns=('111','222','333'))
根据数据创建Dataframe的第三种写法
data = [
['aaaaa','bbbbb','ccc'],
['aaaaa','bbb','cccc']
]
df = pd.DataFrame(data, columns=['hhhh', 'rrrrr', 'tttt'])
单引号里的为字段名称
冒号后边跟的是变量名
index=[0] : 指定索引为0
示例 : new_df = pandas.DataFrame({‘column_name1’: ‘String1’,‘column_name2’: ‘String2’,…},index=[0])
dff = pd.DataFrame([[fang_id,fang_name,