mysql 修改索引类型_数据科学 第 3 章 4:连接mysql、改类型、索引应用

今天开始学习《数据科学手册》,主要学习3-5章,其他的选修。

-- 先连接数据库加载数据:

用sqlalchemy 的create_engine连接:

注意:代码里mysql+pymysql: 这部分不能加空格,否则会报错

import pymysql

import pandas as pd

from sqlalchemy import create_engine

sql = "select * from sougou"

engine = create_engine('mysql+pymysql://root:123456@192.168.200.200/xiaom')

df = pd.read_sql(sql,engine,)

查看每列的格式:

RangeIndex: 2324 entries, 0 to 2323

Data columns (total 6 columns):

date 2324 non-null object

id 2324 non-null object

word 2324 non-null object

rank1 2324 non-null object

number1 2324 non-null object

url 2324 non-null object

dtypes: object(6)

memory usage: 109.0+ KB

-- 改rank1、number1的格式

data =df

data[['rank1','number1']] = data[['rank1','number1']].apply(pd.to_numeric,errors='coerce')

data

9c302d51b2e4d4993c0577af98f1a76d.png

第3章4-6节:索引

-- loc、iloc、ix的运用

1、多重索引 两个条件

data[(data['rank1'] > 10) & (data['number1'] > 10)]

b0b7a45534adef0c94a3f15f446d8721.png

2、loc与iloc的区别:loc[1:3]包含2-4条,iloc为2-3条 ,不含第4条数据

ff7740a2d8d3aa35fb1338fcea3a29b4.png

3、行列转换:data.T

ca71cc6a3bde0de6aa48a8a46b9ab203.png

4、用iloc取指定行列数据:

data.iloc[1:3,3:4]

data.iloc[:,2:4]

data.iloc[:,:'rank1'] #从前面取到rank1列

e850b3e4cf9b68f80188df8bce0f1cfc.png

5、没怎么懂的pd.MultiIndex.from_tuples(),直接跳过

6、设置索引、索引排序:

set_index(inplace = True) 会在原数据集上修改

sort_index()

reset_index(drop= True) # 重设索引为默认索引

indexdata = data

indexdata.set_index(data['rank1'], inplace = True)

indexdata.sort_index()

indexdata.reset_index(drop= True) #重设索引为默认索引

fecabe82c14e1a771d0a9e2442c3dedf.png

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值