参考:
pandas与sql
pandas和sql在很多操作上都是类似的,如果熟悉sql操作,也可以很方便地使用pandas
首先需要引用两个库
|
|
本文使用的数据来源是tips, 假设有与之同名同结构的数据表
|
|
tips的数据是这样的1234567>>> tips.head() total_bill tip sex smoker day time size0 16.99 1.01 Female No Sun Dinner 21 10.34 1.66 Male No Sun Dinner 32 21.01 3.50 Male No Sun Dinner 33 23.68 3.31 Male No Sun Dinner 24 24.59 3.61 Female No Sun Dinner 4
下面将介绍常见sql操作与pandas操作的对应关系
select
sql
|
|
pandas
|
|
如果要select * from tips
, 则对应的pandas操作就是
|
|
where
select * where
sql
|
|
pandas
|
|
或者
|
|
select (columns) where
sql
|
|
pandas
|
|
select where and/or
sql1select * from tips where time = 'Dinner' and tip > 5.0 limit 10;
pandas
|
|
或者
|
|
sql
|
|
pandas
|
|
sql
|
|
pandas
|
|
判断是否为null
两个函数, isnull()和notnull()
|
|
|
|
group by
group by count
sql
|
|
pandas
|
|
注意pandas里也有一个count
函数,与sql中的count
不一样。pandas的count
函数会作用到每一列,返回每列的非空数量。
|
|
使用多个聚合函数
|
|
pandas
|
|