Pandas常用方法总结

阿里云双11来了!从本博客参与阿里云,服务器最低只要86元/年!

读写Excel

import pandas as pd
df = pd.read_excel('data.xlsx')
import pandas as pd
df = pd.read_excel('data.xlsx')
writer = pd.ExcelWriter('out.xlsx')
df2 = pd.DataFrame(data = df['column0']) #取出data的column[0]存入out.xlsx中
df2.to_excel(writer, 'sheet1', index = False) #只保存column[0]而没有index
writer.save()
————————————————
版权声明:本文为CSDN博主「zhangriqi」的原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/zhangriqi/article/details/81136780

读取多表

import pandas as pd
f = pd.ExcelFile('./data/meal_order_detail.xlsx')
f.sheet_names  # 获取工作表名称
 
data = pd.DataFrame()
for i in f.sheet_names:
    d = pd.read_excel('./data/meal_order_detail.xlsx', sheetname=i)
————————————————
版权声明:本文为CSDN博主「Animeisme」的原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/Animeisme/article/details/91960382

写入多表

本方法可以通过使用excel_writer防止覆盖

writer = pd.ExcelWriter(file)
for i in range(len(sheet)):
    df = pd.DataFrame(data[i])
    df.to_excel(excel_writer=writer, sheet_name=sheet[i])
writer.save()
writer.close()
————————————————
版权声明:本文为CSDN博主「Hank.HE」的原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/baidu_27032161/article/details/90231299

创建DataFrame

表操作

列/行操作

基础理论

axis:
axis=0代表往跨行(down),即每列,而axis=1代表跨列(across),即一行


image.png

apply()
沿DataFrame的输入轴应用函数,常常搭配匿名函数。
DataFrame.apply(func, axis=0, broadcast=False, raw=False, reduce=None, args=(), **kwds)

索引

按列名选择列、行(相当于loc?)

import pandas as pd
d = {'one' : pd.Series([1, 2, 3], index=['a', 'b', 'c']),
      'two' : pd.Series([1, 2, 3, 4], index=['a', 'b', 'c', 'd'])}
df = pd.DataFrame(d)
print df ['one']
//原文出自【易百教程】,商业转载请联系作者获得授权,非商业请保留原文链接:https://www.yiibai.com/pandas/python_pandas_dataframe.html

通过将行标签传递给loc()函数来选择行。二维可索引单元格,如df.loc(“2017-08-14”,2)

import pandas as pd
d = {'one' : pd.Series([1, 2, 3], index=['a', 'b', 'c']), 
     'two' : pd.Series([1, 2, 3, 4], index=['a', 'b', 'c', 'd'])}
df = pd.DataFrame(d)
print df.loc['b']
//原文出自【易百教程】,商业转载请联系作者获得授权,非商业请保留原文链接:https://www.yiibai.com/pandas/python_pandas_dataframe.html

将整数位置传递给iloc()函数来选择行。二维可索引单元格,如df.iloc(2,2)

import pandas as pd
d = {'one' : pd.Series([1, 2, 3], index=['a', 'b', 'c']),
     'two' : pd.Series([1, 2, 3, 4], index=['a', 'b', 'c', 'd'])}
df = pd.DataFrame(d)
print df.iloc[2]
//原文出自【易百教程】,商业转载请联系作者获得授权,非商业请保留原文链接:https://www.yiibai.com/pandas/python_pandas_dataframe.html

索引可以在其中填写条件表达式,如将某一列中值大于4的筛选出来
df[‘one’][df[‘one’] > 4] = 0

行/列数

列/行名修改

df1.rename(columns={‘c’:’D’},inplace=True)

值替换

replace() Inplace
以一个单元格的完整的值匹配的,无法深入到单元格内容之内

按照值筛选

outfile = df1[(df1[u'设计井别']=='11') & (df1[u'投产井别']=='11') &(df1[u'目前井别']=='11')]

单元格操作

定位/索引

缺失值与空值处理

df.dropna()
df.fillna()
df.isnull()
df.isna()
https://blog.csdn.net/lwgkzl/article/details/80948548

https://www.jianshu.com/p/fdb969c66108

Python量化投资网携手4326手游为资深游戏玩家推荐:《《妖恋奇谭:光芒》最新BUG问题收集站

「点点赞赏,手留余香」

    还没有人赞赏,快来当第一个赞赏的人吧!
Matplotlib
0 条回复 A 作者 M 管理员
    所有的伟大,都源于一个勇敢的开始!
欢迎您,新朋友,感谢参与互动!欢迎您 {{author}},您在本站有{{commentsCount}}条评论