19-11-27

阿里云2000元红包!本站用户参与享受九折优惠!

以下为11.27日python笔记:

文件路径
import os 
os.getcwd() #显示当前工作路径
os.chdir() #修改工作路径
os.listdir() #显示路径下的文件名,不在()里指定路径,则默认显示工作路径下的内容
matplotlib不显示中文和负号
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif']=['SimHei'] #用来正常显示中文标签
plt.rcParams['axes.unicode_minus']=False #用来正常显示负号
打开csv格式
df=pd.read_csv(path,header=0,encoding='gbk',engine='python')
#如果gbk格式报错,可以尝试用编译更广的‘gb18030’
显示列名
df.columns.values
#或者
df.columns.values.tolist() #直接转为list
好用的转置T
df.T.style #这样写可以在预览数据时帮助很大
数据筛选
#去除null值
df=df[df['列名'].notnull()]
#模糊匹配,当数据中存在null值时str.contains会报错
df[df['列名'].str.contains('需要匹配的文字')]
透视表 povit_table
pd.pivot_table(df,index=['列名'],columns=['列名'],values=['列名'],aggfuc=['统计函数'],fill_value=0) 
#其中columns和fill_values为可选项.
#需要注意的是,values使用的列里不能存在null值,否则会报错
多级索引转单层索引 Multiindex→index
#多级索引其实就是带层数的单层索引,多层索引会多一个levels特性,因此在Multiindex里获取index,可使用
index_1=t2.columns.levels[1]
删除列名中的重复字符(透视表转换出的表格此需求较多)
#使用str.replace()
df.columns=df.columns.str.replace('需要替换的字符','') 
matplotlib的图例设置legend
plt.legend(loc='upper center',bbox_to_anchor=(0.5,0.95),ncol=3)
#以上为图例的调节方式,bbox_to_anchor 控制图例的相对位置,(0.5,0.95)代表在x轴上居中,在y轴上95%位置;ncol控制列数
matplotlib旋转横坐标文字
import pylab as pl
pl.xticks(rotation=360)

https://www.jianshu.com/p/f8eb859c90c6

「点点赞赏,手留余香」

    还没有人赞赏,快来当第一个赞赏的人吧!
0 条回复 A 作者 M 管理员
    所有的伟大,都源于一个勇敢的开始!
欢迎您,新朋友,感谢参与互动!欢迎您 {{author}},您在本站有{{commentsCount}}条评论