如何优雅的解决群友的Python问题?

01 问题描述

这个问题来源于自己Python交流群中的一个问题,如下图所示,需要计算每列中各值的出现次数,然后组成一个新的表。

02 解决思路

计算每列各值的出现次数,我们可以使用groupby方法,当然最简单的还是使用value_counts方法。

  • 首先读取数据
  • 接着使用一个循环语句,依次计算每列的值计算
  • (由于每列的值计数返回的是series数据,而且我们也需要在结果表中的一列加上列名),构建每列值计数的dataframe。
  • 最后将这些dataframe合并即可。
03 解决代码
import pandas as pd
data = pd.read_excel('例子.xlsx',sheetname='Sheet1',index_col='index')
frames = []
for i in data.columns:
    s = data[i].value_counts().sort_values()
    d = pd.DataFrame({'列名':i,'变量名':s.index,'次数':s.values})
    frames.append(d)
    
result = pd.concat(frames)
result

这样,就可以通过不到10行的代码就可以优雅的解决群友的问题啦,不得不说Python以及pandas的强大了。

https://www.jianshu.com/p/054eeedf72d8

「点点赞赏,手留余香」

    还没有人赞赏,快来当第一个赞赏的人吧!
0 条回复 A 作者 M 管理员
    所有的伟大,都源于一个勇敢的开始!
欢迎您,新朋友,感谢参与互动!欢迎您 {{author}},您在本站有{{commentsCount}}条评论