Pandas 频次统计、加入新的计数列并按某一列去重保留重复项最新的一条记录

阿里云2000元红包!本站用户参与享受九折优惠!

初始表结构:


data.png

先添加新的一列 count (根据 elder_no 计数统计并把计数加入到新列)

df['count'] = df['elder_no'].apply(
                lambda x: dict(df['elder_no'].value_counts())[x])
# 相同的 "elder_no" count 数值一样


add count.png

去重, elder_no 重复项按照 atime 保留最近的一条

finnal_df = df.iloc[df.groupby(['elder_no']).apply(
                lambda x: x['atime'].idxmax())]


finnal.png
https://www.jianshu.com/p/52b4db4385f3

Python量化投资网携手4326手游为资深游戏玩家推荐:《《影之诗》SNC下半年积分赛落幕,榜单四强晋级名额诞生!

「点点赞赏,手留余香」

    还没有人赞赏,快来当第一个赞赏的人吧!
Matplotlib
0 条回复 A 作者 M 管理员
    所有的伟大,都源于一个勇敢的开始!
欢迎您,新朋友,感谢参与互动!欢迎您 {{author}},您在本站有{{commentsCount}}条评论