分类:pandas

在管道中用sklearn-pandas实现变换映射

sklearn_pandas最主要的功能是通过其自创的DataFrameMapper类简洁高效地实现大部分特征变换。 DataFrameMapper 接受的变换类型是 sklearn 的 transformer 类,因而除了 sklearn 中常见的变换(标准化、正规化、二值化等...

21小时前 4℃ 0喜欢

pandas处理日期AM/PM

           在日常中,从页面下载Excel文件,发现时间这列会显示“Apr 1, 2019 05:31 PM”、“Apr 1, 2019 10:10 AM”,而往往我们不需要这种格式的数据,需要转化成我们需要的:“2019/4/1 17:31:00”、“2019/4/1...

21小时前 7℃ 0喜欢

高考志愿怎么报?582个专业,1281个本科院校,你会如何选择?

从前两天开始,各省市关于高考成绩放榜和各批次录取分数线都陆续出炉,教育部也发布了最新的全国高等学校名单。 于是乎,所谓的野鸡大学也就无处躲藏了。 也给广大的高考生在填报志愿的时候,提供了一个参考。 当然本次不讨论这个… 最新发布的名单没有本科院校的数量,于是小F...

22小时前 10℃ 0喜欢

Python 数据分析2019陕西高考(理工)成绩及填写志愿 !

1.背景 侄子今年高考, 我姐说:既然你会数据分析, 耐组给咱分析一哈!(关中方言) 2.录取分数线 纳尼?三本呢? 三本不存在的, 2019年陕西省二本生吞了三本。 数据不难找,度娘来帮忙, 将近几年图片表格转换整理: <tt-image data-tteditor-...

23小时前 11℃ 0喜欢

pandas读取文件的read_csv()

参数: filepath_or_buffer: 字符串,或者任何对象的read()方法。这个字符串可以是URL,有效的URL方案包括http、ftp、s3和文件。可以直接写入"文件名.csv" header: 将行号用作列名,且是数据的开头。 注意当skip_blank_lin...

2天前 16℃ 0喜欢

时间序列挖掘分析:tsfresh特征中文(二)

【说明】 应大家要求,我把第二部分文档提供出来,这部分文档是由我的前同事Thomas整理的,大家对于完整的md文件可以参见我们的GitHub项目https://github.com/SimaShanhe/tsfresh-feature-translation。 max_lange...

2天前 17℃ 0喜欢

pandas筛选不是NA值

pandas中筛选某一列中不是NA的值用notna()方法 >>> df = pd.DataFrame(np.random.randn(6,5),columns=list('ABCDE')) >>> df.loc[1,:-2] = np.nan...

3天前 12℃ 0喜欢