python:SyntaxError: Non-UTF-8 code starting wit… – Python量化投资

python:SyntaxError: Non-UTF-8 code starting wit…

1、错误类型描述

python编程,用pandas库导入数据的时候,遇到一个错误:

SyntaxError: Non-UTF-8 code starting with ‘\xa1’ in file D:/ssslll/programe/PycharmProjects/MDT_bigdata_tables/weakcover1.py on line 7, but no encoding declared; see http://python.org/dev/peps/pep-0263/ for details

2、问题解决过程

在网上查了一些解决办法,都没有解决,包含以下方法:

  • 1、在代码首行添加如下
1 # coding = gbk
  • 2、在代码首行添加如下
1 # coding = utf-8

但是都没有解决,程序依然报错。于是我想起来gbk有几种格式,试了下,结果成功了。如下:

1 # coding=gb2312

之后,程序正常运行。

3、附:GB2312与GBK的区别

  • 1、GBK: 汉字国标扩展码,基本上采用了原来GB2312-80所有的汉字及码位,并涵盖了原Unicode中所有的汉字20902,总共收录了883个符号, 21003个汉字及提供了1894个造字码位。 Microsoft简体版中文Windows 95就是以GBK为内码,又由于GBK同时也涵盖了Unicode所有CJK汉字,所以也可以和Unicode做一一对应。

  • 2、GB码,全称是GB2312-80《信息交换用汉字编码字符集 基本集》,1980年发布,是中文信息处理的国家标准,在大陆及海外使用简体中文的地区(如新加坡等)是强制使用的唯一中文编码。P-Windows3.2和苹果OS就是以GB2312为基本汉字编码, Windows 95/98则以GBK为基本汉字编码、但兼容支持GB2312。GB码共收录6763个简体汉字、682个符号,其中汉字部分:一级字3755,以拼音排序,二级字3008,以偏旁排序。该标准的制定和应用为规范、推动中文信息化进程起了很大作用。

  • 3、GBK编码是中国大陆制订的、等同于UCS的新的中文编码扩展国家标准。GBK工作小组于1995年10月,同年12月完成GBK规范。该编码标准兼容GB2312,共收录汉字21003个、符号883个,并提供1894个造字码位,简、繁体字融于一库。

https://www.jianshu.com/p/1e5a06535126

「点点赞赏,手留余香」

    还没有人赞赏,快来当第一个赞赏的人吧!
0 条回复 A 作者 M 管理员
    所有的伟大,都源于一个勇敢的开始!
欢迎您,新朋友,感谢参与互动!欢迎您 {{author}},您在本站有{{commentsCount}}条评论