数据分析相关概念 – Python量化投资

数据分析相关概念

矢量

矢量是指一堆形成的集合。

多维数组也叫做矢量化计算。

单独一个数叫做标量

例:bector.py

 

多维数组

1.Numpy对多维数组的定义:

  用numpy.ndarray类。(n代表n个数,d代表dimision维度)。

  Ndarray本身是一个类,由这个类实例化出来的对象,就是多维数组。

  多维数组也是一个对象。

2.创建多维数组对象的方法:

   1)numpy.arange(起始,终止,步长)

    它是通过numpy来访问。是一个numpy里的函数。

    它返回的数组是一个等差列的一维数组。

   2)numpy.array()

    这个array不是类。是一个numpy里函数。

    在numpy.array()函数,括号里可以输入任何可被解释程数组的容器。(列表和元组。)

    例:array.py

  获取数组元素类型的方法:

      1:type([0][0]) =>python取类型的方法 方法

      2:f.dtype =>numpy的方法 “int32”,代表4个字节的整型数。

  为什么是int32?

    原有是,在定义时未指定具体类型。而现在使用4个字节整形正好能保存f的数据,所以default缺省值就是4个字节。

  3)查询结果的意义:

    “<U1”的意义(输入字符串,用.dtype查询时):

      1.Unicode每个编码占4个字节。有高低之分。分为小端序和大端序。

      2.“U”代表是unicode编码。

      3.“<”表示小端字节序。

      4.“1”代表每个字符串里只有一个字符

    “numpy.str”的含义(使用type(g[0] 查询时)):

      1.“str”代表字符串。

      2.“ ”和python作区分而加成的。

  4)手动值定类型的写法: G=np.array([‘1′,’2′,’3’].dtype=np.int32)

    1.值要设置手动指定类型,它的数据类型就做自动转换了。虽然值是是字符串,但是我们给了指定目标类型是整形

    2.场景:如果觉得还是字符串式好,还能用astype改回。

所有和类型转换有关的其实都不是类型转换,都是复制,都是按新类型在你复制一份,但是对于源是不变的 dtype是属性,取元素的类型。

    3.关于维度的属性: shape属性的值是一个元组类型,一个元组内包含多个元素。分别是从高到低类表示他每一个维度的数。

  思考:一个二位数组有行和列,行高还是列高?

    如果有页 行 列

     页:最高维度

     行:次之

     列:最低

    4.areange和array都可以创建数组,有时候可以混用。

     用shape属性可以看到维度。

     Numpy中多用二维数组,三维很少用。

    5.元素索引

      元素索引是从0开始

        数组[索引]

        数组[行索引][列索引]

        数组[页索引][行索引][列索引]或者[页索引,行索引,列索引]

 

Numpy的内置类型和自定义类型:

     1.内置类型:

      优点: 可显示占内存多少,可灵活变化

      缺点: 因为具有灵活可变性,性能方面做出牺牲。(因需要留出足够多空间)。

         无法使用固定内存地址的计算方法;

         它只能用动态来完成,有关地址运算就要占用运用时间。 

      注:在numpy里为每一种类型都提供了固定的大小,所以有关地址运算完全可以通过类型来确定。Numpy自己定义一套属于自己的数据类型体系。它的数据类型有固定长度。字节数都是固定的。

       举例:  

          Numpy.bool   一个布尔占一个字节

          有符号版本:

                Int8 1字节有符号类型

                Int16 2字节有符号类型

                Int32 4字节有符号类型

          无符号版本(只有正整,没有负数):

                 Uint8 1字节有符号类型

                Uint16 2字节有符号类型

                Uint32 4字节有符号类型

           浮点类型:

                Float16 2字节浮点型

                Float32 4字节浮点型

                Float64 8字节浮点型

          复数类型:(实部和虚部都用2个4字节浮点型表示)

                Complex64 8字节复数型

                Complex128 16字节复数型

          注:1复数=2个浮点型的组合

          字符串类型: Str

                字符串型没有规定多少字节,因为字符串型取决于字符串unicode有多长。

                字符串型的长度根据字符串所包含的字符串来决定,有多少字符,就有多少个字节。

           注:lunicode=4个字节 可以用dtype和astype来设置类型转换

    2自定义类型:

         1.直接使用内置类型的原始名

         2.使用紧凑类型格式(类型编码字符串)

          简化操作:(可以更少的字符串表示)

              全称       简化格式

              Numpy.int8     i1

              Int16          i2    

              Uint32          u4

              Float64           f8

              Complex128      c16

        3多字节的整数存在大小端序

           对于多字节整数可以加上字节序前缀 前缀类型:(位数越低,地址越低)

       “        ”<”,小端字节序,低数位低地址低。

               “=”,系统默认,不能人为指定。由系统决定。

               “>”,大端字节序,低数位高地址。

            例子:

              十六进制:0x1234

           小端字节序:

              L     H

              0x12   0x34

           大端字节序:

              L     H

              0x34   0x12

注:有时为了防止某个代码功能在不同处理器上取移植带来的一些兼容性问题。所以强制加上“<”或“>”

https://www.cnblogs.com/AloneDKN/p/11459190.html

「点点赞赏,手留余香」

    还没有人赞赏,快来当第一个赞赏的人吧!
Python
0 条回复 A 作者 M 管理员
    所有的伟大,都源于一个勇敢的开始!
欢迎您,新朋友,感谢参与互动!欢迎您 {{author}},您在本站有{{commentsCount}}条评论