python web框架Django——ORM – Python量化投资

python web框架Django——ORM

ORM简介

  • MVC框架中包括一个重要的部分,就是ORM,它实现了数据模型与数据库的解耦,即数据模型的设计不需要依赖于特定的数据库,通过简单的配置就可以轻松更换数据库

  • ORM是“对象-关系-映射”的简称,主要任务是:

    • 根据对象的类型生成表结构

    • 将对象、列表的操作,转换为sql语句

      • GoodsInfo.objects.filter(pk=1)->select * from goodinfo where id=1

    • 将sql查询到的结果转换为对象、列表

  • 这极大的减轻了开发人员的工作量,不需要面对因数据库变更而导致的无效劳动

  • Django中的模型包含存储数据的字段和约束,对应着数据库中唯一的表

 

 

使用MySql数据库

  • 在虚拟环境中安装mysqlclient包

pip install mysqlclient (2.2.6)

  • 在mysql中创建数据库

create databases shopping;

  • 打开settings.py文件,修改DATABASES项

DATABASES = {
  'default': {
      'ENGINE': 'django.db.backends.mysql',
      'NAME': 'test2',# use test2
      'USER': '用户名',
      'PASSWORD': '密码',
      'HOST': '数据库服务器ip,本地可以使用localhost',
      'PORT': '端口,默认为3306',
  }
}# 注意:键全大写

开发流程

  1. 在models.py中定义模型类,要求继承自models.Model

  2. 把应用加入settings.py文件的installed_app项

  3. 生成迁移文件 python manage.py makemigrations

  4. 执行迁移生成表 python manage.py migrate

  5. 使用模型类进行crud操作(python manage.py shell)

使用数据库生成模型类

python manage.py inspectdb > booktest/models.py

定义模型

  • 在模型中定义属性,会生成表中的字段

  • django根据属性的类型确定以下信息:

    • 当前选择的数据库支持字段的类型

    • 渲染管理表单时使用的默认html控件

    • 在管理站点最低限度的验证

  • django会为表增加自动增长的主键列,每个模型只能有一个主键列,如果使用选项设置某属性为主键列后,则django不会再生成默认的主键列

  • 属性命名限制

    • 不能是python的保留关键字

    • 由于django的查询方式,不允许使用连续的下划线 name__xxxx

定义属性

  • 定义属性时,需要字段类型

  • 字段类型被定义在django.db.models.fields目录下,为了方便使用,被导入到django.db.models中

  • 使用方式

    1. 导入from django.db import models

    2. 通过models.Field创建字段类型的对象,赋值给属性

  • 对于重要数据都做逻辑删除,不做物理删除(物理删除是管理员做的事情),实现方法是定义isDelete属性,类型为BooleanField,默认值为False

字段类型

  • AutoField:一个根据实际ID自动增长的IntegerField,通常不指定

    • 如果不指定,一个主键字段将自动添加到模型中

  • BooleanField:true/false 字段,此字段的默认表单控制是CheckboxInput

  • NullBooleanField:支持null、true、false三种值

  • CharField(max_length=字符长度):字符串,默认的表单样式是 TextInput varchar(255)

  • TextField:大文本字段,一般超过4000使用,默认的表单控件是Textarea

  • IntegerField:整数

  • DecimalField(max_digits=None, decimal_places=None):使用python的Decimal实例表示的十进制浮点数

    • DecimalField.max_digits:位数总数

    • DecimalField.decimal_places:小数点后的数字位数

  • FloatField:用Python的float实例来表示的浮点数

  • DateField[auto_now=False, auto_now_add=False]):使用Python的datetime.date实例表示的日期

    • 参数DateField.auto_now:每次保存对象时,自动设置该字段为当前时间,用于”最后一次修改”的时间戳,它总是使用当前日期,默认为false

    • 参数DateField.auto_now_add:当对象第一次被创建时自动设置当前时间,用于创建的时间戳,它总是使用当前日期,默认为false

    • 该字段默认对应的表单控件是一个TextInput. 在管理员站点添加了一个JavaScript写的日历控件,和一个“Today”的快捷按钮,包含了一个额外的invalid_date错误消息键

    • auto_now_add, auto_now, and default 这些设置是相互排斥的,他们之间的任何组合将会发生错误的结果

  • TimeField:使用Python的datetime.time实例表示的时间,参数同DateField

  • DateTimeField:使用Python的datetime.datetime实例表示的日期和时间,参数同DateField

  • FileField:一个上传文件的字段

  • ImageField:继承了FileField的所有属性和方法,但对上传的对象进行校验,确保它是个有效的image

字段选项

  • 通过字段选项,可以实现对字段的约束

  • 在字段对象时通过关键字参数指定

  • null:如果为True,Django 将空值以NULL 存储到数据库中,默认值是 False

  • blank:如果为True,则该字段允许为空白,默认值是 False

  • 对比:null是数据库范畴的概念,blank是表单验证证范畴的

  • db_column:字段的名称,如果未指定,则使用属性的名称

  • db_index:若值为 True, 则在表中会为此字段创建索引

  • default:默认值

  • primary_key:若为 True, 则该字段会成为模型的主键字段

  • unique:如果为 True, 这个字段在表中必须有唯一值

关系

  • 关系的类型包括

    • ForeignKey:一对多,将字段定义在多的端中

      • on_delete

      • CASCADE:这就是默认的选项,级联删除,你需要显性指定它。

      • PROTECT: 保护模式,如果采用该选项,删除的时候,会抛出ProtectedError错误。

      • SET_NULL: 置空模式,删除的时候,外键字段被设置为空,前提就是blank=True, null=True,定义该字段的时候,允许为空。

      • SET_DEFAULT: 置默认值,删除的时候,外键字段设置为默认值,所以定义外键的时候注意加上一个默认值。

      • SET(): 自定义一个值,该值当然只能是对应的实体了*

    • ManyToManyField:多对多,将字段定义在两端中

    • OneToOneField:一对一,将字段定义在任意一端中

  • 可以维护递归的关联关系,使用’self’指定,详见“自关联”

  • 用一访问多:对象.模型类小写_set

类型对象:type.goodsinfo_set

  • 用一或者多访问一:对象.模型类小写

商品对象:good.type

  • 访问id:对象.属性_id

good.type_id/good.type.id

元选项

  • 在模型类中定义类Meta,用于设置元信息

  • 元信息db_table:定义数据表名称,推荐使用小写字母,数据表的默认名称

<app_name>_<model_name>

  • ordering:对象的默认排序字段,获取对象的列表时使用,接收属性构成的列表

class TypeInfo(models.Model):
  ...
  class Meta():
      ordering = ['id']

  • 字符串前加-表示倒序,不加-表示正序

class TypeInfo(models.Model):
  ...
  class Meta():
      ordering = ['-id']

  • 排序会增加数据库的开销

类的属性

  • objects:是Manager(django定义好的类,负责与数据库交互)类型的对象,用于与数据库进行交互

  • 当定义模型类时没有指定管理器,则Django会为模型类提供一个名为objects的管理器

  • 支持明确指定模型类的管理器

class TypeInfo(models.Model):
  ...
  types = models.Manager()

  • 当为模型类指定管理器后,django不再为模型类生成名为objects的默认管理器

管理器Manager*

  • 管理器是Django的模型进行数据库的查询操作的接口,Django应用的每个模型都拥有至少一个管理器

  • 管理器是模型类的属性,用于将对象与数据表进行映射,ORM

  • 自定义管理器类主要用于两种情况

  • 情况一:向管理器类中添加额外的方法:见下面“创建对象”中的方式二

  • 情况二:修改管理器返回的原始查询集:重写get_queryset()方法

class GoodsInfoManager(models.Manager):
  def get_queryset(self):
      return super(GoodsInfoManager, self).get_queryset().filter(isDelete=False)
class GoodsInfo(models.Model):
  ...
  goods = GoodsInfoManager()

创建对象

  • 当创建对象时,django不会对数据库进行读写操作

  • 调用save()方法才与数据库交互,将对象保存到数据库中

  • 使用关键字参数构造模型对象很麻烦,推荐使用下面的两种之式

  • 说明: _init _方法已经在基类models.Model中使用,在自定义模型中无法使用,

  • 在自定义管理器中添加一个方法

  • 在管理器的方法中,可以通过self.model来得到它所属的模型类

class GoodsInfoManager(models.Manager):
  def create_good(self, title, pub_date):
      good = self.model()
      good.gname = title
      good.gpub_date = pub_date
      good.gnumber=0
      good.isDelete = False
      return good

class GoodInfo(models.Model):
  ...
  goods = GoodsInfoManager()
调用:good=GoodsInfo.goods.create_book("abc",datetime(1980,1,1))
保存:good.save()

  • 可以调用self.create()创建并保存对象,不需要再手动save()

class GoodsInfoManager(models.Manager):
  def create_good(self, name, pub_date):
      good = self.create(gname = name,gpub_date = pub_date,isDelete = False)
      return good

class GoodsInfo(models.Model):
  ...
  goods = GoodsInfoManager()
调用:good=Book.goods.create_good("abc",datetime(1980,1,1))
查看:good.pk

实例的属性

  • DoesNotExist:在进行单个查询时,模型的对象不存在时会引发此异常,结合try/except使用

实例的方法

  • str (obj):重写object方法,此方法在将对象转换成字符串时会被调用

  • save():将模型对象保存到数据表中

  • delete():将模型对象从数据表中删除

模型查询简介

  • 查询集表示从数据库中获取的对象集合

  • 查询集可以含有零个、一个或多个过滤器

  • 过滤器基于所给的参数限制查询的结果

  • 从Sql的角度,查询集和select语句等价,过滤器像where和limit子句[0:4]

  • 接下来主要讨论如下知识点

    • 查询集

    • 字段查询:比较运算符,F对象,Q对象

查询集

  • 在管理器上调用过滤器方法会返回查询集

  • 查询集经过过滤器筛选后返回新的查询集,因此可以写成链式过滤

  • 惰性执行:创建查询集不会带来任何数据库的访问,直到调用数据时,才会访问数据库

  • 何时对查询集求值:迭代,序列化,与if合用

  • 返回查询集的方法,称为过滤器

    • all()->返回所有数据 select * from tbname

    • filter()

      • GoodsInfo.objects.filter(pk__gt=2, gnumber__lte=100)->select * from tbname where id=2 and gnumber>100
        

         

      • GoodsInfo.objects.filter(pk>2).filter(gnumber>100)

    • exclude()

      • GoodsInfo.objects.exclude(pk=2)

    • order_by()

      • GoodsInfo.objects.filter(isDelete=False).order_by(‘-id’)

    • values():一个对象构成一个字典,然后构成一个列表返回

      • [
          {'id': 2, 'gname': '碧根果', 'gprice': 10, 'gnumber': 99, 'gdetail': '好吃不上火', 'isDelete': False, 'gtype_id': 2}
        ]

  • 写法:

filter(键1=值1,键2=值2)
等价于
filter(键1=值1).filter(键2=值2)

  • 返回单个值的方法

    • get():返回单个满足条件的对象

      • 如果未找到会引发”模型类.DoesNotExist”异常

      • 如果多条被返回,会引发”模型类.MultipleObjectsReturned”异常

    • count():返回当前查询的总条数

    • first():返回第一个对象

    • last():返回最后一个对象

    • exists():判断查询集中是否有数据,如果有则返回True

限制查询集

  • 查询集返回列表,可以使用下标的方式进行限制,等同于sql中的limit和offset子句

  • 注意:不支持负数索引

  • 使用下标后返回一个新的查询集,不会立即执行查询

  • 如果获取一个对象,直接使用[0],等同于[0:1].get(),但是如果没有数据,[0]引发IndexError异常,[0:1].get()引发DoesNotExist异常

查询集的缓存

  • 每个查询集都包含一个缓存来最小化对数据库的访问

  • 在新建的查询集中,缓存为空,首次对查询集求值时,会发生数据库查询,django会将查询的结果存在查询集的缓存中,并返回请求的结果,接下来对查询集求值将重用缓存的结果

  • 情况一:这构成了两个查询集,无法重用缓存,每次查询都会与数据库进行一次交互,增加了数据库的负载

print([e.title for e in Entry.objects.all()])
print([e.title for e in Entry.objects.all()])

  • 情况二:两次循环使用同一个查询集,第二次使用缓存中的数据

querylist=Entry.objects.all()
print([e.title for e in querylist])
print([e.title for e in querylist])


querylist=Entry.objects.all()
for i in querylist[0:5]:
pass
for i in querylist[2:4]:
pass

  • 何时查询集不会被缓存:当只对查询集的部分进行求值时会检查缓存,但是如果这部分不在缓存中,那么接下来查询返回的记录将不会被缓存,这意味着使用索引来限制查询集将不会填充缓存,如果这部分数据已经被缓存,则直接使用缓存中的数据

字段查询

  • 实现where子名,作为方法filter()、exclude()、get()的参数

  • 语法:属性名称__比较运算符=值

  • 表示两个下划线,左侧是属性名称,右侧是比较类型

  • 对于外键,使用“属性名_id”表示外键的原始值

  • 转义:like语句中使用了%与,匹配数据中的%与,在过滤器中直接写,例如:filter(title__contains=”%”)=>where title like ‘%\%%’,表示查找标题中包含%的

比较运算符

  • exact:表示判等,大小写敏感;如果没有写“ 比较运算符”,表示判等

filter(isDelete=False)

  • contains:是否包含,大小写敏感

filter(gname__contains='果')->where gname like '%果%'
exclude(gname__contains='果')->where gname not like '%果%'

  • startswith、endswith:以value开头或结尾,大小写敏感

exclude(gname__endswith='果')

  • isnull、isnotnull:是否为null

filter(gname__isnull=False)

  • 在前面加个i表示不区分大小写,如iexact、icontains、istarswith、iendswith

  • in:是否包含在范围内

filter(pk__in=[1, 2, 3, 4, 5])

  • gt、gte、lt、lte:大于、大于等于、小于、小于等于

filter(id__gt=3)

  • year、month、day、week_day、hour、minute、second:对日期间类型的属性进行运算

filter(gpub_date__year=1980)
filter(gpub_date__gt=date(1980, 12, 31))

  • 跨关联关系的查询:处理join查询

    • 语法:模型类名 <属性名> <比较>

    • 注:可以没有__<比较>部分,表示等于,结果同inner join

    • 可返向使用,即在关联的两个模型中都可以使用

filter(goodsinfo_ _gdetail_ _contains='八')

  • 查询的快捷方式:pk,pk表示primary key,默认的主键是id

filter(pk__lt=6)

聚合函数

  • 使用aggregate()函数返回聚合函数的值

  • 函数:Avg,Count,Max,Min,Sum

from django.db.models import Max
maxDate = list.aggregate(Max('gpub_date'))

  • count的一般用法:

count = list.count()

F对象

  • 可以使用模型的字段A与字段B进行比较,如果A写在了等号的左边,则B出现在等号的右边,需要通过F对象构造

list.filter(gnumber__gte=F('goutnum'))

  • django支持对F()对象使用算数运算

list.filter(gnumber__gte=F('goutnum') * 2)

  • F()对象中还可以写作“模型类__列名”进行关联查询

list.filter(isDelete=F('goodsinfo__isDelete'))

  • 对于date/time字段,可与timedelta()进行运算

list.filter(gpub_date__lt=F('bpub_date') + timedelta(days=1))

Q对象

  • 过滤器的方法中关键字参数查询,会合并为And进行

  • 需要进行or查询,使用Q()对象

  • Q对象(django.db.models.Q)用于封装一组关键字参数,这些关键字参数与“比较运算符”中的相同

from django.db.models import Q
list.filter(Q(pk_ _lt=6))

  • Q对象可以使用&(and)、|(or)操作符组合起来

  • 当操作符应用在两个Q对象时,会产生一个新的Q对象

list.filter(pk_ _lt=6).filter(gnumber_ _gt=10)
list.filter(Q(pk_ _lt=6) | Q(gnumber_ _gt=10))

  • 使用~(not)操作符在Q对象前表示取反

list.filter(~Q(pk__lt=6))

  • 可以使用&|~结合括号进行分组,构造做生意复杂的Q对象

  • 过滤器函数可以传递一个或多个Q对象作为位置参数,如果有多个Q对象,这些参数的逻辑为and

  • 过滤器函数可以混合使用Q对象和关键字参数,所有参数都将and在一起,Q对象必须位于关键字参数的前面

https://www.cnblogs.com/aitiknowledge/p/11661200.html

「点点赞赏,手留余香」

    还没有人赞赏,快来当第一个赞赏的人吧!
0 条回复 A 作者 M 管理员
    所有的伟大,都源于一个勇敢的开始!
欢迎您,新朋友,感谢参与互动!欢迎您 {{author}},您在本站有{{commentsCount}}条评论