Python3实践项目一:生成0-5岁宝宝生长发育报告

阿里云双11来了!从本博客参与阿里云,服务器最低只要86元/年!


face.jpg

​本文介绍基于Python3.5.2,根据世界卫生组织发布的0-5岁宝宝生长发育标准百分位数曲线数据,以及宝宝的身长\高,体重,头围监测数据,绘制宝宝的身长\高,体重,头围,体重指数,身长\身高别体重的曲线图,然后生成.docx格式的文档,最后将文档转变为PDF格式的报告。


image

  • 一、获取数据

https://www.who.int/childgrowth/standards/zh/找到需要的数据列表,然后利用爬虫获取相应的数据,并将数据以.xls格式存储,最后再读取形成字典形式。

1,用到的库

bs4:版本4.6.0
pandas:版本0.23.4
numpy:版本1.16.4
urllib:Python3.5.2内置版

2,主要知识点

  • 打开网页
from urllib import request
from bs4 import BeautifulSoup as bs
html = request.urlopen(all_url) # all_url网页地址,打开网页
bs_data = bs(html.read(), "html5lib")  # 解析网页
  • 数据存储与读取
import pandas as pd
# 将numpy的array格式的数据变为pandas的DataFrame格式
pd_data = pd.DataFrame(np.array(data_list), columns=df_column)
# 直接写入excel中
pd_data.to_excel(excel_path, sheet_name=name, encoding='gb2312', index=False)
# 读取数据
read_data = pd.read_excel(excel_path, sheet_name=name, header=1)


image

  • 二、绘图

首先利用matplotlib绘制标准曲线图,然后将监测数据经过三次样条插值,再绘制宝宝的生长曲线图。

1,用到的库

matplotlib:版本3.0.2
scipy:版本1.2.0

2,主要知识点

  • 显示中文与负号
from pylab import mpl # 作图显示中文
mpl.rcParams['font.sans-serif'] = ['STZhongsong']  # 设置中文字体为新宋体
mpl.rcParams['axes.unicode_minus'] = False # 显示负号
  • 设置边框颜色与宽度
ax = plt.gca()  # 获取边框
ax.spines['top'].set_color(self.color)
ax.spines['right'].set_color(self.color)
ax.spines['left'].set_color(self.color)
ax.spines['bottom'].set_color(self.color)
ax.spines['bottom'].set_linewidth(1.2)
ax.spines['left'].set_linewidth(1.2)
ax.spines['top'].set_linewidth(1.2)
ax.spines['right'].set_linewidth(1.2)
  • 设置主、次网格线的刻度、粗度、颜色
from matplotlib.ticker import MultipleLocator
ax.yaxis.set_minor_locator(MultipleLocator(0.5)) # 设置y轴次刻度
ax.xaxis.set_minor_locator(MultipleLocator(1))  # 设置x轴次刻度
ax.xaxis.grid(True, which='major', linewidth=1.2, color=color)  # 使用主刻度绘制x坐标轴的网格
ax.yaxis.grid(True, which='minor', linewidth=0.7, color=color)  # 使用次刻度绘制y坐标轴的网格
ax.xaxis.grid(True, which='minor', linewidth=0.7, color=color)  # 使用次刻度绘制x坐标轴的网格
ax.yaxis.grid(True, which='major', linewidth=1.2, color=color)  # 使用主刻度绘制y坐标轴的网格
  • 设置网格线在绘制线的下方
ax.set_axisbelow(True)
  • 设置x轴标签在图片上方的轴
ax.xaxis.tick_top()
  • 设置标签线的长度、颜色、粗度
from pylab import tick_params, minorticks_on 
minorticks_on()
tick_params(axis='y', which='major', width=1, length=4, colors=color)
tick_params(axis='x', which='major', width=1, length=2, colors=color)
tick_params(which='minor', length=0)
  • 设置图中图
ax2 = fig.add_axes([left, bottom, width, height])  # 图中图
  • 绘制表格

table = ax2.table(cellText=cellText, colLabels=colLabels, loc='lower center', cellLoc='left',
                  colWidths=list(table_w))
table.auto_set_font_size(False)  # 取消自动设置字体大小
table.set_fontsize(8) # 表格字体大小设置
table_props = table.properties()
table_cells = table_props['child_artists']
for cell in table_cells:
    cell._text.set_color(self.color)  # 设置字体颜色
    cell.set_edgecolor(self.color)   # 设置表格线的颜色
  • 保存图片去掉多余空白
fig = plt.gcf()
fig.savefig(fig_path, dpi=100, bbox_inches='tight') 
  • 三次样条插值
from scipy import interpolate
# 三次样条插值插值
t = interpolate.splrep(x_data, y_data, k=3)
day_data = np.linspace(min(x_data), max(x_data), num=1000)
interp_data = interpolate.splev(day_data, t)


image

  • 三、生成.docx文件

将生成的图片以及宝宝的信息整合到.docx文档中。

1,用到的库

docx:版本0.8.10

2,主要知识点

  • 字体、颜色、大小、位置设置
from docx import Document
from docx.shared import Inches, RGBColor
from docx.oxml.ns import qn
from docx.shared import Pt
import docx.enum.text as s
# 新建Word文档
document = Document()
p = document.add_paragraph('')
text1 = p.add_run(str_para) # 添加内容
text1.font.size = Pt(24)                                # 字体大小
text1.bold = True                                       # 字体是否加粗
text1.font.name = 'Times New Roman'                     # 控制是西文时的字体
text1.element.rPr.rFonts.set(qn('w:eastAsia'), '华文中宋')  # 字体设置
p.paragraph_format.alignment = s.WD_ALIGN_PARAGRAPH.CENTER  # 位置设置
text1.font.color.rgb = RGBColor(*color)  # 颜设置
  • 图片居中
document.add_paragraph('')
tab = document.add_table(rows=1, cols=3)  # 添加一个1行3列的空表
cell = tab.cell(0, 1)  # 获取某单元格对象(从0开始索引)
ph = cell.paragraphs[0]
run = ph.add_run()
run.add_picture(ig_path, width=Inches(5))
  • 页边距设置

se = add_docu.add_section()
se.left_margin = Inches(0.4)  # 左边距离
se.right_margin = Inches(0.4)  # 右边距离
  • 表格设置

table = document.add_table(rows=5, cols=2, style=style)  # 添加表格5行、2列
# 添加第二行的内容
hdr_cells = table.rows[1].cells
hdr_cells[0].text = '宝宝昵称'
hdr_cells[1].text = b.b_n
# 设置表格内文字的大小、颜色,表格线的颜色
for row in table.rows:
    for cell in row.cells:
        paragraphs = cell.paragraphs
        for paragraph in paragraphs:
            for run in paragraph.runs:
                font = run.font
                font.size = Pt(15)
                font.color.rgb = RGBColor(*color)

四、转化为PDF格式

将.docx文档转化为PDF格式时,如果程序的错误信息显示下面的内容:

C:\\Program Files (x86)\\Microsoft Office\\Office12\\2052\\WDMAIN11.CHM'

这说明是word输出pdf出现错误,需要下载插件SaveAsPDFandXPS.exe,安装即可。

1,用到的库

win32com

2,主要知识点

  • .docx转为PDF
from win32com import client
word = client.DispatchEx("Word.Application")
worddoc = word.Documents.Open(doc_path, ReadOnly=1)
worddoc.SaveAs(pdf_path, FileFormat=17)
worddoc.Close()


image

五、报告示例:男宝


image

image

image

image

image

image

image

image

image

image

image

image

image

点击获得项目源码。欢迎Follow,感谢Star!!! 扫描关注微信公众号pythonfan,获取更多。


image

image
https://www.jianshu.com/p/036c90f88060

Python量化投资网携手4326手游为资深游戏玩家推荐:《《宝石研物语》:8月23日更新公告

「点点赞赏,手留余香」

    还没有人赞赏,快来当第一个赞赏的人吧!
0 条回复 A 作者 M 管理员
    所有的伟大,都源于一个勇敢的开始!
欢迎您,新朋友,感谢参与互动!欢迎您 {{author}},您在本站有{{commentsCount}}条评论