Python操作Word批量生成合同的实现示例

(编辑:jimmy 日期: 2024/11/11 浏览:2)

背景:大约有3K家商家需要重新确认信息并签订合同。合同是统一的Word版本。每个供应商需要修改合同内的金额部分。人工处理方式需要每个复制粘贴且金额要生成大写金额。基于重复工作可偷懒。用Python解救一下。

#导入对应数据库
import numpy as np 
import pandas as pd 
import os 
import docx
from docx.shared import Pt
from docx.oxml.ns import qn
#修改项目文件地址
os.chdir(r'C:\Users\WIN7\Desktop\分期账单自动化')
os.getcwd()

'''
人民币数字转大写汉字
'''
# coding: utf-8
import warnings
from decimal import Decimal

def cncurrency(value, capital=True, prefix=False, classical=None):
  '''
  参数:
  capital:  True  大写汉字金额
        False 一般汉字金额
  classical: True  元
        False 圆
  prefix:   True  以'人民币'开头
        False, 无开头
  '''
  if not isinstance(value, (Decimal, str, int)):
    msg = '''
    由于浮点数精度问题,请考虑使用字符串,或者 decimal.Decimal 类。
    因使用浮点数造成误差而带来的可能风险和损失作者概不负责。
    '''
    warnings.warn(msg, UserWarning)
  # 默认大写金额用圆,一般汉字金额用元
  if classical is None:
    classical = True if capital else False
    
  # 汉字金额前缀
  if prefix is True:
    prefix = '人民币'
  else:
    prefix = ''
    
  # 汉字金额字符定义
  dunit = ('角', '分')
  if capital:
    num = ('零', '壹', '贰', '叁', '肆', '伍', '陆', '柒', '捌', '玖')
    iunit = [None, '拾', '佰', '仟', '万', '拾', '佰', '仟','亿', '拾', '佰', '仟', '万', '拾', '佰', '仟']
  else:
    num = ('〇', '一', '二', '三', '四', '五', '六', '七', '八', '九')
    iunit = [None, '十', '百', '千', '万', '十', '百', '千','亿', '十', '百', '千', '万', '十', '百', '千']
  if classical:
    iunit[0] = '元' if classical else '圆'
  # 转换为Decimal,并截断多余小数

  if not isinstance(value, Decimal):
    value = Decimal(value).quantize(Decimal('0.01'))

  # 处理负数
  if value < 0:
    prefix += '负'     # 输出前缀,加负
    value = - value     # 取正数部分,无须过多考虑正负数舍入
                # assert - value + value == 0
  # 转化为字符串
  s = str(value)
  if len(s) > 19:
    raise ValueError('金额太大了,不知道该怎么表达。')
  istr, dstr = s.split('.')      # 小数部分和整数部分分别处理
  istr = istr[::-1]          # 翻转整数部分字符串
  so = []   # 用于记录转换结果
  
  # 零
  if value == 0:
    return prefix + num[0] + iunit[0]
  haszero = False   # 用于标记零的使用
  if dstr == '00':
    haszero = True # 如果无小数部分,则标记加过零,避免出现“圆零整”
    
  # 处理小数部分
  # 分
  if dstr[1] != '0':
    so.append(dunit[1])
    so.append(num[int(dstr[1])])
  else:
    so.append('整')     # 无分,则加“整”
  # 角
  if dstr[0] != '0':
    so.append(dunit[0])
    so.append(num[int(dstr[0])])
  elif dstr[1] != '0':
    so.append(num[0])    # 无角有分,添加“零”
    haszero = True     # 标记加过零了
    
  # 无整数部分
  if istr == '0':
    if haszero:       # 既然无整数部分,那么去掉角位置上的零
      so.pop()
    so.append(prefix)    # 加前缀
    so.reverse()      # 翻转
    return ''.join(so)

  # 处理整数部分
  for i, n in enumerate(istr):
    n = int(n)
    if i % 4 == 0:     # 在圆、万、亿等位上,即使是零,也必须有单位
      if i == 8 and so[-1] == iunit[4]:  # 亿和万之间全部为零的情况
        so.pop()            # 去掉万
      so.append(iunit[i])
      if n == 0:             # 处理这些位上为零的情况
        if not haszero:         # 如果以前没有加过零
          so.insert(-1, num[0])    # 则在单位后面加零
          haszero = True       # 标记加过零了
      else:                # 处理不为零的情况
        so.append(num[n])
        haszero = False         # 重新开始标记加零的情况
    else:                  # 在其他位置上
      if n != 0:             # 不为零的情况
        so.append(iunit[i])
        so.append(num[n])
        haszero = False         # 重新开始标记加零的情况
      else:                # 处理为零的情况
        if not haszero:         # 如果以前没有加过零
          so.append(num[0])
          haszero = True

  # 最终结果
  so.append(prefix)
  so.reverse()
  return ''.join(so)
#数据准备阶段 导入大写
#读取预备好的EXCEL表格
text = pd.read_excel('付款预备表.xlsx')
#print(text)
text['EC总应付额']
list1 = []
for i in text['EC总应付额']:
  list1.append(cncurrency(str(i)))
text.append(list1)
text['大写金额'] = list1
text.shape[0]
print(text.head())
document12 = docx.Document('分期SPM模板(12期).docx')
document24 = docx.Document('分期SPM模板(24期).docx')
supp_num = 0 
for supp_num in range(text.shape[0]):
  paragraph_num = 0
  A = text.iat[supp_num,2]
  B = text.iat[supp_num,5]
  qishu = text.iat[supp_num,3]
  supp_name = text.iat[supp_num,1]
  user_name = text.iat[supp_num,4]
  content = "双方确认,截止至 2020 年 3 月 31 日,扣除原合同和原合作约定到货异常(包括但不仅限于缺货、少货、货损、到货不符)、违约责任、赔偿责任、甲方代乙方垫付等所涉相关费用后,甲方尚欠付乙方货款金额合计人民币{}元(大写:{})。".format(A,B)
  if qishu == "12期":
    p = document12.paragraphs[8].clear()
    run1 = p.add_run(content)
    run1.font.size = Pt(12)
    run1.font.name = '仿宋'
    run1.element.rPr.rFonts.set(qn('w:eastAsia'), '仿宋')
    document12.save("{}.docx".format(supp_name))
  else:
    p = document24.paragraphs[8].clear()
    run1 = p.add_run(content)
    run1.font.size = Pt(12)
    run1.font.name = '仿宋'
    run1.element.rPr.rFonts.set(qn('w:eastAsia'), '仿宋')
    document24.save("{}.docx".format(supp_name))

主要是分成四个板块。
 一:导入相关的包,这个就不说了
 二:数字金额转大写金额。这个网上一大堆的现成的函数,也就不用自己写,Copy测试一下,OK的。
 三:预备自己的数据。
 四:本来想替换指定位置的内容的,但是发现操作相对有点困难,那就思维放大,直接替换整个段落。用个format,把需要替换的内容直接填入。然后用docx包里面的.clear【清除段落】 加 add_run【添加段落】的方式,配合上.font.size 和.font.name 调整字体大小与字体。最后save就OJBK了。