基于Python开发一个小说图片PDF生成器

2025-10-10 09:13 开发作者： winfredzhang

项目概述

本项目是一个基于 wxpython 开发的桌面应用程序，用于将图片和文字描述组合生成精美的 PDF 小说。它解决了创作者需要将图文内容快速整理成电子书的需求，特别适合绘本、图文小说、摄影作品集等场景。

核心功能

批量导入和管理图片
为图片添加场景描述
支持一段文字对应多张图片
智能布局算法，将文字和配图显示在同一页
自动生成带封面的 PDF 文件

技术架构

依赖库分析

import wx                    # GUI框架
import json                  # 数据持久化
import os                    # 文件系统操作
from pathlib import Path     # 路径处理
from reportlab.lib.pagesizes import A4        # PDF页面尺寸
from reportlab.pdfgen import canvas           # PDF画布
from reportlab.lib.utils import ImageReader   # 图片读取
from reportlab.pdfbase import pdfmetrics      # 字体管理
from reportlab.pdfbase.ttfonts import TTFont  # TrueTyjspe字体
from PIL import Image        # 图片处理
import math                  # 数学计算

技术栈选择理由：

wxPython：跨平台GUI框架，原生界面风格，性能优秀
ReportLab：强大的PDF生成库，支持精确的页面控制
Pillow (PIL)：图片处理标准库，用于图片缩放和格式转换
JSON：轻量级数据格式，便于项目保存和加载

核心数据结构

ImageItem 类

class ImageItem:
    """图片项数据类"""
    def __init__(self, path, description="", group_id=None):
        self.path = path              # 图片文件路径
        self.description = description # 场景描述文字
        self.group_id = group_id      # 分组ID（相同ID表示同一组）

设计思路：

使用 group_id 实现多张图片共享同一段描述的功能
通过时间戳生成唯一ID，避免冲突
简洁的数据结构便于序列化为JSON

GUI 界面设计

布局结构

程序采用左右分栏布局：

┌─────────────────────────────────────────┐
│           小说名称输入框                 │
├──────────────┬──────────────────────────┤
│  左侧区域    │      右侧区域             │
│  ┌────────┐ │  ┌──────────────────┐    │
│  │操作按钮│ │  │  图片预览区域    │    │
│  ├────────┤ │  └──────────────────┘    │
│  │图片列表│ │  ┌──────────────────┐    │
│  │        │ │  │  场景描述输入    │    │
│  │        │ │  └──────────────────┘    │
│  │        │ │  [图片数量] [操作按钮]   │
│  └────────┘ │                           │
└──────────────┴──────────────────────────┘

关键UI组件

1. 标题输入区

title_sizer = wx.BoxSizer(wx.HORIZONTAL)
title_label = wx.StaticText(panel, label='小说名称：')
self.title_text = wx.TextCtrl(panel, size=(300, -1))

用于输入小说标题，会显示在PDF封面页。

2. 图片列表框

self.image_listbox = wx.ListBox(panel, style=wx.LB_SINGLE)

使用 wx.LB_SINGLE 单选模式
动态显示文件名和描述预览
绑定点击事件触发图片预览

3. 图片预览区

self.image_preview = wx.StaticBitmap(panel, size=(450, 350))
self.image_preview.SetBackgroundColour(wx.Colour(240, 240, 240))

使用 StaticBitmap 组件显示选中的图片，设置灰色背景便于识别。

4. 分组控制

self.group_spin = wx.SpinCtrl(panel, value='1', min=1, max=50, initial=1)

SpinCtrl 数字调节器，用户可以指定当前描述对应的图片数量（1-50张）。

核心功能实现

1. 图片管理

批量添加文件夹

def on_add_folder(self, event):
    """添加文件夹中的所有图片"""
    dlg = wx.DirDialog(self, "选择图片文件夹")
    if dlg.ShowModal() == wx.ID_OK:
        folder_path = dlg.GetPath()
        image_extensions = ('.jpg', '.jpeg', '.png', '.bmp', '.gif')
        
        for file in sorted(os.listdir(folder_path)):
            if file.lower().endswith(image_extensions):
                full_path = os.path.join(folder_path, file)
                self.add_image_item(full_path)
        
        self.update_listbox()
    dlg.Destroy()

关键点：

使用 sorted() 确保文件按名称排序
lower().endswith() 不区分大小写匹配扩展名
必须调用 dlg.Destroy() 释放对话框资源

单张/多张添加

def on_add_image(self, event):
    """添加单张图片"""
    wildcard = "图片文件 (*.jpg;*.jpeg;*.png;*.bmp;*.gif)|*.jpg;*.jpeg;*.png;*.bmp;*.gif"
    dlg = wx.FileDialog(self, "选择图片", wildcard=wildcard, 
                       style=wx.FD_OPEN | wx.FD_MULTIPLE)
    
    if dlg.ShowModal() == wx.ID_OK:
        paths = dlg.GetPaths()  # 获取多个路径
        for path in paths:
            self.add_image_item(path)
        self.update_listbox()
    dlg.Destroy()

使用 wx.FD_MULTIPLE 标志支持多选，GetPaths() 返回路径列表。

2. 图片预览功能

def show_preview(self, image_path):
    """显示图片预览"""
    try:
        img = Image.open(image_path)
        
        # 调整图片大小以适应预览区域
        preview_size = (450, 350)
        img.thumbnail(preview_size, Image.Resampling.LANCZOS)
        
        # 转换为wx.Bitmap
        width, height = img.size
        wx_img = wx.Image(width, height)
        wx_img.SetData(img.convert("RGB").tobytes())
        bitmap = wx.Bitmap(wx_img)
        
        self.image_preview.SetBitmap(bitmap)
        
    except Exception as e:
        wx.MessageBox(f"无法加载图片：{str(e)}", "错误", wx.OK | wx.ICON_ERROR)

技术细节：

thumbnail() 方法保持宽高比缩放
LANCZOS 重采样算法提供最佳缩放质量
PIL Image → wx.Image → wx.Bitmap 的转换链
必须转换为RGB模式（去除Alpha通道）

3. 图片顺序调整

上移实现

def on_move_up(self, event):
    """上移图片"""
    selection = self.image_listbox.GetSelection()
    if selection > 0:
        # Python交换语法
        self.image_items[selection], self.image_items[selection-1] = \
            self.image_items[selection-1], self.image_items[selection]
        self.update_listbox()
        self.image_listbox.SetSelection(selection-1)

设计要点：

检查边界条件（不能上移第一项）
使用Python优雅的元组解包交换
更新后保持选中状态

4. 描述分组功能

def on_save_description(self, event):
    """保存描述到当前及后续指定数量的图片"""
    selection = self.image_listbox.GetSelection()
    if selection != wx.NOT_FOUND:
        description = self.description_text.GetValue()
        group_count = self.group_spin.GetValue()
        
        # 生成唯一的组ID
        import time
        group_id = int(time.time() * 1000)  # 毫秒级时间戳
        
        # 为当前及后续图片设置相同的描述和组ID
        for i in range(selection, min(selection + group_count, len(self.image_items))):
            self.image_items[i].description = description
            self.image_items[i].group_id = group_id
        
        self.update_listbox()
        self.save_to_json()
        wx.MessageBox(f"描述已保存到 {group_count} 张图片！", "提示", wx.OK | wx.ICON_INFORMATION)

核心逻辑：

生成毫秒级时间戳作为唯一组ID
从选中位置开始，连续设置指定数量的图片
使用 min() 防止越界
相同 group_id 的图片会在PDF中显示在同一页

5. 数据持久化

保存到JSON

def save_to_json(self):
    """保存所有数据到JSON"""
    data = {
        'novel_title': self.title_text.GetValue(),
        'images': []
    }
    
    for item in self.image_items:
        data['images'].append({
            'path': item.path,
            'description': item.description,
            'group_id': item.group_id
        })
    
    json_path = 'novel_data.json'
    with open(json_path, 'w', encoding='utf-8') as f:
        json.dump(data, f, ensure_ascii=False, indent=2)

JSON结构示例：

{
  "novel_title": "时光旅行者",
  "images": [
    {
      "path": "/path/to/image1.jpg",
      "description": "主角在未来城市中醒来",
      "group_id": 1696834567890
    },
    {
      "path"js: "/path/to/image2.jpg",
      "description": "主角在未来城市中醒来",
      "group_id": 1696834567890
    }
  ]
}

从JSON加载

def on_load_json(self, event):
    """从JSON加载数据"""
    wildcard = "JSON文件 (*.json)|*.json"
    dlg = wx.FileDialog(self, "选择JSON文件", wildcard=wildcard, style=wx.FD_OPEN)
    
    if dlg.ShowModal() == wx.ID_OK:
        json_path = dlg.GetPath()
        try:
            with open(json_path, 'r', encoding='utf-8') as f:
                data = json.load(f)
            
            self.image_items.clear()
            
            if 'novel_title' in data:
                self.title_text.SetValue(data['novel_title'])
            
            for img_data in data.get('images', []):
                if os.path.exists(img_data['path']):  # 验证文件存在
                    item = ImageItem(
                        img_data['path'],
                        img_data.get('description', ''),
                        img_data.get('group_id')
                    )
                    self.image_items.append(item)
            
            self.update_listbox()
            wx.MessageBox("JSON文件加载成功！", "提示", wx.OK | wx.ICON_INFORMATION)
            
        except Exception as e:
            wx.MessageBox(f"加载JSON失败：{str(e)}", "错误", wx.OK | wx.ICON_ERROR)
    
    dlg.Destroy()

安全性考虑：

检查文件路径是否存在
使用 get() 方法提供默认值
完整的异常处理机制

PDF生成核心算法

1. PDF创建流程

def create_pdf(self, pdf_path):
    """创建PDF文件"""
    c = canvas.Canvas(pdf_path, pagesize=A4)
    page_width, page_height = A4
    
    # 注册中文字体
    try:
        pdfmetrics.registerFont(TTFont('SimSun', 'simsun.ttc'))
        font_name = 'SimSun'
    except:
        try:
            pdfmetrics.registerFont(TTFont('SimSun', '/System/Library/Fonts/STHeiti Light.ttc'))
            font_name = 'SimSun'
        except:
            font_name = 'Helvetica'
    
    # 创建封面页
    if self.novel_title:
        c.setFont(font_name, 36)
        title_width = c.stringWidth(self.novel_title, font_name, 36)
        c.drawString((page_width - title_width) / 2, page_height / 2, self.novel_title)
        c.showpage()
    
    # 按组处理内容...

字体处理策略：

优先尝试Windows字体（simsun.ttc）
其次尝试MACOS字体（STHeiti）
最后回退到默认字体（Helvetica）
使用 stringWidth() 计算文字宽度实现居中

2. 图片分组处理

# 按组处理图片
processed_indices = set()

for i, item in enumerate(self.image_items):
    if i in processed_indices:
        continue
    
    # 收集同组的图片
    if item.group_id is not None:
        group_images = [img for j, img in enumerate(self.image_items) 
                       if img.group_id == item.group_id]
        for j, img in enumerate(self.image_items):
            if img.group_id == item.group_id:
                processed_indices.add(j)
    else:
        group_images = [item]
        processed_indices.add(i)
    
    # 在一页中显示文字和所有配图
    self.draw_content_page(c, item.description, group_images, 
                          page_width, page_height, font_name)
    c.showPage()

算法解析：

使用 set 记录已处理的图片索引，避免重复处理
通过 group_id 识别同组图片
列表推导式高效收集同组图片
每组内容调用 draw_content_page() 渲染到一页

3. 智能布局算法

这是整个项目最复杂也最精彩的部分：

def draw_content_page(self, c, description, images, page_width, page_height, font_name):
    """在一页中绘制文字描述和配图"""
    margin = 40
    ushttp://www.devze.comable_width = page_width - 2 * margin
    usable_height = page_height - 2 * margin
    
    current_y = page_height - margin
    
    # 1. 绘制文字描述
    if description:
        c.setFont(font_name, 12)
        lines = self.wrap_text(description, usable_width - 10, c, font_name, 12)
        
        for line in lines:
            current_y -= 18
            c.drawString(margin + 5, current_y, line)
        
        current_y -= 20  # 文字和图片之间的间距
    
    # 2. 计算剩余空间
    remaining_height = current_y - margin
    
    if len(images) == 0:
        return
    
    num_images = len(images)
    
    # 3. 根据图片数量选择布局策略
    if num_images == 1:
        # 单张图片：居中显示
        self.draw_single_image(c, images[0].path, margin, margin, 
                              usable_width, remaining_height)
    
    elif num_images == 2:
        # 两张图片：并排显示
        img_width = (usable_width - 20) / 2
        for idx, img in enumerate(images):
            x = margin + idx * (img_width + 20)
            self.draw_single_image(c, img.path, x, margin, 
                                  img_width, remaining_height)
    
    elif num_images == 3:
        # 三张图片：动态布局
        if remaining_height > usable_width * 0.8:
            # 空间充足：上1下2布局
            top_height = remaining_height * 0.5
            bottom_height = remaining_height * 0.45
            
            self.draw_single_image(c, images[0].path, margin, 
                                  margin + bottom_height + 20, 
                                  usable_width, top_height)
            
            img_width = (usable_width - 20) / 2
            for idx, img in enumerate(images[1:]):
                x = margin + idx * (img_width + 20)
                self.draw_single_image(c, img.path, x, margin, 
                                      img_width, bottom_height)
        else:
            # 空间不足：三张并排
            img_width = (usable_width - 40) / 3
            for idx, img in enumerate(images):
                x = margin + idx * (img_width + 20)
                self.draw_single_image(c, img.path, x, margin, 
                                      img_width, remaining_height)
    
    elif num_images == 4:
        # 四张图片：2x2网格
        img_width = (usable_width - 20) / 2
        img_height = (remaining_height - 20) / 2
        
        positions = [
            (0, 1), (1, 1),  # 上排
            (0, 0), (1, 0)   # 下排
        ]
        
        for idx, img in enumerate(images):
            col, row = positions[idx]
            x = margin + col * (img_width + 20)
            y = margin + row * (img_height + 20)
            self.draw_single_image(c, img.path, x, y, img_width, img_height)
    
    else:
        # 5张及以上：自动网格布局
        cols = min(3, num_images)
        rows = math.ceil(num_images / cols)
        
        img_width = (usable_width - (cols - 1) * 15) / cols
        img_height = (remaining_height - (rows - 1) * 15) / rows
        
        for idx, img in enumerate(images):
            row = idx // cols
            col = idx % cols
            x = margin + col * (img_width + 15)
            y = margin + (rows - 1 - row) * (img_height + 15)
            self.draw_single_image(c, img.path, x, y, img_width, img_height)

布局策略详解：

单图布局（1张）

┌─────────────────┐
│   文字描述      │
├─────────────────┤
│                 │
│   [单张大图]    │
│                 │
└─────────────────┘

充分利用剩余空间，图片居中显示。

双图布局（2张）

┌─────────────────┐
│   文字描述      │
├────────┬────────┤
│        │        │
│ [图1]  │ [图2]  │
│        │        │
└────────┴────────┘

左右并排，平分空间。

三图布局（3张）

根据剩余空间自适应：

空间充足时（高度 > 宽度 * 0.8）：

┌─────────────────┐
│   文字描述      │
├─────────────────┤
│    [图片1]      │
├────────┬────────┤
│ [图2]  │ [图3]  │
└────────┴────────┘

空间不足时：

┌─────────────────┐
│   文字描述      │
├─────┬─────┬─────┤
│[图1]│[图2]│[图3]│
└─────┴─────┴─────┘

四图布局（4张）

┌─────────────────┐
│   文字描述      │
├────────┬────────┤
│ [图1]  │ [图2]  │
├────────┼────────┤
│ [图3]  │ [图4]  │
└────────┴────────┘

标准2x2网格。

多图布局（5+张）

┌──────────────────────┐
│     文字描述         │
├──────┬──────┬────────┤
│[图1] │[图2] │ [图3]  │
├──────┼──────┼────────┤
│[图4] │[图5] │ [图6]  │
└──────┴──────┴────────┘

自动计算网格（最多3列），向上取整行数。

4. 单图绘制函数

def draw_single_image(self, c, image_path, x, y, max_width, max_height):
    """在指定位置绘制单张图片"""
    try:
        img = Image.open(image_path)
        img_width, img_height = img.size
        
        # 计算缩放比例（保持宽高比）
        scale = min(max_width / img_width, max_height / img_height)
        new_width = img_width * scale
        new_height = img_height * scale
        
        # 居中对齐
        x_centered = x + (max_width - new_width) / 2
        y_centered = y + (max_height - new_height) / 2
        
        c.drawImage(image_path, x_centered, y_centered, 
                   width=new_width, height=new_height)
        
    except Exception as e:
        print(f"绘制图片 {image_path} 时出错：{str(e)}")

关键算法：

scale = min(width_ratio, height_ratio) 确保图片不超出边界
居中算法：centered = start + (availablejavascript - actual) / 2
异常处理确保单张图片失败不影响整体生成

5. 文字换行算法

def wrap_text(self, text, max_width, canvas_obj, font_name, font_size):
    """文字换行"""
    lines = []
    paragraphs = text.split('\n')
    
    for para in paragraphs:
        if not para.strip():
            lines.append('')
            continue
            
        current_line = ""
        for char in para:
            test_line = current_line + char
            if canvas_obj.stringWidth(test_line, font_name, font_size) < max_width:
                current_line = test_line
            else:
                if current_line:
                    lines.append(current_line)
                current_line = char
        
        if current_line:
            lines.append(current_line)
    
    return lines

算法特点：

支持段落（\n）保留
逐字符测量宽度，精确换行
使用 stringWidth() 考虑不同字符宽度（中英文混排）
空段落保留为空行

性能优化与最佳实践

1. 内存管理

# 使用 thumbnail 而非 resize
img.thumbnail(preview_size, Image.Resampling.LANCZOS)

thumbnail() 直接修改原对象，比 resize() 返回新对象更节省内存。

2. 资源释放

dlg = wx.FileDialog(...)
if dlg.ShowModal() == wx.ID_OK:
    # 处理逻辑
dlg.Destroy()  # 必须显式销毁

wxPython 对话框必须手动销毁，否则会内存泄漏。

3. 异常处理

所有文件操作和图片处理都包裹在 try-except 中，确保程序稳定性。

4. 用户体验优化

操作后立即提供反馈（MessageBox）
保持选中状态（移动后重新选中）
列表显示描述预览（快速识别）

可能的扩展功能

1. 图片编辑

添加滤镜效果
裁剪和旋转
亮度、对比度调整

2. 文字排版

支持富文本（粗体、斜体）
自定义字体和字号
段落对齐方式

3. 模板系统

templates = {
    'simple': {'margin': 40, 'font_size': 12},
    'elegant': {'margin': 60, 'font_size': 14},
    'compact': {'margin': 20, 'font_size': 10}
}

4. 批量处理

支持多个项目
项目间快速切换
批量导出

5. 云端同步

项目保存到云端
多设备协同编辑
版本控制

常见问题与解决方案

问题1：中文字体不显示

原因： 系统缺少中文字体或路径错误

解决方案：

# 添加更多字体路径
font_paths = [
    编程客栈'simsun.ttc',                           # Windows
    '/System/Library/Fonts/STHeiti Light.ttc',  # macOS
    '/usr/share/fonts/truetype/wqy/wqy-microhei.ttc'  # linux
]

for path in font_paths:
    try:
        pdfmetrics.registerFont(TTFont('SimSun', path))
        font_name = 'SimSun'
        break
    except:
        continue

问题2：图片过大导致内存溢出

解决方案： 在加载前预处理图片

def optimize_image(image_path, max_size=(2000, 2000)):
    img = Image.open(image_path)
    img.thumbnail(max_size, Image.Resampling.LANCZOS)
    return img

问题3：PDF文件过大

解决方案： 压缩图片质量

# 保存为JPEG并降低质量
img.save(temp_path, 'JPEG', quality=85, optimize=True)
c.drawImage(temp_path, ...)

运行结果

基于Python开发一个小说图片PDF生成器

pdf结果

基于Python开发一个小说图片PDF生成器

以上就是基于Python开发一个小说图片PDF生成器的详细内容，更多关于Python小说图片PDF生成的资料请关注编程客栈(www.devze.com)其它相关文章！

继续阅读：Python PDF Python PDF生成器 Python小说图片PDF生成 Python小说图片生成

目录

项目概述

核心功能

技术架构

依赖库分析

核心数据结构

ImageItem 类

GUI 界面设计

布局结构

关键UI组件

1. 标题输入区

2. 图片列表框

3. 图片预览区

4. 分组控制

核心功能实现

1. 图片管理

批量添加文件夹

单张/多张添加

2. 图片预览功能

3. 图片顺序调整

上移实现

4. 描述分组功能

5. 数据持久化

保存到JSON

从JSON加载

PDF生成核心算法

1. PDF创建流程

2. 图片分组处理

3. 智能布局算法

单图布局（1张）

双图布局（2张）

三图布局（3张）

四图布局（4张）

多图布局（5+张）

4. 单图绘制函数

5. 文字换行算法

性能优化与最佳实践

1. 内存管理

2. 资源释放

3. 异常处理

4. 用户体验优化

可能的扩展功能

1. 图片编辑

2. 文字排版

3. 模板系统

4. 批量处理

5. 云端同步

常见问题与解决方案

问题1：中文字体不显示

问题2：图片过大导致内存溢出

问题3：PDF文件过大

运行结果

pdf结果

更多精彩内容

精彩评论

最新开发

C++分布式语音识别服务实践方案

C#屏幕录制中遇到黑屏问题的原因和解决方法

C#利用.NET实现Word文档到HTML的高效转换

SpringBoot Maven的操作与配置图文教程

Spring Boot 整合第三方组件Redis、MyBatis、Kafka 实战案例指南

开发排行榜

springboot后端存储富文本内容的思路与步骤(含图片内容)

PyCharm运行python测试,报错“没有发现测试”/“空套件”的解决

return base64.b64encode(b).decode(

基于C语言实现钻石棋游戏的示例代码

Sublime Text 3解决中文乱码问题（实测可用）