Python统计pdf中英文单词的个数

阿黎逸阳 • 2023年09月24日 15:08 • 1年前 • 编程日记 • 阅读(7) • 违法举报

之前的文章提供了批量识别pdf中英文的方法，详见【python爬虫】批量识别pdf中的英文，自动翻译成中文上。以及自动pdf英文转中文文档，详见【python爬虫】批量识别pdf中的英文，自动翻译成中文下。

本文实现python统计pdf中英文字符的个数。

首先看下要统计字符的pdf长什么样。

在这里插入图片描述

为了简单、清晰，本文以统计两页英文pdf字符为例进行阐述，代码直接可以应用到任意页数的英文pdf中。

接着应用pdfplumber库识别pdf中的字符，具体代码如下：文章来源地址https://uudwc.com/A/nPyoX

原文地址:https://blog.csdn.net/qq_32532663/article/details/132939556

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请联系站长进行投诉反馈，一经查实，立即删除！