Python基于百度AI的文字识别的示例

(编辑：jimmy 日期: 2026/7/31 浏览：2)

使用百度AI的文字识别库，做出的调用示例，其中filePath是图片的路径，可以自行传入一张带有文字的图片，进行识别。

下载baidu-aip这个库，可以直接使用pip下载：pip install baidu-aip，也可以在PyCharm等开发工具中下载。

然后运行下列代码即可。

# -*- coding: UTF-8 -*- 
 
from aip import AipOcr 
import json 
 
# 定义常量 
APP_ID = '9851066' 
API_KEY = 'LUGBatgyRGoerR9FZbV4SQYk' 
SECRET_KEY = 'fB2MNz1c2UHLTximFlC4laXPg7CVfyjV' 
 
# 初始化AipFace对象 
aipOcr = AipOcr(APP_ID, API_KEY, SECRET_KEY) 
 
# 读取图片 
filePath = "WechatIMG1.jpeg" 
def get_file_content(filePath): 
  with open(filePath, 'rb') as fp: 
    return fp.read() 
 
# 定义参数变量 
options = { 
 'detect_direction': 'true', 
 'language_type': 'CHN_ENG', 
} 
 
# 调用通用文字识别接口 
result = aipOcr.basicGeneral(get_file_content(filePath), options) 
print(json.dumps(result).decode("unicode-escape"))

输出结果：

{"log_id": 1424393327, "direction": 0, "words_result_num": 2, "words_result": [{"words": "不就果钱么!"}, {"words": "所技"}]}

我的这次识别有几个错误，与图片不清晰有关，下面是我识别的图片。

通用文字识别返回数据参数详情

字段必选类型说明 direction 否 number 图像方向，当detect_direction=true时存在。
- -1:未定义，
- 0:正向，
- 1: 逆时针90度，
- 2:逆时针180度，
- 3:逆时针270度 log_id 是 number 唯一的log id，用于问题定位 words_result_num 是 number 识别结果数，表示words_result的元素个数 words_result 是 array 定位和识别结果数组 +words 否 string 识别结果字符串

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持。

上一篇：Python实现接受任意个数参数的函数方法

下一篇：深入分析python数据挖掘 Json结构分析