OCR文本审核
服务返回信息的公共结构
参数名 | 类型 | 是否必有 | 说明 |
---|---|---|---|
signature | String | 是 | 我们采用的数字证书签名算法是:"RSA-SHA256" ,签名输出类型是:"base64" ,首先下载图普科技的公钥证书,然后按如下步骤认证:1、收到的JSON数据经过JSON.parse(),得到JSON对象,记为data; 2、data含两个字段:signature、json;signature是数字签名,json是真正的有效数据的字符串格式; 3、用signature对json进行签名认证,算法: RSA-SHA256 ,输出类型:base64 ,得到认证结果;4、认证通过后,对json进行JSON.parse(),得到JSON数据,详见"json"字段说明。 |
json | String | 是 | json 字段经过JSON.parse(json)后,得到具体的结果,含: message:与code相关的文本信息 timestamp:当前的服务器的Unix时间戳。 nonce:随机数。 |
json内容解析后的结构
参数名 | 类型 | 是否必有 | 说明 |
---|---|---|---|
code | Number | 是 | 请求的状态码,参考服务公共状态码解析 |
message | String | 是 | 请求的状态信息 |
timestamp | Number | 是 | 当前的服务器的Unix时间戳 |
nonce | Number | 是 | 随机数 |
[taskId] | Object | 是 | 识别任务的结果,不同识别任务会有特定的taskId和[taskId]信息结构 |
... | ... | 否 | 其它识别及请求响应结果信息 |
示例
{
"signature": "signature_from_tupu_service",
"json": "{\"code\":0,\"message\":\"success\",\"nonce\":\"0.5442530125172196\",\"timestamp\":1595318082309}"
}
任务结果信息
taskId
5e1d634d2809c24f6d909bd3
taskId参数
参数名称 | 类型 | 是否必需 | 说明 |
---|---|---|---|
fileList | Array | 是 | 每张图片的识别结果 |
fileList参数
参数名称 | 类型 | 是否必需 | 说明 |
---|---|---|---|
name | String | 是 | 如果上传的image参数是url,则该值是图片url;如果是以图片文件上传,则该值为文件名 |
label | Number | 是 | 标签 0:正常 1:暴恐 2:色情 3:涉政 4:敏感 5:⼴告 6:谩骂 7:灌水 8:自定义 |
rate | Number | 是 | 文本审核汇总得分,分数越高,识别出来的结果越准确, 介于0-1的浮点数 |
review | Boolean | 是 | 是否复审,true:是 false:否 |
objects | Array | 是 | 检测出来的所有文字框 |
objects参数
参数名称 | 类型 | 是否必需 | 说明 |
---|---|---|---|
location | Array | 是 | 物体方框坐标[左上角坐标,右上角坐标,右下角坐标,左下角坐标] |
degree | Number | 是 | 文字的旋转角度,取值范围是[-180, 180],正表示顺时针,负表示逆时针 |
text | String | 是 | 识别到的文本信息 |
scores | Number | 是 | 文本检测得分,分数越高,识别出来的结果越准确,介于0-1的浮点数 |
textAnalysis | Object | 是 | 文本审核结果 |
textAnalysis参数
参数名称 | 类型 | 是否必需 | 说明 |
---|---|---|---|
label | Number | 是 | 标签 0:正常 1:暴恐 2:色情 3:涉政 4:敏感 5:⼴告 6:谩骂 7:灌水 8:自定义 |
review | Boolean | 是 | 是否复审,true:是 false:否 |
rate | Number | 是 | 文本审核得分,分数越高,识别出来的结果越准确, 介于0-1的浮点数 |
details | Array | 是 | 文本违规信息 |
details参数
参数名称 | 类型 | 是否必需 | 说明 |
---|---|---|---|
keyword | String | 是 | 测试文本中违规的词语 |
hint | String | 是 | 命中的关键词 |
mainLabel | Number | 是 | 关键词的主标签 0:正常 1:暴恐 2:色情 3:涉政 4:敏感 5:⼴告 6:谩骂 7:灌水 8:自定义 |
subLabel | String | 是 | 关键词的二级标签 |
json示例
{
"5e1d634d2809c24f6d909bd3": {
"fileList": [
{
"name": "44444.png",
"label": 3,
"rate": 1,
"review": false,
"objects": [
{
"text": "床前明月光",
"scores": 0.9995116114616394,
"degree": 0,
"location": [
[
0.3692741635989941,
0.42063488474394733
],
[
0.6314305795423576,
0.42063488474394733
],
[
0.6314305795423576,
0.49603178192271935
],
[
0.3692741635989941,
0.49603178192271935
]
],
"textAnalysis": {
"label": 0,
"review": false,
"rate": 0.96781986951828,
"details": []
}
},
{
"text": "毛泽东",
"scores": 0.9951668977737427,
"degree": 0,
"location": [
[
0.4256518406293357,
0.5753968315895163
],
[
0.5806905895660593,
0.5753968315895163
],
[
0.5806905895660593,
0.65079364460096
],
[
0.4256518406293357,
0.65079364460096
]
],
"textAnalysis": {
"label": 3,
"review": false,
"rate": 1,
"details": [
{
"keyword": "毛泽东",
"hint": "毛泽东",
"mainLabel": 3
}
]
}
}
],
"tag": "tag-test"
}
]
},
"code": 0,
"message": "success",
"nonce": "0.07701011150215531",
"timestamp": 1585210615325
}