同步文本审核

接入说明:

同步文本识别: 最大支持2,000个字符识别,同步响应接口。

支持语种:文本审核默认识别中文,如需识别其他语种(例如,英文、日语、韩语、泰语、越南语、马来语、印尼语、印地语、菲律宾语、阿拉伯语、土耳其语、俄语、德语、法语、意大利语、西班牙语、葡萄牙语等)中的风险内容,请联系我们进行相应配置,以保证识别效果。

请求地址:

  • 国内: http://api.text.tuputech.com/v3/recognition/text/<secretId>
  • 国外:
    • http://api-us.open.tuputech.com/v3/recognition/text/<secretId>
    • http://api-oversea.open.tuputech.com/v3/recognition/text/<secretId>

secretId 需替换为您的 secretId,请联系我们为您开通 secretId。

请求方法:

POST

请求头:

Content-Type: application/json

QPS限制

  • 1秒最多允许请求10次;
  • 1个请求最多携带10个文本;

请求及返回参数

请求示例:

{
  "text": [
    {
      "content": "32132131",
      "contentId": "5bcf23077f532488c2ccd6a615414997698270",
      "userId": "test",
      "forumId": "car"
    }
  ],
  "timestamp": 1541499770,
  "nonce": 0.8469537531104208,
  "signature": "CsIMcHuWqn/QFEnHWcFEhrB7ydcg5xTKawpRpNqA9Nw2WlCVIDR5jDcyUF85"
}

curl请求示例

curl -X POST --header 'Content-Type: application/json' \
-d '{
  "text": [
    {
      "content": "32132131",
      "contentId": "5bcf23077f532488c2ccd6a615414997698270",
      "userId": "test",
      "forumId": "car"
    }
  ],
  "timestamp": 1541499770,
  "nonce": 0.8469537531104208,
  "signature": "CsIMcHuWqn/QFEnHWcFEhrB7ydcg5xTKawpRpNqA9Nw2WlCVIDR5jDcyUF85"
}' \
'http://api.text.tuputech.com/v3/recognition/text/your_secretId'

请求参数说明:

参数名 类型 是否必填 说明
text Array 请求的文本相关内容,详见text参数说明
timestamp Number 当前的服务器的Unix时间戳
nonce Number 随机数
signature String 我们采用的数字证书签名算法是:"RSA-SHA256",签名输出类型是:"base64",具体步骤如下:
1、所有参与签名的参数为:secretId,timestamp,nonce,用英文半角逗号“,”相连,得到sign_string;
2、利用您的私钥,使用算法"RSA-SHA256"签名,输出为 "base64" 格式,得到参数signature的值。
点击管理公钥证书查看如何生成私钥,及如何上传您的公钥用于数字签名的认证;

如有特殊并发需求,请联系我们。

text参数说明:
参数名 类型 是否必填 说明
content String 待检测的文本内容,可以为词语或句子,最大支持2,000字符
contentId String 客户自定义信息,方便根据该id找到相关的文本,建议可设置为secretId + 当前时间 + 随机数,参考请求示例
userId String 用户Id
forumId String 板块Id

返回参数说明

taskId

57c4036c557603652aeeb222

taskId对象中的数据结构
参数名 类型 是否必有 说明
texts Array 识别的详细结果,具体数据结构如下
texts数据结构
参数名 类型 是否必有 说明
content String 检测的文本内容
action String 检测结果, 'pass': 通过, 'block': 不通过, 'review': 复审
label String 标签, 具体参考识别分类值
review Bool 是否需要复审,true:是, false: 否
rate Float 吻合分数,分数越高,识别出来的结果越准确,取值为0到1之间或者空值null(外语语种审核不返还分数)
details Array 命中的关键词详细信息,如果actions为pass,则details为空数组,详见以下数据结构
contentId String 客户自定义信息
userId String 用户Id
forumId String 版块Id


details数据结构
参数名 类型 是否必有 说明
keyword String 命中的关键词。若命中算法模型,返回值为空。
hint String 检测文本中的违规内容片段
mainLabel String 命中的风险主标签, 具体参考识别分类值
subLabel String 二级标签

文本识别结果数据示例

{
    "57c4036c557603652aeeb222":{
        "texts":[
            {
                "contentId":"5c495dd6ca4faa03dafcb05215517048827110.9555874784367748",
                "userId":"Test",
                "forumId":"test",
                "content":"早晨",
                "action":"pass",
                "label":"Normal",
                "review":false,
                "rate":0.998047,
                "details":[

                ]
            },
            {
                "contentId":"5c495dd6ca4faa03dafcb05215517048827110.9555874784367748",
                "userId":"Test",
                "forumId":"test",
                "content":"毛!!泽!!东",
                "action":"block",
                "label":"Politics",
                "review":false,
                "rate":1,
                "details":[
                    {
                        "keyword":"毛泽东",
                        "hint":"毛!!泽!!东",
                        "mainLabel":"Politics",
                        "subLabel":"National_Leader"
                    }
                ]
            }
        ]
    },
    "code":0,
    "message":"success",
    "nonce":"0.9224814879136034",
    "timestamp":1551704883139
}

results matching ""

    No results matching ""