语音转译审核(多语种)

任务简介

适用的识别任务

语音转译审核(taskId: 5caee6b2a76925c55a09a6d2)

使用场景

通过语音识别、文本NLP反垃圾等技术,一站式识别海外视频、直播、 UGC、用户原创内容等多业务场景中出现的色情、涉政、暴恐、谩骂等违规音频内容,同时支持自定义词库配置,从而使审核结果更贴近实际场景需求。

支持语种

普通话、英语、日语、韩语、泰语、越南语、马来语、印尼语、印地语、菲律宾语、阿拉伯语、土耳其语、俄语、德语、法语、意大利语、西班牙语、葡萄牙语、瑞典语、波兰语、希腊语、挪威语、荷兰语等。

音频时长 审核音频需小于58秒

参数规范

特定请求参数

以下为该识别任务特定请求参数,其他公共调用参数详见:语音文件同步接口

参数名称 类型 是否必需 说明
language String 需要识别的语言代码。需要进行多语种语音转译审核或者多语种转译时必传。多语种语音转译类产品需联系图普进行配置使用。 对应语言代码详见底部“附表:语言代码列表”。默认为 zh-CN。若需对语种进行自动检测识别,取值 AUTO

任务返回信息

taskId参数

参数名 类型 是否必有 说明
fileList Array 识别的详细结果,具体数据结构如下

fileList参数

参数名 类型 是否必有 说明
file_name String 上传的语音文件名称
result Object 结果数据结构

result数据结构

参数名 类型 是否必有 说明
content String 文本内容,可能为空
action String 是否违规,block:违规,pass:通过,review:复审
language String 多语种审核语种语言代码
label String 违规标签, 具体参考识别分类值
review Bool 是否复审,true:是 false:否
hasVoice Bool 是否有声音,true:是,false:否
details Array 命中的关键词详细信息,如果actions为pass,则details为空数组(nlp 判为违规,但未命中某个关键词也为空数组),详见以下数据结构

details数据结构

参数名 类型 是否必有 说明
keyword String 命中的关键词。
1. 若命中算法模型,值为空字符串;
2. 若命中单个关键词,值为关键词字符串,例如:习近平
2. 若同时命中多个关键词(组合规则),值为通过 + 拼接,且被括号包裹的字符串,例如:(加+微信)(A+B) 表示关键词 A 与 B 之间无顺序要求,{A+B} 表示关键词 A 与 B 之间按照出现顺序匹配
hint String 检测文本中的违规内容片段,例如原文为 那我先加您微信,发您一下,值为:加您微信
mainLabel String 命中的风险主标签, 具体参考识别分类值
subLabel String 关键词的次标签

json示例

示例代码

{
    "629e23efaa468d0107f75ad4": {
        "fileList": [
            {
                "file_name": "AD.mp3-2.wav",
                "result": {
                    "content": " and I was like,all right,thanks,dude,we could piss and i can get my coffee。我虽然能听懂,我估计你们大部分听不懂,看你如果能听懂的话给我留言,everybody say,thank you Shannon thank you,Shannon,谢谢您。",
                    "review": false,
                    "action": "block",
                    "label": "Abuse",
                    "language": "zh-CN",
                    "hasVoice": true,
                    "details": [
                        {
                            "keyword": "piss",
                            "hint": "piss",
                            "mainLabel": "Abuse",
                            "subLabel": "Abuse"
                        }
                    ]
                }
            }
        ]
    }
}

附表

语言代码列表

若需对语种进行自动检测识别,取值 AUTO

语言地区码 语言(地区)
ar-EG Arabic (Egypt)
ar-SA Arabic (Saudi Arabia)
ar-AE Arabic (UAE)
ar-KW Arabic (Kuwait)
ar-QA Arabic (Qatar)
de-DE German (Germany)
el-GR Greek (Greece)
en-AU English (Australia)
en-CA English (Canada)
en-GB English (United Kingdom)
en-IN English (India)
en-NZ English (New Zealand)
en-US English (United States)
es-ES Spanish (Spain)
es-AR Spanish (Argentina)
fil-PH Filipino (Pilipinas)
fr-CA French (Canada)
fr-FR French (France)
id-ID Indonesian (Indonesia)
it-IT Italian (Italy)
ja-JP Japanese (Japan)
ko-KR Korean (Korea)
ms-MY Malay (Malaysia)
nb-NO Norwegian (Norway)
nl-NL Dutch (Netherlands)
pl-PL Polish (Poland)
pt-BR Portuguese (Brazil)
pt-PT Portuguese (Portugal)
ru-RU Russian (Russia)
sv-SE Swedish (Sweden)
zh-CN Chinese (Mandarin, China Mainland)
zh-HK Chinese (Cantonese, HongKong)
zh-TW Chinese (Mandarin, Taiwan)
th-TH Thai (Thailand)
tr-TR Turkish (Turkey)
vi-VN Vietnamese (Vietnam)

results matching ""

    No results matching ""