语音转译审核(多语种)
任务简介
适用的识别任务
语音转译审核(taskId: 5caee6b2a76925c55a09a6d2)
使用场景
通过语音识别、文本NLP反垃圾等技术,一站式识别海外视频、直播、 UGC、用户原创内容等多业务场景中出现的色情、涉政、暴恐、谩骂等违规音频内容,同时支持自定义词库配置,从而使审核结果更贴近实际场景需求。
支持语种
普通话、英语、日语、韩语、泰语、越南语、马来语、印尼语、印地语、菲律宾语、阿拉伯语、土耳其语、俄语、德语、法语、意大利语、西班牙语、葡萄牙语、瑞典语、波兰语、希腊语、挪威语、荷兰语等。
音频时长 审核音频需小于58秒
参数规范
特定请求参数
以下为该识别任务特定请求参数,其他公共调用参数详见:语音文件同步接口
| 参数名称 | 类型 | 是否必需 | 说明 |
|---|---|---|---|
| language | String | 否 | 需要识别的语言代码。需要进行多语种语音转译审核或者多语种转译时必传。多语种语音转译类产品需联系图普进行配置使用。 对应语言代码详见底部“附表:语言代码列表”。默认为 zh-CN。若需对语种进行自动检测识别,取值 AUTO |
任务返回信息
taskId参数
| 参数名 | 类型 | 是否必有 | 说明 |
|---|---|---|---|
| fileList | Array | 是 | 识别的详细结果,具体数据结构如下 |
fileList参数
| 参数名 | 类型 | 是否必有 | 说明 |
|---|---|---|---|
| file_name | String | 是 | 上传的语音文件名称 |
| result | Object | 是 | 结果数据结构 |
result数据结构
| 参数名 | 类型 | 是否必有 | 说明 |
|---|---|---|---|
| content | String | 是 | 文本内容,可能为空 |
| action | String | 是 | 是否违规,block:违规,pass:通过,review:复审 |
| language | String | 是 | 多语种审核语种语言代码 |
| label | String | 是 | 违规标签, 具体参考识别分类值 |
| review | Bool | 是 | 是否复审,true:是 false:否 |
| hasVoice | Bool | 是 | 是否有声音,true:是,false:否 |
| details | Array | 是 | 命中的关键词详细信息,如果actions为pass,则details为空数组(nlp 判为违规,但未命中某个关键词也为空数组),详见以下数据结构 |
details数据结构
| 参数名 | 类型 | 是否必有 | 说明 |
|---|---|---|---|
| keyword | String | 否 | 命中的关键词。 1. 若命中算法模型,值为空字符串; 2. 若命中单个关键词,值为关键词字符串,例如: 习近平;2. 若同时命中多个关键词(组合规则),值为通过 + 拼接,且被括号包裹的字符串,例如:(加+微信);(A+B) 表示关键词 A 与 B 之间无顺序要求,{A+B} 表示关键词 A 与 B 之间按照出现顺序匹配 |
| hint | String | 否 | 检测文本中的违规内容片段,例如原文为 那我先加您微信,发您一下,值为:加您微信 |
| mainLabel | String | 是 | 命中的风险主标签, 具体参考识别分类值 |
| subLabel | String | 否 | 关键词的次标签 |
json示例
示例代码
{
"629e23efaa468d0107f75ad4": {
"fileList": [
{
"file_name": "AD.mp3-2.wav",
"result": {
"content": " and I was like,all right,thanks,dude,we could piss and i can get my coffee。我虽然能听懂,我估计你们大部分听不懂,看你如果能听懂的话给我留言,everybody say,thank you Shannon thank you,Shannon,谢谢您。",
"review": false,
"action": "block",
"label": "Abuse",
"language": "zh-CN",
"hasVoice": true,
"details": [
{
"keyword": "piss",
"hint": "piss",
"mainLabel": "Abuse",
"subLabel": "Abuse"
}
]
}
}
]
}
}
附表
语言代码列表
若需对语种进行自动检测识别,取值 AUTO
| 语言地区码 | 语言(地区) |
|---|---|
| ar-EG | Arabic (Egypt) |
| ar-SA | Arabic (Saudi Arabia) |
| ar-AE | Arabic (UAE) |
| ar-KW | Arabic (Kuwait) |
| ar-QA | Arabic (Qatar) |
| de-DE | German (Germany) |
| el-GR | Greek (Greece) |
| en-AU | English (Australia) |
| en-CA | English (Canada) |
| en-GB | English (United Kingdom) |
| en-IN | English (India) |
| en-NZ | English (New Zealand) |
| en-US | English (United States) |
| es-ES | Spanish (Spain) |
| es-AR | Spanish (Argentina) |
| fil-PH | Filipino (Pilipinas) |
| fr-CA | French (Canada) |
| fr-FR | French (France) |
| id-ID | Indonesian (Indonesia) |
| it-IT | Italian (Italy) |
| ja-JP | Japanese (Japan) |
| ko-KR | Korean (Korea) |
| ms-MY | Malay (Malaysia) |
| nb-NO | Norwegian (Norway) |
| nl-NL | Dutch (Netherlands) |
| pl-PL | Polish (Poland) |
| pt-BR | Portuguese (Brazil) |
| pt-PT | Portuguese (Portugal) |
| ru-RU | Russian (Russia) |
| sv-SE | Swedish (Sweden) |
| zh-CN | Chinese (Mandarin, China Mainland) |
| zh-HK | Chinese (Cantonese, HongKong) |
| zh-TW | Chinese (Mandarin, Taiwan) |
| th-TH | Thai (Thailand) |
| tr-TR | Turkish (Turkey) |
| vi-VN | Vietnamese (Vietnam) |