文档中心

- API文档
- 通用文字识别
- 身份证识别
- 通用表格识别
- 国内通用票据识别
- 营业执照识别
- 图片切边增强
- 发票验真
- 银行卡识别
- 行驶证识别
- 驾驶证识别
- 增值税发票识别
- 票据分类
- 机动车购车发票识别
- 车辆合格证识别
- 卷式发票识别
- 名片识别
- 车牌号识别
- 社保卡识别
- 护照识别
- 车辆VIN码识别
- 电子承兑汇票识别
- 车辆登记证识别
- 图片转word
- 二手车购车发票识别
- 证件分类
- 火车票识别
- 印章检测识别
- 出租车发票识别
- 税务登记证识别
- 组织机构代码证识别
- 开户许可证识别
- 通用NLP信息抽取
- 澳门身份证识别
- 港澳居民来往内地通行证
- 台湾居民来往大陆通行证识别
- 台湾身份证识别
- 马来西亚身份证识别
- 户口本识别
- 结婚证识别
- 房产证识别
- 军官证识别
- 飞机行程单识别
- 定额发票识别
- 通用机打发票识别
- 车辆通行费票据识别
- 商铺小票识别
- 公路客运发票识别
- 海关进出口货物报关单识别
- 卫生许可证识别
- 事业单位法人证识别
- 港澳台通行证识别
- 台湾健保卡识别
- 日本驾驶证识别
- 菲律宾身份证识别
- 医疗证件票据分类
- 香港身份证识别
- 办公文档识别
- 出生证明识别
- PS检测
- 不动产权证书识别
- 银行回执单识别
- 自动擦除手写文字
- 去屏幕纹
- 港澳台居民居住证
- 二维码识别
- 汽车商业险保单识别
- PDF转Word
- PDF转Excel
- PDF转PPT
- PDF转图片
- Word转PDF
- Excel转PDF
- 图片转PDF
- Word转图片
- 完税证明
- 文档图像切边矫正
- 图像水印去除
- 手写签名识别
- 区块链发票验真
- 印尼身份证
查看文档
示例代码
API调试
功能描述
通用NLP信息抽取
请求URL
https://api.textin.com/ai/service/v1/contents-extract
HTTP请求方法
HTTP POST
请求头说明(Request Header)
请在HTTP请求中添加以下自定义Header。
header 名 | 值 |
---|---|
x-ti-app-id | 请登录后前往 “工作台-账号设置-开发者信息” 查看 x-ti-app-id |
x-ti-secret-code | 请登录后前往 “工作台-账号设置-开发者信息” 查看 x-ti-secret-code |
请求体说明(Request Body)
Content-Type: application/json
JSON示例:
{
"keys": [
"要抽取的key"
],
"file": "要提取的文件的base64字符串,如果提取纯文本,则直接赋值其文本字符串。",
"type": "file字段里存放的数据类型,枚举值:word, pdf, image, string"
}
响应体说明(Response Data)
Content-Type: application/json
JSON结构说明如下:
字段名 | 类型 | 描述 |
---|---|---|
code | integer | 错误码,详见“错误码说明” |
duration | number |
单次请求的响应时间(单位为毫秒) |
message | string |
错误信息 |
version | string |
服务版本号 |
result | object |
特定接口的返回结果 |
+ pages_count | integer |
输入数据/文档包含的页面总数 |
+ keys_count | integer |
单次请求传入的键名数量 |
+ item_list | array | |
++ key | string |
用户自定义的单个键名 |
++ value | string |
从输入数据中提取的键值 |
++ score | number |
键值对置信度分数 |
++ nonscore | number |
未匹配到值的分数 |
++ candidates | array | |
+++ value | string | |
+++ score | number |
值属于键的置信度分数 |
+++ range | string |
值在原始输入文本的位置区间,当前仅当输入数据为txt文本时有效 |
+++ chars_info | array | |
++++ page_index | integer |
|
++++ char | string |
|
++++ rotation | integer |
|
++++ polygons | array |
字符的空间坐标位置,4个点依次为左下x、左下y、右上x和右上y |
+ pages | array | |
++ index | integer |
传入文档的第几页(从0开始) |
++ angle | integer |
接口输出文档的角度, 定义人类阅读文字的方向为文档正向放置,用零度表示, 该字段表示对正置文档进行了顺时针若干角度的旋转。 |
++ original_angle | integer |
接口输入文档的角度,用于记录文档最原始的旋转角度,因为当输入 |
++ width | integer |
文档的宽度 |
++ height | integer |
文档的高度 |
++ image_bytes | string |
图片的base64字符流 |
++ image_scale | number |
返回的图片的缩放比例 |
++ image_type | string |
返回的图片的格式 |
JSON结构示例
{
"code": 200,
"message": "string",
"version": "v1.0.0",
"duration": 456.7,
"result": {
"pages_count": 5,
"keys_count": 2,
"item_list": [
{
"key": "合同编号",
"value": "9012",
"score": 12.36,
"nonscore": -3.96,
"candidates": [
{
"value": "9012",
"score": 0.999,
"range": "[0,10]",
"chars_info": [
{
"page_index": 1,
"char": "x",
"rotation": 0,
"polygons": [
0,
50,
50,
0
]
}
]
}
]
}
],
"pages": [
{
"index": 0,
"angle": 0,
"original_angle": 0,
"width": 595,
"height": 842,
"image_bytes": "iVBORw0KGgoAAAANSUhEUgAAA0oAAAJUCAIAAACkE0HlAAAACXBIWXMAAA7EAAAOxAGVKw4bAAByT0lEQVR4nOzdeTxV6",
"image_scale": 2,
"image_type": "jpeg"
}
]
}
}
错误码说明
错误码 | 描述 |
---|---|
40101 | x-ti-app-id 或 x-ti-secret-code 为空 |
40102 | x-ti-app-id 或 x-ti-secret-code 无效,验证失败 |
40103 | 客户端IP不在白名单 |
40003 | 余额不足,请充值后再使用 |
40004 | 参数错误,请查看技术文档,检查传参 |
40007 | 机器人不存在或未发布 |
40008 | 机器人未开通,请至市场开通后重试 |
40301 | 图片类型不支持 |
40302 | 上传文件大小不符,文件大小不超过 10M |
40303 | 文件类型不支持 |
40304 | 图片尺寸不符,图像宽高须介于 20 和 10000(像素)之间 |
40305 | 识别文件未上传 |
30203 | 基础服务故障,请稍后重试 |
500 | 服务器内部错误 |