新闻资讯TextIn1月升级:多引擎优化 + API 能力升级,解锁企业智能文档新体验

TextIn1月升级:多引擎优化 + API 能力升级,解锁企业智能文档新体验

2026-02-06 10:17:41

企业在智能文档处理过程中,常遭遇长图解析信息丢失、特殊格式识别偏差、多语种协作效率低、接口适配性不足等问题,直接影响技术落地与业务推进效率,TextIn1月完成全链路产品升级,从核心引擎到流程管理系统实现多维度优化,为企业解决各类文档处理难题提供了更完善的技术支撑。

合合信息是大模型时代文本智能技术的领先者,TextIn基于多模态大模型文本智能技术,本次1月产品升级围绕解析、抽取、图像处理、流程管理等核心能力进行全方位打磨,针对企业实际业务中的各类文档处理痛点完成功能优化与新增,进一步提升了产品的实用性与适配性,更好地满足企业技术开发与业务落地的双重需求。

一、TextIn xParse解析引擎:全维度优化,提升文档解析综合能力

1、原有功能优化

A. 长图解析性能增强:优化长图处理机制,减少长图文档(如网页截图、手机长截图)在解析过程中的信息遗漏风险。

TextIn

B. 特殊字符识别改进:提升了对文档中部分特殊字符的识别能力,增强整体识别准确率。

TextIn

C. Excel控件解析支持:新增对Excel表单控件(如下拉列表、单选按钮)的识别与提取功能,支持将其输出为结构化数据。

TextIn

D. Excel内嵌图片提取:新增对Excel文件中嵌入图片的检测与提取支持。

a. 原图:

TextIn

b. 识别效果:

TextIn

E. 表格识别精度提升:通过优化表格线辅助识别设置,提高表格识别的准确性。

TextIn

二、TextIn xParse抽取引擎:双维度升级,强化长表格处理表现

1、性能提升:针对长表格数据抽取场景,优化底层检索模块,提高整体处理速度。

2、精度提升(Badcase修复):提升坐标回显的准确性。

三、TextIn智能图像处理:优化篡改检测,降低识别误判率

通用篡改检测:优化检测能力,降低误判率。

TextIn

四、TextIn INTSIG DocFlow:全功能焕新,打造一体化文档处理体验

INTSIG DocFlow作为企业级文档流程管理产品,本次升级完成了引擎能力、文件预处理、键值翻译、API接口四大模块的焕新,新增多项实用功能并优化操作流程,全方位提升企业文档处理的效率与灵活性。

1、引擎能力提升

A. 抽取引擎更新

  1. 性能提升:针对长表格数据处理场景,优化检索模块的速度。

  2. 精度提升(Badcase修复):优化坐标回显。

2、文件预处理

A. 支持配置项

为提升对包含水印、拍摄不规范或具有跨页段落/表格等复杂文件的识别效果,系统新增图像预处理配置功能,可针对具体文件调整配置以优化信息抽取结果。当前支持的配置项包括:

  •  去水印

  •  切边矫正

  • 跨页段落、表格合并

  • 公式识别

  • 切分被表格线穿过的文本块

B. 上传文件

在上传文件弹窗中,支持对文件进行图像预处理选项配置,弹窗默认显示系统预设配置结果。

TextIn

C. 重新识别

在文件详情页中,如需通过调整图像预处理来优化文件抽取效果,可通过【重新识别】按钮进行配置。


  • 普通文件:对于不涉及多套拆分、多图切分,且文件类别不属于国内票据、标准卡证范围的文件,可点击【重新识别】右侧扩展选项完成配置修改。

TextIn

  • 拆套/切分文件:对于涉及多套拆分或多图切分的文件,可在原始文件详情页点击【保存并识别】右侧扩展选项完成配置修改。


TextIn


D. 文件详情页:新增解析结果

为更直观地查看图像预处理调整效果,便于定位抽取问题,在抽取结果基础上新增“解析结果”tab页,可依据不同文档内容模块(如标题、表格等)核对解析结果准确性。

TextIn

3、键值翻译

为满足企业在对外业务、多语种协作等场景下的文档处理需求(如金融报告、药监批文、跨国合同、海外票据等),DocFlow新增抽取结果键值翻译功能,支持对字段名称、抽取结果及表格相关信息进行多语种翻译,帮助用户在不改变原文结构的前提下,快速理解与使用多语种文档内容。

TextIn

A. 键值翻译开关

  • 点击“键值翻译”按钮即可进行翻译配置。选择源语言与目标语言后,点击“翻译”即可对字段名称、抽取结果、表格名称等内容进行翻译。译文下方将以蚂蚁线样式标识,以便区分原文与译文。

TextIn

  • 再次点击“键值翻译”按钮,可恢复显示原始键值信息。

  • 若当前任务已存在历史翻译结果,再次点击“键值翻译”按钮时,系统将直接展示历史翻译内容,无需重新翻译。

TextIn

B. 重新翻译

  • 全局重新翻译:如需调整翻译配置或重新翻译,可点击“重新翻译”按钮发起操作。

  • 字段重新翻译:如需对指定字段重新翻译,可将鼠标悬停于字段名称(Key)或抽取结果(Value)区域,点击“重新翻译”按钮进行操作。

TextIn

C. 原文/译文复制

  • 如需复制指定字段的原文或译文,可将鼠标悬停于字段名称(Key)或抽取结果(Value)区域,点击“复制”按钮即可完成内容复制,便于后续使用或二次处理。

TextIn

注意事项:

  • 如需通过API接口获取键值翻译结果,请联系合合信息技术人员进行相关咨询与配置确认。

4、API接口升级

本次版本对API能力进行了补充与优化,进一步提升多企业场景支持能力及任务处理灵活性。

A. 新增【企业多租户场景】接口说明

当用户加入多个企业,并需对指定企业账号下的内容进行操作或访问时,可通过查询企业ID,并在HTTP Header中添加 x-ti-enterprise-id 参数,指定目标企业进行操作。

注意事项:若用户仅加入一个企业(默认状态),无需进行额外配置。

TextIn

imageimageTextIn


B. 新增【同步上传】接口

在原有异步上传文件接口基础上,新增同步上传文件接口能力。使用该接口时,文件上传后系统将等待处理完成,并直接返回完整处理结果,无需额外查询任务状态。

TextIn

TextIn

C. 新增【任务状态查询】接口

支持对任务进行状态查询,包括:

  •  当前任务状态

  • 任务处理耗时

  • 任务失败原因(如有)

  • 支持按状态条件进行过滤查询

TextIn

D. 新增【抽取特定字段】接口

支持对已完成抽取的任务进行:

  •  已有字段的重新抽取

  • 新增自定义字段并执行抽取

TextIn

TextIn

E. 新增【文档重试】接口

支持对指定任务进行重试处理:

  • 非指定类别上传文件:重新执行文件完整处理流程,包括:解析 → 文件拆分/多图切分 → 分类 → 抽取等步骤。

  • 指定类别上传文件&完成类别修正文件:重新执行文件处理流程,包括:解析 → 抽取等步骤。

TextIn

TextIn

F. 更新【上传文件】接口

a. 新增文档解析预处理相关参数配置项,包括:

  • 去水印

  • 切边矫正

  • 跨页段落、表格合并

  • 公式识别

  • 切分被表格线穿过的文本块

TextIn


b.修复上传文件识别异常问题:修复部分.xlsx文件被错误识别为.zip文件,导致上传失败的问题。

点击立即体验TextIn新功能!

热门资讯

热门产品
热门标签

background
background
400-6666-582
免费使用
人工咨询
人工咨询
技术交流群
技术交流群

联系我们