表格识别
图片与 PDF 表格识别,输出 Excel / Markdown / JSON
表格识别引擎
>_CONSOLE控制台
[10:28:40]
Initializing TextIn xParse engine...
[10:28:41]
Loading table recognition models
[10:28:42]
Detecting table regions...
[10:28:43]
开始表格结构识别...
[10:28:44]
Preparing file: 表格文件.pdf
[10:28:45]
Exporting Excel & JSON...
识别表格行列与表头
输出结构化表格数据
表格文件.pdf
表格区域检测
已完成
行列结构识别
识别中
表头层级还原
等待中
合并单元格处理
等待中
Excel / JSON 输出
等待中
从图片 / PDF 表格到可编辑、可调用的数据结果


暂无数据
上传图片或 PDF,立即查看表格识别效果
在哪些场景下,你需要自动识别表格内容?
表格录入与二次编辑
把图片、PDF、扫描件中的表格还原为 Excel,适合人工检查、表格录入、数据清洗和二次编辑
知识库入库与 RAG
输出 Markdown 表格,适配知识库入库、RAG 检索和大模型读取,减少表格内容丢失与上下文断裂
系统集成与 API 调用
输出 JSON 结果,包含表格结构、文本内容、页码与坐标信息,适合 API 调用、数据库入库和业务系统集成
支持能力与边界
我们能解析什么?
| 文件类型 | PDF 扫描件 PDF JPG PNG 图片型 PDF |
| 表格来源 | PDF 表格 图片表格 拍照表格 扫描件表格 业务附件表格 |
| 表格结构 | 普通表格 跨页表格 多层表头 合并单元格 |
| 复杂版式 | 无线表 弱线表 嵌套表格 图文混排中的表格 |
| 坐标溯源 | 原文页码 表格坐标 单元格位置 字段位置 |
| 输出格式 | Excel Markdown JSON HTML |
解析边界说明
| 支持 | 清晰图片 数字版 PDF 扫描件 PDF 图片型 PDF 常见业务表格 |
| 不支持 | 极度模糊 严重倾斜 遮挡严重 表格区域不完整的文件 |
| 需评估 | 大量手写表格 复杂涂改表格 低清扫描件 非标准业务表单 |
| 输出 | 输出表格结构化结果 |
| 适用 | 图片转 Excel PDF 表格抽取 表格转 JSON 表格转 Markdown 等 |
| 建议 | 复杂样本建议先上传真实文件测试,再评估批量处理或 API 接入效果 |
多种方式接入表格识别能力
常见问题
01
支持图片转 Excel 吗?
支持。TextIn xParse 可识别图片、拍照文档和扫描件中的表格内容,并输出可用于 Excel 的结构化结果。
02
支持 PDF 表格抽取吗?
支持。可从数字版 PDF、扫描件 PDF、图片型 PDF 中抽取表格内容,并尽量还原表格结构。
03
可以识别跨页表格吗?
支持跨页表格解析。对于分页后的长表格,可尽量还原连续表格结构,减少跨页断裂和表头丢失问题。
04
可以输出 JSON 吗?
可以。表格识别结果可输出 JSON,也可输出 Excel、Markdown、HTML 等格式,适合 API 调用、系统入库和业务集成。
05
是否支持原文位置追溯?
支持。可返回页码、坐标等位置信息,便于校验识别结果与原文之间的对应关系。
06
复杂表格一定能完全还原吗?
复杂表格的效果会受到清晰度、版面质量、扫描质量、表格结构复杂度等因素影响。建议上传真实样本进行测试和评估。
07
支持批量识别吗?
支持通过 API 或企业级方案进行批量识别,适合大量图片、PDF、扫描件表格自动处理场景。