新闻资讯TextIn xParse Skill上架ClawHub，免费的行业标杆级文档解析来了！

TextIn xParse Skill上架ClawHub，免费的行业标杆级文档解析来了！

2026-04-13 14:23:40

TextIn

文档解析能力正在成为 Agent 生态的基础设施。近日，TextIn xParse 文档解析 Skill 正式上架 ClawHub，全面接入 OpenClaw 技能市场。开发者只需在 OpenClaw 对话框中说一句话，即可将 PDF、Word、PPT、Excel 乃至长截图等复杂文档，自动转化为干净、结构化的 Markdown 格式，为 Agent 提供高质量上下文。

即刻体验：https://clawhub.ai/intsig-textin/xparse-parser

免费可用❗每日 1000 页额度，零门槛上手。

01 瓶颈 |Agent 缺的不是思考，是高精度的上下文

Agent 正在成为新的应用范式。

OpenClaw 生态中已有上万 Skills 涌现，开发者将能力拆解为可插拔、可复用的单元，Agent 按需加载，写代码、查资料、调 API，越来越像一个能自主行动的“数字员工”。然而，当 Agent 进入企业和真实业务场景时，真正的瓶颈并非模型能力，而是缺乏高精度的上下文输入。

企业沉淀了大量非结构化资料——PDF 里的合同条款、Word 中的产品手册、Excel 里的经营数据、PPT 中的战略规划。

这些文档承载着核心信息，但 Agent 却无法直接利用：格式不统一、结构不稳定、字段不规范，对模型而言，这是一段昂贵又“读不透”的上下文。

Andrej Karpathy 曾提出 LLM.Wiki 概念，将这一过程称为“编译”——从原始文档到 Agent 可用的知识形态，中间存在一道关键缺口。

TextIn

02 Skill |TextIn xParse：为 OpenClaw 补齐文档解析短板

合合信息在智能文字识别领域已有 19 年技术积累。随着开源 OCR 大模型与 Agent 生态的快速发展，TextIn 决定将企业级文档解析能力以最轻量的方式开放出来。文档解析 Skill —— TextIn xParse，正是第一个答案。

核心能力：全格式兼容与结构化还原

全格式兼容：支持 PDF、Word、Excel、PPT、图片等十余种格式输入；
结构完整还原：跨页表格、目录层级、页眉页脚、标题结构——完整保留文档骨架；
极速解析：百页文档最快约 1.5 秒完成，满足企业大规模批处理需求；
Markdown 输出：输出保留层级与语义的 Markdown，这是目前最受 LLM 和 Agent 欢迎的知识形态；
精确坐标回显：返回块级及字符级坐标信息，便于前端可视化展示与审核校对。

对企业级开发者和 OpenClaw 深度用户而言，商业级的稳定性、可用性和效果是产品能在生产环境中运行的保障。

所以我们把过去 19 年沉淀在企业场景里的能力，以最轻量、最友好的方式，压缩成一个 Skill，交到开发者手里。

03|一句话触发解析：与 Agent 的自然交互

无需编写代码，无需手动调用 API。

在 OpenClaw、Claude Code 等 Agent 平台安装 xparse-parser Skill 后，只需自然语言指令即可完成解析全流程。

例如：

“帮我读一下这份PDF合同，提取关键条款”
“把这个报告转成Markdown，保存到桌面”
“这份加密PDF密码是123456，帮我解析前10页”
“提取这张表格图片里的内容，输出JSON”

# 更多高阶玩法，等你探索

支持格式:

PDF、图片（jpg/png/bmp/tiff/webp），免登录免费试用，每日上限 1000 页。
更多格式与用量，配置 TextIn 账户凭证后，可解锁 Word、Excel、PPT、HTML、OFD 等 20+ 常见格式及更高额度。

安装方式（二选一）：

方式一：通过 Agent 或 Claw 自动安装

在 Agent 对话框直接说：

“帮我从技能市场安装 intsig-textin/xparse-parser”

如果技能市场没有，则通过 npx 安装：

npx skills add intsig-textin/xparse-skills --yes

如果 npx 也没有，可从以下仓库手动安装：

https://github.com/intsig-textin/xparse-skills
https://gitee.com/intsig-textin/xparse-skills

方式二：手动安装

从 GitHub 或 Gitee 下载 zip 文件，解压后放到 Agent 对话框，让模型使用解压后的 skill.md 文件即可。

GitHub:
https://github.com/intsig-textin/xparse-skills
Gitee:
https://gitee.com/intsig-textin/xparse-skills
ClawHub:
https://clawhub.ai/intsig-textin/xparse-parser

04 信号 | Agent 的知识编译入口

回到 Karpathy “编译”的概念。

TextIn xParse 所做的，不只是 OCR 意义上的“识别”。它更像一个知识接入过程：

把原始文档编译成 Markdown；
把混乱格式编译成结构化信息；
把非结构化资料编译成 Agent 的知识入口。

经过这一过程，PDF、Word、PPT 等原始文档成为一套可被 Agent 持续消费、反复调用、不断演化的知识资产。Agent 可基于这套资产做检索、问答、分析、报告，无论后端接入的是知识库、Wiki、RAG 还是多 Agent 协作工作流。

xParse 真正的位置，不是 OCR 的终点，而是 Agent 接入知识的起点。

此次上线是一个信号：TextIn 将把过去 19 年沉淀在企业场景中的智能文档能力，逐步转化为真正服务 Agent 生态的基础组件。对开发者而言，这意味着省去文档解析层的长期技术积累，直接获得企业级的稳定性保障。

这个开放刚刚开始。接下来，TextIn 将围绕“Agent 需要什么样的文档能力”持续迭代，不是堆砌功能，而是补齐能力。

05 预告|技术公开课

4 月下旬，TextIn 将举行线上技术公开课。

聚焦三个主题：

Skill 的安装与配置（本地 + 云端）；
典型应用场景拆解与工作流嵌入；
为每位参与者提供一份高额解析礼包。

欢迎加入交流群，公开课具体时间将在群内同步，使用中的任何问题也欢迎随时提问。

TextIn

本文所有产品性能效果和案例数据仅供参考，均不作为履约依据，具体效果请以贵司实测效果为准。

上一篇企业级文档解析：RPA处理复杂报表失败率偏高？一个API解决解析难题！

下一篇100页文档1.5秒变JSON——金融文档复杂嵌套结构如何一次对齐？

热门资讯

近期热门

重磅发布

行业干货

热门产品

热门标签

400-6666-582

免费使用

联系我们