TextIn xParse Skill上架ClawHub,免费的行业标杆级文档解析来了!

文档解析能力正在成为 Agent 生态的基础设施。近日,TextIn xParse 文档解析 Skill 正式上架 ClawHub,全面接入 OpenClaw 技能市场。开发者只需在 OpenClaw 对话框中说一句话,即可将 PDF、Word、PPT、Excel 乃至长截图等复杂文档,自动转化为干净、结构化的 Markdown 格式,为 Agent 提供高质量上下文。
即刻体验:https://clawhub.ai/intsig-textin/xparse-parser
免费可用❗每日 1000 页额度,零门槛上手。
01 瓶颈 |Agent 缺的不是思考,是高精度的上下文
Agent 正在成为新的应用范式。
OpenClaw 生态中已有上万 Skills 涌现,开发者将能力拆解为可插拔、可复用的单元,Agent 按需加载,写代码、查资料、调 API,越来越像一个能自主行动的“数字员工”。然而,当 Agent 进入企业和真实业务场景时,真正的瓶颈并非模型能力,而是缺乏高精度的上下文输入。
企业沉淀了大量非结构化资料——PDF 里的合同条款、Word 中的产品手册、Excel 里的经营数据、PPT 中的战略规划。
这些文档承载着核心信息,但 Agent 却无法直接利用:格式不统一、结构不稳定、字段不规范,对模型而言,这是一段昂贵又“读不透”的上下文。
Andrej Karpathy 曾提出 LLM.Wiki 概念,将这一过程称为“编译”——从原始文档到 Agent 可用的知识形态,中间存在一道关键缺口。

02 Skill |TextIn xParse:为 OpenClaw 补齐文档解析短板
合合信息在智能文字识别领域已有 19 年技术积累。随着开源 OCR 大模型与 Agent 生态的快速发展,TextIn 决定将企业级文档解析能力以最轻量的方式开放出来。文档解析 Skill —— TextIn xParse,正是第一个答案。
核心能力:全格式兼容与结构化还原
全格式兼容:支持 PDF、Word、Excel、PPT、图片等十余种格式输入;
结构完整还原:跨页表格、目录层级、页眉页脚、标题结构——完整保留文档骨架;
极速解析:百页文档约 1.5 秒完成,满足企业大规模批处理需求;
Markdown 输出:输出保留层级与语义的 Markdown,这是目前最受 LLM 和 Agent 欢迎的知识形态;
精确坐标回显:返回块级及字符级坐标信息,便于前端可视化展示与审核校对。
对企业级开发者和 OpenClaw 深度用户而言,商业级的稳定性、可用性和效果是产品能在生产环境中运行的保障。
所以我们把过去 19 年沉淀在企业场景里的能力,以最轻量、最友好的方式,压缩成一个 Skill,交到开发者手里。
03|一句话触发解析:与 Agent 的自然交互
无需编写代码,无需手动调用 API。
在 OpenClaw、Claude Code 等 Agent 平台安装 xparse-parser Skill 后,只需自然语言指令即可完成解析全流程。
例如:
“帮我读一下这份PDF合同,提取关键条款”
“把这个报告转成Markdown,保存到桌面”
“这份加密PDF密码是123456,帮我解析前10页”
“提取这张表格图片里的内容,输出JSON”
# 更多高阶玩法,等你探索
支持格式:
PDF、图片(jpg/png/bmp/tiff/webp),免登录免费试用,每日上限 1000 页。
更多格式与用量,配置 TextIn 账户凭证后,可解锁 Word、Excel、PPT、HTML、OFD 等 20+ 常见格式及更高额度。
安装方式(二选一):
方式一:通过 Agent 或 Claw 自动安装
在 Agent 对话框直接说:
“帮我从技能市场安装 intsig-textin/xparse-parser”
如果技能市场没有,则通过 npx 安装:
npx skills add intsig-textin/xparse-skills --yes
如果 npx 也没有,可从以下仓库手动安装:
https://github.com/intsig-textin/xparse-skills
https://gitee.com/intsig-textin/xparse-skills
方式二:手动安装
从 GitHub 或 Gitee 下载 zip 文件,解压后放到 Agent 对话框,让模型使用解压后的 skill.md 文件即可。
GitHub:
https://github.com/intsig-textin/xparse-skills
Gitee:
https://gitee.com/intsig-textin/xparse-skills
ClawHub:
https://clawhub.ai/intsig-textin/xparse-parser
04 信号 | Agent 的知识编译入口
回到 Karpathy “编译”的概念。
TextIn xParse 所做的,不只是 OCR 意义上的“识别”。它更像一个知识接入过程:
把原始文档编译成 Markdown;
把混乱格式编译成结构化信息;
把非结构化资料编译成 Agent 的知识入口。
经过这一过程,PDF、Word、PPT 等原始文档成为一套可被 Agent 持续消费、反复调用、不断演化的知识资产。Agent 可基于这套资产做检索、问答、分析、报告,无论后端接入的是知识库、Wiki、RAG 还是多 Agent 协作工作流。
xParse 真正的位置,不是 OCR 的终点,而是 Agent 接入知识的起点。
此次上线是一个信号:TextIn 将把过去 19 年沉淀在企业场景中的智能文档能力,逐步转化为真正服务 Agent 生态的基础组件。对开发者而言,这意味着省去文档解析层的长期技术积累,直接获得企业级的稳定性保障。
这个开放刚刚开始。接下来,TextIn 将围绕“Agent 需要什么样的文档能力”持续迭代,不是堆砌功能,而是补齐能力。
05 预告|技术公开课
4 月下旬,TextIn 将举行线上技术公开课。
聚焦三个主题:
Skill 的安装与配置(本地 + 云端);
典型应用场景拆解与工作流嵌入;
为每位参与者提供一份高额解析礼包。
欢迎加入交流群,公开课具体时间将在群内同步,使用中的任何问题也欢迎随时提问。

本文所有产品性能效果和案例数据仅供参考,均不作为履约依据,具体效果请以本司实测效果为准。
