新闻资讯TextIn xParse Skill上架ClawHub,免费的行业标杆级文档解析来了!

TextIn xParse Skill上架ClawHub,免费的行业标杆级文档解析来了!

2026-04-13 14:23:40

TextIn

文档解析能力正在成为 Agent 生态的基础设施。近日,TextIn xParse 文档解析 Skill 正式上架 ClawHub,全面接入 OpenClaw 技能市场。开发者只需在 OpenClaw 对话框中说一句话,即可将 PDF、Word、PPT、Excel 乃至长截图等复杂文档,自动转化为干净、结构化的 Markdown 格式,为 Agent 提供高质量上下文。

即刻体验:https://clawhub.ai/intsig-textin/xparse-parser

免费可用❗每日 1000 页额度,零门槛上手。

01 瓶颈 |Agent 缺的不是思考,是高精度的上下文

Agent 正在成为新的应用范式。

OpenClaw 生态中已有上万 Skills 涌现,开发者将能力拆解为可插拔、可复用的单元,Agent 按需加载,写代码、查资料、调 API,越来越像一个能自主行动的“数字员工”。然而,当 Agent 进入企业和真实业务场景时,真正的瓶颈并非模型能力,而是缺乏高精度的上下文输入

企业沉淀了大量非结构化资料——PDF 里的合同条款、Word 中的产品手册、Excel 里的经营数据、PPT 中的战略规划。

这些文档承载着核心信息,但 Agent 却无法直接利用:格式不统一、结构不稳定、字段不规范,对模型而言,这是一段昂贵又“读不透”的上下文。

Andrej Karpathy 曾提出 LLM.Wiki 概念,将这一过程称为“编译”——从原始文档到 Agent 可用的知识形态,中间存在一道关键缺口。

TextIn

02 Skill |TextIn xParse:为 OpenClaw 补齐文档解析短板

合合信息在智能文字识别领域已有 19 年技术积累。随着开源 OCR 大模型与 Agent 生态的快速发展,TextIn 决定将企业级文档解析能力以最轻量的方式开放出来。文档解析 Skill —— TextIn xParse,正是第一个答案。

核心能力:全格式兼容与结构化还原

  • 全格式兼容:支持 PDF、Word、Excel、PPT、图片等十余种格式输入;

  • 结构完整还原:跨页表格、目录层级、页眉页脚、标题结构——完整保留文档骨架;

  • 极速解析:百页文档约 1.5 秒完成,满足企业大规模批处理需求;

  • Markdown 输出:输出保留层级与语义的 Markdown,这是目前最受 LLM 和 Agent 欢迎的知识形态;

  • 精确坐标回显:返回块级及字符级坐标信息,便于前端可视化展示与审核校对。

    TextIn

对企业级开发者和 OpenClaw 深度用户而言,商业级的稳定性、可用性和效果是产品能在生产环境中运行的保障。

所以我们把过去 19 年沉淀在企业场景里的能力,以最轻量、最友好的方式,压缩成一个 Skill,交到开发者手里。


03|一句话触发解析:与 Agent 的自然交互

无需编写代码,无需手动调用 API。

在 OpenClaw、Claude Code 等 Agent 平台安装 xparse-parser Skill 后,只需自然语言指令即可完成解析全流程。

例如:

“帮我读一下这份PDF合同,提取关键条款”
“把这个报告转成Markdown,保存到桌面”
“这份加密PDF密码是123456,帮我解析前10页”
“提取这张表格图片里的内容,输出JSON”

# 更多高阶玩法,等你探索

支持格式:

PDF、图片(jpg/png/bmp/tiff/webp),免登录免费试用,每日上限 1000 页。
更多格式与用量,配置 TextIn 账户凭证后,可解锁 Word、Excel、PPT、HTML、OFD 等 20+ 常见格式及更高额度。

安装方式(二选一):

方式一:通过 Agent 或 Claw 自动安装

在 Agent 对话框直接说:

“帮我从技能市场安装 intsig-textin/xparse-parser”

如果技能市场没有,则通过 npx 安装:

npx skills add intsig-textin/xparse-skills --yes

如果 npx 也没有,可从以下仓库手动安装:

https://github.com/intsig-textin/xparse-skills
https://gitee.com/intsig-textin/xparse-skills

方式二:手动安装

从 GitHub 或 Gitee 下载 zip 文件,解压后放到 Agent 对话框,让模型使用解压后的 skill.md 文件即可。

  • GitHub:

    https://github.com/intsig-textin/xparse-skills

  • Gitee:

    https://gitee.com/intsig-textin/xparse-skills

  • ClawHub:

    https://clawhub.ai/intsig-textin/xparse-parser

04 信号 | Agent 的知识编译入口

回到 Karpathy “编译”的概念。

TextIn xParse 所做的,不只是 OCR 意义上的“识别”。它更像一个知识接入过程:

  • 把原始文档编译成 Markdown;

  • 把混乱格式编译成结构化信息;

  • 把非结构化资料编译成 Agent 的知识入口。

经过这一过程,PDF、Word、PPT 等原始文档成为一套可被 Agent 持续消费、反复调用、不断演化的知识资产。Agent 可基于这套资产做检索、问答、分析、报告,无论后端接入的是知识库、Wiki、RAG 还是多 Agent 协作工作流。

xParse 真正的位置,不是 OCR 的终点,而是 Agent 接入知识的起点

此次上线是一个信号:TextIn 将把过去 19 年沉淀在企业场景中的智能文档能力,逐步转化为真正服务 Agent 生态的基础组件。对开发者而言,这意味着省去文档解析层的长期技术积累,直接获得企业级的稳定性保障。

这个开放刚刚开始。接下来,TextIn 将围绕“Agent 需要什么样的文档能力”持续迭代,不是堆砌功能,而是补齐能力。

05 预告|技术公开课

4 月下旬,TextIn 将举行线上技术公开课。

聚焦三个主题:

  • Skill 的安装与配置(本地 + 云端);

  • 典型应用场景拆解与工作流嵌入;

  • 为每位参与者提供一份高额解析礼包。

欢迎加入交流群,公开课具体时间将在群内同步,使用中的任何问题也欢迎随时提问。

TextIn

image

本文所有产品性能效果和案例数据仅供参考,均不作为履约依据,具体效果请以本司实测效果为准。

热门资讯

热门产品
热门标签

background
background
400-6666-582
免费使用
人工咨询
人工咨询
技术交流群
技术交流群

联系我们