开发者工具

PDF 文档处理

PDF Document Processor

智能解析 PDF 文档,提取文本、表格和图片,支持能源行业报告批量处理。

PDF文档提取表格能源报告
安装命令
npx openclaw skills install pdf-processor
版本
1.0.0
作者
shuzhihui
更新于
Sat Apr 11 2026 00:00:00 GMT+0000 (Coordinated Universal Time)

功能特点

  • 保留布局的文本提取
  • 表格检测与结构化输出(CSV/Excel/JSON)
  • PDF 页面图片提取
  • 多文件批量处理
  • 能源行业报告专用模板
  • 适用场景

  • **研究团队**:从行业研究报告提取数据
  • **档案管理**:将纸质文档转为可搜索数字格式
  • **数据分析**:从金融/技术报告中提取表格
  • 安装命令

    npx openclaw skills install pdf-processor

    使用示例

    # 提取 PDF 文本

    pdf-processor extract --input report.pdf --format text

    # 提取表格到 CSV

    pdf-processor extract --input report.pdf --format table --output data.csv

    # 批量处理目录

    pdf-processor batch --input ./reports/ --format text

    # 能源报告专用提取

    pdf-processor extract --input energy-report.pdf --template energy --include charts