硬汉嵌入式论坛

 找回密码
 立即注册
查看: 572|回复: 1
收起左侧

(灌水)word 转 Markdown 的图片问题

[复制链接]

24

主题

196

回帖

268

积分

高级会员

积分
268
QQ
发表于 2025-3-21 15:54:30 | 显示全部楼层 |阅读模式
在 AI 时代,Markdown 变得越来越重要。

我们使用 AI 通常能注意到一个事实,AI 回复的内容往往不是图文并茂的。Markdown 对图片的支持并不强大。
在使用 AI 分析论文时发现,由于 AI 不能正确识别图片中的有效信息,有些关键点他并不能正确理解。但是 AI 又有单独的图片解析功能,可能是对这种复合信息的支持不足。


过去我有一个理论 word 转各种其他格式效果都不算好,因为 word 是一种非常复杂的富文本。
那 word 、pdf 或 caj 的文档有没有办法化繁为简成 Markdown ,然后给 AI 辅助我们阅读。复杂的 word 类格式包含了太多的无效信息,而 Markdown 这种简易的标记语言在 AI 眼里非常容易解析。

试用了一下微软的 markitdown ,Markdown 转换文字的效果我认为已经可接受了,但他还是没有解决图片和公式转换的问题。
在官方 issues 有部分相关内容 LLM Integration · Issue #12 · microsoft/markitdown 是关于单图片解析的,目前还没有提及复合信息的整合方案。
一个想法是用 OCR 识别文字部分直接放到转换后的 Markdown 中,要自己做的话可能要修改 markitdown 源码。最好是微软重视 markitdown 项目,让微软的高手来好好整整这个项目,而不是像现在调包侠。

python 使用 markitdown
[Python] 纯文本查看 复制代码
from markitdown import MarkItDown

md = MarkItDown()
result = md.convert("说明书.docx")
print(result.text_content)
html_content = result.text_content
with open("output.md", "w", encoding="utf-8") as f:
    f.write(html_content)


转换后的部分md文件,共有4400行
[C] 纯文本查看 复制代码
**![](data:image/png;base64...)**

**前言**

**提示说明**

在本文中出现的提示符号,含义如下:

|  |  |
| --- | --- |
| **提示** | **含义** |
| **危险** | 表示如不及时避免,会对操作人员产生高等级的伤害。 |
| **警告** | 表示如不及时避免,会对操作人员产生中等级的伤害。 |
| **注意** | 表示如不及时避免,会对操作人员产生低等级的伤害。 |
| **提示** | 表示如不及时避免,会导致仪器损坏、性能降低等意外结果,影响操作人员使用体验。该提示下的内容不涉及人身安全。 |

**修订日志**

修订日志累积了每一版文档的更新说明。

回复

使用道具 举报

24

主题

196

回帖

268

积分

高级会员

积分
268
QQ
 楼主| 发表于 2025-3-21 15:56:21 | 显示全部楼层
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|小黑屋|Archiver|手机版|硬汉嵌入式论坛

GMT+8, 2025-6-10 22:50 , Processed in 0.221405 second(s), 23 queries .

Powered by Discuz! X3.4 Licensed

Copyright © 2001-2023, Tencent Cloud.

快速回复 返回顶部 返回列表