大多数 RAG 系统在索引时丢弃图片,仅以文本作答。CVS 端到端保留视觉内容,并从源头返回真实的表格、示意图、图表或公式,附带精确引用。
CVS 摄入企业文档的完整谱系:PDF、扫描版 PDF、DOCX、PPTX、XLSX、HTML、TXT/Markdown、图片、表格和示意图。三阶段 OCR 结合视觉富化,甚至能读取质量低下的扫描件和手写的页边批注,让遗留档案从沉重的累赘变成可检索的证据。
处理过程具备结构感知能力。表格被抽取为结构化数据,图片被索引以供检索,公式被渲染,代码块被原样保留。用户所需的格式以其原生形态返回——而不会在索引过程中被压平成有损的文字。
一个 CVS 答案可以携带六种证据:照片和图片、来自 PDF 与 Excel 的表格、示意图和工程图纸、图表、扫描件和手写内容,以及 Mermaid 或 LaTeX。当一位工程师询问某个压力等级时,他看到的是原始的规格表格——而非语言模型对它的复述。
每个答案的收尾方式都相同:一个问题被解析为行内证据——一张图片、一个渲染的表格或一道排版好的公式——随后附上一条回溯到源头的精确引用。答案格式与问题的诉求相匹配,并提供您可以验证而非凭信任接受的来源溯源。