文件分析
概念
File Analyst 是一个智能文件分析助手,它通过分层架构和可扩展的转换模块,能够将包括Office文档、PDF、图片、音频在内的15余种文件格式统一转换为Markdown格式进行处理和分析。
作为一个高度模块化的工具,它不仅支持本地文件的智能识别和转换,还能通过专门的转换器处理Wikipedia、YouTube等在线内容,同时提供viewport管理和内容导航等核心功能,使得文件分析和内容获取变得简单高效。
File Analyst Agent

支持的文件类型列表
| 类别 | 转换器 | 支持的文件类型 | 说明 |
|---|---|---|---|
| 文档格式 | PlainTextConverter | .txt | 纯文本文件 |
| HtmlConverter | .html, .htm | HTML网页文件 | |
| PdfConverter | PDF文档 | ||
| DocxConverter | .docx | Word文档 | |
| XlsxConverter | .xlsx | Excel工作簿(新格式) | |
| XlsConverter | .xls | Excel工作簿(旧格式) | |
| PptxConverter | .pptx | PowerPoint演示文稿 | |
| IpynbConverter | .ipynb | Jupyter Notebook | |
| EpubConverter | .epub | 电子书格式 | |
| 媒体格式 | ImageConverter | .jpg, .jpeg, .png, .gif, .bmp | 图片文件 |
| AudioConverter | .mp3, .wav, .ogg | 音频文件 | |
| 网络内容 | RssConverter | .rss, .xml | RSS订阅源 |
| WikipediaConverter | N/A | Wikipedia页面内容 | |
| YouTubeConverter | N/A | YouTube视频内容 | |
| BingSerpConverter | N/A | Bing搜索结果页面 | |
| 特殊格式 | OutlookMsgConverter | .msg | Outlook邮件 |
| ZipConverter | .zip | 压缩文件 | |
| DocumentIntelligenceConverter | 多种格式 | AI增强的文档理解 |
注意事项:
- 某些转换器(如WikipediaConverter)不依赖于特定文件扩展名,而是处理特定类型的内容
- DocumentIntelligenceConverter可以处理多种文档格式,具体支持范围取决于配置
- 所有转换器最终都会将内容转换为Markdown格式
- 部分格式可能需要额外的系统依赖或API支持(如DocumentIntelligence需要endpoint配置)