功能介绍
网页抓取功能允许您从指定的网页URL中自动提取和导入内容到知识库中。该功能特别适用于:
- 产品文档导入:从产品官网、技术文档页面抓取最新信息
- 新闻资讯获取:定期抓取行业资讯、公司动态等内容
- FAQ内容收集:从现有的帮助页面、FAQ页面导入问答内容
- 竞品信息分析:抓取竞争对手的公开信息用于分析
核心特性
- 智能内容提取:自动识别网页主要内容,过滤广告、导航等无关信息
- 多格式支持:支持HTML、文本等多种网页格式
- 内容预处理:自动清理格式、优化文本结构,提升AI理解效果
- 增量更新:支持定期重新抓取,保持知识库内容时效性

适用场景
1. 官网文档同步