腾讯悄悄开源了个狠东西
最近GitHub上有个项目火了——WeKnora,腾讯出品,15.7k星。
干嘛的?简单说:你扔给它一堆文档,它帮你建一个AI知识库,直接问答。
不是那种只能搜关键词的,是真理解语义的。你问"上个月的销售策略是什么",它能从几百份文档里找到相关内容,总结后回答你。
它能干什么?
WeKnora有三个核心能力:
1. RAG问答——上传文档,直接问
把PDF、Word、Excel扔进去,它会自动解析内容,建立索引。然后你就可以像聊天一样问问题,它从你的文档里找答案。
比如你上传了100份产品手册,问"XX产品支持哪些系统版本",它能精准定位到相关段落,而不是给你一堆无关结果。
2. AI Agent——能自己想办法
遇到复杂问题,它不只是检索文档,还能:
- 调用MCP工具执行操作
- 联网搜索补充信息
- 多步骤推理,拆解复杂问题
比如你问"对比我们产品和竞品A的优劣势",它会同时检索内部文档和公开信息,给你一个综合对比。
3. 自动Wiki——文档自动变知识库
这个功能比较厉害。你扔进去一堆零散文档,它能自动:
- 提取关键信息
- 建立文档之间的关联
- 生成结构化的知识图谱
- 自动维护和更新
相当于帮你把杂乱的文档自动整理成一个wiki,而且是活的,新文档加进去会自动更新关联。
支持什么文档格式?
支持10多种格式,基本上你能想到的都支持:
| 类型 | 格式 |
|---|---|
| 文档 | PDF、Word(.docx)、TXT |
| 表格 | Excel(.xlsx)、CSV |
| 演示 | PPT(.pptx) |
| 图片 | JPG、PNG(OCR识别文字) |
| 在线文档 | 飞书、Notion、语雀(自动同步) |
特别提一下飞书/Notion/语雀自动同步——你不用手动导出上传,配置好后它会自动拉取最新内容。
怎么部署?
WeKnora支持本地部署,数据完全在你自己的服务器上,不用担心数据泄露。
最低配置
- 2核CPU
- 4GB内存
- 50GB硬盘
推荐配置
- 4核CPU
- 8GB内存
- 100GB硬盘
Docker一键部署
git clone https://github.com/Tencent/WeKnora.git
cd WeKnora
docker-compose up -d
启动后访问 http://localhost:8080 就能用。整个过程10分钟搞定。
支持哪些大模型?
WeKnora支持20+大模型,可以自由切换:
| 厂商 | 模型 | 说明 |
|---|---|---|
| OpenAI | GPT-4、GPT-3.5 | 效果最好,需要API Key |
| DeepSeek | V3、V2.5 | 国产性价比之王 |
| 阿里云 | 通义千问 | 中文理解强 |
| 智谱 | GLM-4 | 清华系,学术能力强 |
| 腾讯 | 混元 | 腾讯自家模型 |
| Gemini | 多模态能力强 | |
| Ollama | 本地模型 | 有GPU就能免费跑 |
如果你有GPU,用Ollama跑本地模型完全免费,不用担心API费用。
和Dify、FastGPT比,有什么区别?
| 特性 | WeKnora | Dify | FastGPT |
|---|---|---|---|
| 开源协议 | MIT | Apache | Apache |
| 企业级RBAC | ✅ 四级权限 | ❌ | ❌ |
| 自动Wiki | ✅ | ❌ | ❌ |
| Agent能力 | ✅ ReAct | ✅ | ❌ |
| 多租户 | ✅ | ❌ | ❌ |
| 审计日志 | ✅ | ❌ | ❌ |
| 在线文档同步 | ✅ 飞书/Notion | ❌ | ❌ |
| Langfuse观测 | ✅ | ❌ | ❌ |
简单说:
- 个人用:Dify最简单,上手快
- 团队用:FastGPT够用,轻量
- 企业用:WeKnora功能最全,权限、审计、多租户都有
适合什么场景?
1. 企业知识库
内部文档、产品手册、培训资料、规章制度……扔进去,员工直接问AI,不用翻文档。
2. 智能客服
基于产品文档训练客服机器人,回答准确率比通用AI高很多。
3. 个人知识管理
把Obsidian、Notion里的笔记同步进去,变成可问答的知识库。写文章、做研究时直接问。
4. 学习助手
课件、论文、技术文档扔进去,学习时直接问问题,比自己翻文档快10倍。
有什么坑?
说实话,目前WeKnora也有几个问题:
- 文档质量要求高——扫描版PDF识别效果一般,建议用文字版
- 首次索引慢——文档多了之后,建立索引需要时间
- 中文文档还不够完善——部分高级功能的文档是英文的
- 社区刚起步——遇到问题可能要自己看源码
但整体来说,瑕不掩瑜,是目前开源知识库方案里功能最全的。
我的建议
- 有服务器的可以试试——本地部署不花钱,比付费方案划算
- 先从小规模开始——先扔几十份文档试试效果,别一上来就全公司文档
- 文档质量很重要——垃圾进垃圾出,先把文档整理好
- 关注更新——项目还在快速迭代,新功能会越来越多
相关链接
- GitHub:https://github.com/Tencent/WeKnora
- 官网:https://weknora.weixin.qq.com
- Star数:15.7k(持续增长中)
你用过WeKnora吗?或者打算试试?评论区聊聊。