本地大模型编程实战

[合集]本地大模型编程实战

此系列文章讲述了：如何在普通电脑上自己写代码完成常见的基于大语言模型能力的任务。 ...

本地大模型编程实战(39)MCP实战演练

之前两篇文章:MCP简介和MCP能做什么阐述了MCP的基本概念和原理。本文将使用Visual Studio Code写一个MCP服务端和MCP客户端，演示MCP的基本功能。 MCP版本迭代很快，能用把代码顺利跑起来并不是一件容易的事：） ...

本地大模型编程实战(38)实现一个通用的大模型客户端

由于大部分AI平台提供的API/接口都兼容 OpenAI API ,所以我们可以使用 OpenAI SDK 实现通用的 LLM（大语言模型）客户端。关于 OpenAI API 更多内容，可参考程序员应该熟悉的概念(2)OpenAI API 本文讲述了如何实现一个简单的大模型客户端。 ...

本地大模型编程实战(37)使用知识图谱增强RAG(3)

本文将简单介绍如何使用 AutoSchemaKG 提升 RAG(Retrieval Augmented Generation,检索增强生成) 的问答效果。实现的主要思路是：解析知识图谱文件：用 NetworkX 解析 GraphML 知识图谱文件；嵌入：用 FAISS (Facebook AI Similarity Search) 矢量化节点（实体、事件、概念），并将边的 “源节点 + 关系 + 目标节点” 拼接为字符串之后再做嵌入；语义检索：检索 “源节点 + 关系 + 目标节点” 的矢量库，找出最相似的文档，再用大语言模型（LLM）对结果进一步筛选，筛选出节点；检索相似的 passage(文本段落)；将上述包含分数的结果合并，将分数作为初始权重，通过 NetworkX 的 Pagerank 方法在知识图谱中通过节点间的关联关系传播权重，权重更新后，选择权重最高的 passage(文本段落) 为结果。 PageRank 核心原理（知识图谱场景）：给节点赋予初始权重（与查询相关的节点权重高）每个节点将自身权重按 “出边数量” 平均分配给相邻节点（例如，节点 A 有 2 条出边，就将自身权重的 1/2 分别传给两个邻居）迭代传播，直到权重分布稳定（误差小于 tol），最终每个节点的 pr[node] 即为 “综合相关度分数”。通过权重传播，与查询节点间接关联的节点（例如 “苹果手机”→“苹果公司”→“芯片供应商”）也能获得较高分数，挖掘出 “字面不直接匹配但语义相关” 的内容。传统的 RAG(Retrieval Augmented Generation,检索增强生成) 一般是直接查询返回相似的 passage(文本段落)，没有上述通过知识图谱调整权重的过程。 ...

本地大模型编程实战(36)使用知识图谱增强RAG(2)生成知识图谱

本文将简单介绍如何把文本生成知识图谱（Knowledge Graph）。具体来说，是使用开源项目 AutoSchemaKG 生成 GraphML 。 GraphML 是 XML（Extensible Markup Language）格式的文件，可以使用 NetworkX 等框架轻松处理这种格式的文件。下图是一个典型的 GraphML ： ...