Llama3 on 有趣的AI

[合集]本地大模型编程实战

Thu, 23 Jan 2025 00:00:00 +0000

此系列文章讲述了：如何在普通电脑上自己写代码完成常见的基于大语言模型能力的任务。

[合集]从零搭建langchain+本地大模型+本地矢量数据库的RAG系统

Thu, 10 Oct 2024 00:00:00 +0000

此系列文章详细的阐述了如何从第一行代码开始搭建一个可以运行完全在本地服务器的RAG(Retrieval Augmented Generation)系统，包含了详细的步骤说明和代码，它是保姆级教程。
它主要包含以下功能：

使用本地大语言模型做语言翻译
使用本地大语言模型做专业领域的知识问答

从系统架构来看，本系统包含了前端、API网关、后台服务三大部分：

本地大模型编程实战(01)实现翻译功能

Fri, 24 Jan 2025 00:00:00 +0000

大语言模型的主要功能是预测：输入一些字符串，它预测输出另一些字符串，这个特点使它擅长翻译。

本文描述了如何使用大语言模型(LLM)实现基本的翻译功能，此翻译功能的特点是：无需指定源语言，只需要指定目标语言就可以进行翻译了。

用FastAPI做langchain本地大模型的API

Tue, 05 Nov 2024 00:00:00 +0000

本文讲述了如何使用FastAPI和langchain框架，包装本地大模型llama3.1，实现语言翻译功能的API。
相对于 Flask ，使用FastAPI做接口要简便得多。

用Flask做langchain服务的API

Sun, 03 Nov 2024 00:00:00 +0000

本文讲述了如何使用一个利用本地大模型llama3.1实现语言翻译功能的API。
它用flask很轻松的将langchian服务开放为API，结合flasgger给文档添加注释并生成playground，并且使用jsonschema做json数据校验，轻松验证接口参数。
麻雀虽小，但五脏俱全，应该对langchain入门者有较大帮助。

使用LangServe做API开放本地大模型的能力

Sun, 27 Oct 2024 00:00:00 +0000

LangServe可以轻松的将langchain的能力包装为接口，为前端提供服务。本文通过一个简单的应用演示LangServe如何使用。

基于langchain和本地大模型以及会话式检索增强生成技术实现知识问答

Thu, 10 Oct 2024 00:00:00 +0000

本文概述了基于langchian框架和对话式增强生成（Conversational RAG(Retrieval Augmented Generation)）技术实现知识问答。
具体来说，系统自动记录聊天历史，并把它作为上下文提供给大模型，这样它让大模型产生了“记忆”，可以“理解”和关联上下文，体验更好。
此样例程序使用本地部署的nomic-embed-text模型做嵌入检索，使用本地部署的llama3.1做回答内容生成。

基于langchain和本地大模型以及会话式检索增强生成技术实现知识问答

Wed, 09 Oct 2024 00:00:00 +0000

本文讲述了基于langchian框架，使用本地部署的nomic-embed-text模型做嵌入检索、llama3.1做回答内容生成的知识问答系统实例。

会话式检索增强生成，即：Conversational RAG。
nomic-embed-text：一个高性能开放嵌入模型，具有较大的标记上下文窗口。这个模型只有274M，但实际做嵌入和检索时，感觉比llama3好。

通过对比测试使用历史聊天记录和不使用历史聊天记录两种情况，我们可以明显看出来使用历史聊天记录的优点：它让大模型产生了“记忆”，可以“理解”和关联上下文，体验更好。

使用langchain+本地lamma3.1+本地chroma做RAG系统

Tue, 01 Oct 2024 00:00:00 +0000

本文详细讲述了如何使用langchain+本地lamma3.1+本地chroma做RAG系统。

在langchian中使用本地部署的llama3.1大模型

Tue, 01 Oct 2024 00:00:00 +0000

本文讲述如何在langchian中使用本地部署的llama3.1大模型。