<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/">
  <channel>
    <title>Llama3 on 有趣的AI</title>
    <link>http://www.wfcoding.com/tags/llama3/</link>
    <description>Recent content in Llama3 on 有趣的AI</description>
    <generator>Hugo -- 0.125.7</generator>
    <language>zh</language>
    <copyright>火云</copyright>
    <lastBuildDate>Fri, 24 Jan 2025 00:00:00 +0000</lastBuildDate>
    <atom:link href="http://www.wfcoding.com/tags/llama3/index.xml" rel="self" type="application/rss+xml" />
    <item>
      <title>[合集]本地大模型编程实战</title>
      <link>http://www.wfcoding.com/articles/practice/03%E6%9C%AC%E5%9C%B0%E5%A4%A7%E6%A8%A1%E5%9E%8B%E7%BC%96%E7%A8%8B%E5%AE%9E%E6%88%98/</link>
      <pubDate>Thu, 23 Jan 2025 00:00:00 +0000</pubDate>
      <guid>http://www.wfcoding.com/articles/practice/03%E6%9C%AC%E5%9C%B0%E5%A4%A7%E6%A8%A1%E5%9E%8B%E7%BC%96%E7%A8%8B%E5%AE%9E%E6%88%98/</guid>
      <description>&lt;p&gt;此系列文章讲述了：如何在普通电脑上自己写代码完成常见的基于大语言模型能力的任务。&lt;/p&gt;</description>
    </item>
    <item>
      <title>[合集]从零搭建langchain&#43;本地大模型&#43;本地矢量数据库的RAG系统</title>
      <link>http://www.wfcoding.com/articles/practice/01%E4%BB%8E%E9%9B%B6%E6%90%AD%E5%BB%BAlangchain&#43;%E6%9C%AC%E5%9C%B0%E5%A4%A7%E6%A8%A1%E5%9E%8B&#43;%E6%9C%AC%E5%9C%B0%E7%9F%A2%E9%87%8F%E6%95%B0%E6%8D%AE%E5%BA%93%E7%9A%84rag%E7%B3%BB%E7%BB%9F/</link>
      <pubDate>Thu, 10 Oct 2024 00:00:00 +0000</pubDate>
      <guid>http://www.wfcoding.com/articles/practice/01%E4%BB%8E%E9%9B%B6%E6%90%AD%E5%BB%BAlangchain&#43;%E6%9C%AC%E5%9C%B0%E5%A4%A7%E6%A8%A1%E5%9E%8B&#43;%E6%9C%AC%E5%9C%B0%E7%9F%A2%E9%87%8F%E6%95%B0%E6%8D%AE%E5%BA%93%E7%9A%84rag%E7%B3%BB%E7%BB%9F/</guid>
      <description>&lt;p&gt;此系列文章详细的阐述了如何从第一行代码开始搭建一个可以运行完全在本地服务器的&lt;code&gt;RAG&lt;/code&gt;(&lt;code&gt;Retrieval Augmented Generation&lt;/code&gt;)系统，包含了详细的步骤说明和代码，它是保姆级教程。&lt;br&gt;
它主要包含以下功能：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;使用本地大语言模型做语言翻译&lt;/li&gt;
&lt;li&gt;使用本地大语言模型做专业领域的知识问答&lt;/li&gt;
&lt;/ul&gt;
&lt;div style=&#34;position:relative;width:100%;height:315px;&#34;&gt;
  &lt;iframe src=&#34;assert/vuetify_langchian_rag_demo.mp4&#34; style=&#34;position:absolute;top:0;left:0;width:100%;height:100%;&#34; frameborder=&#34;0&#34; allowfullscreen&gt;&lt;/iframe&gt;
&lt;/div&gt;
&lt;p&gt;从系统架构来看，本系统包含了前端、API网关、后台服务三大部分：
&lt;img loading=&#34;lazy&#34; src=&#34;assert/arch.png&#34; alt=&#34;基本架构&#34;  /&gt;
&lt;/p&gt;</description>
    </item>
    <item>
      <title>本地大模型编程实战(01)实现翻译功能</title>
      <link>http://www.wfcoding.com/articles/practice/0301/</link>
      <pubDate>Fri, 24 Jan 2025 00:00:00 +0000</pubDate>
      <guid>http://www.wfcoding.com/articles/practice/0301/</guid>
      <description>&lt;blockquote&gt;
&lt;p&gt;大语言模型的主要功能是&lt;strong&gt;预测&lt;/strong&gt;：输入一些字符串，它预测输出另一些字符串，这个特点使它擅长翻译。&lt;/p&gt;
&lt;/blockquote&gt;
&lt;p&gt;本文描述了如何使用大语言模型(&lt;code&gt;LLM&lt;/code&gt;)实现基本的翻译功能，此翻译功能的特点是：&lt;mark&gt;无需指定源语言，只需要指定目标语言就可以进行翻译了&lt;/mark&gt;。&lt;/p&gt;</description>
    </item>
    <item>
      <title>用FastAPI做langchain本地大模型的API</title>
      <link>http://www.wfcoding.com/articles/practice/0108/</link>
      <pubDate>Tue, 05 Nov 2024 00:00:00 +0000</pubDate>
      <guid>http://www.wfcoding.com/articles/practice/0108/</guid>
      <description>&lt;p&gt;本文讲述了如何使用&lt;code&gt;FastAPI&lt;/code&gt;和&lt;code&gt;langchain&lt;/code&gt;框架，包装本地大模型&lt;code&gt;llama3.1&lt;/code&gt;，实现&lt;mark&gt;语言翻译&lt;/mark&gt;功能的API。&lt;br&gt;
相对于 &lt;code&gt;Flask&lt;/code&gt; ，使用&lt;code&gt;FastAPI&lt;/code&gt;做接口要简便得多。&lt;/p&gt;</description>
    </item>
    <item>
      <title>用Flask做langchain服务的API</title>
      <link>http://www.wfcoding.com/articles/practice/0107/</link>
      <pubDate>Sun, 03 Nov 2024 00:00:00 +0000</pubDate>
      <guid>http://www.wfcoding.com/articles/practice/0107/</guid>
      <description>&lt;p&gt;本文讲述了如何使用一个利用本地大模型&lt;code&gt;llama3.1&lt;/code&gt;实现&lt;mark&gt;语言翻译&lt;/mark&gt;功能的API。&lt;br&gt;
它用&lt;code&gt;flask&lt;/code&gt;很轻松的&lt;mark&gt;将langchian服务开放为API&lt;/mark&gt;，结合&lt;code&gt;flasgger&lt;/code&gt;&lt;mark&gt;给文档添加注释并生成playground&lt;/mark&gt;，并且使用&lt;code&gt;jsonschema&lt;/code&gt;&lt;mark&gt;做json数据校验&lt;/mark&gt;，轻松验证接口参数。&lt;br&gt;
麻雀虽小，但五脏俱全，应该对&lt;strong&gt;langchain入门者&lt;/strong&gt;有较大帮助。&lt;/p&gt;</description>
    </item>
    <item>
      <title>使用LangServe做API开放本地大模型的能力</title>
      <link>http://www.wfcoding.com/articles/practice/0106/</link>
      <pubDate>Sun, 27 Oct 2024 00:00:00 +0000</pubDate>
      <guid>http://www.wfcoding.com/articles/practice/0106/</guid>
      <description>&lt;p&gt;&lt;code&gt;LangServe&lt;/code&gt;可以轻松的将&lt;code&gt;langchain&lt;/code&gt;的能力包装为接口，为前端提供服务。本文通过一个简单的应用演示&lt;code&gt;LangServe&lt;/code&gt;如何使用。&lt;/p&gt;</description>
    </item>
    <item>
      <title>基于langchain和本地大模型以及会话式检索增强生成技术实现知识问答</title>
      <link>http://www.wfcoding.com/articles/practice/0105/</link>
      <pubDate>Thu, 10 Oct 2024 00:00:00 +0000</pubDate>
      <guid>http://www.wfcoding.com/articles/practice/0105/</guid>
      <description>&lt;p&gt;本文概述了基于langchian框架和对话式增强生成（&lt;code&gt;Conversational RAG&lt;/code&gt;(&lt;code&gt;Retrieval Augmented Generation&lt;/code&gt;)）技术实现知识问答。&lt;br&gt;
具体来说，系统&lt;mark&gt;自动记录聊天历史&lt;/mark&gt;，并把它作为上下文提供给大模型，这样它让大模型产生了“记忆”，可以“理解”和关联上下文，体验更好。&lt;br&gt;
此样例程序使用本地部署的&lt;code&gt;nomic-embed-text&lt;/code&gt;模型做嵌入检索，使用本地部署的&lt;code&gt;llama3.1&lt;/code&gt;做回答内容生成。&lt;/p&gt;</description>
    </item>
    <item>
      <title>基于langchain和本地大模型以及会话式检索增强生成技术实现知识问答</title>
      <link>http://www.wfcoding.com/articles/practice/0104/</link>
      <pubDate>Wed, 09 Oct 2024 00:00:00 +0000</pubDate>
      <guid>http://www.wfcoding.com/articles/practice/0104/</guid>
      <description>&lt;p&gt;本文讲述了基于&lt;code&gt;langchian&lt;/code&gt;框架，使用本地部署的&lt;code&gt;nomic-embed-text&lt;/code&gt;模型做嵌入检索、&lt;code&gt;llama3.1&lt;/code&gt;做回答内容生成的知识问答系统实例。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;会话式检索增强生成，即：&lt;code&gt;Conversational RAG&lt;/code&gt;。&lt;/li&gt;
&lt;li&gt;&lt;code&gt;nomic-embed-text&lt;/code&gt;：一个高性能开放嵌入模型，具有较大的标记上下文窗口。这个模型只有274M，但实际做嵌入和检索时，感觉&lt;strong&gt;比llama3好&lt;/strong&gt;。&lt;/li&gt;
&lt;/ul&gt;
&lt;blockquote&gt;
&lt;p&gt;通过对比测试使用历史聊天记录和不使用历史聊天记录两种情况，我们可以明显看出来使用历史聊天记录的优点：它让大模型产生了“记忆”，可以“理解”和关联上下文，体验更好。&lt;/p&gt;
&lt;/blockquote&gt;</description>
    </item>
    <item>
      <title>使用langchain&#43;本地lamma3.1&#43;本地chroma做RAG系统</title>
      <link>http://www.wfcoding.com/articles/practice/0103/</link>
      <pubDate>Tue, 01 Oct 2024 00:00:00 +0000</pubDate>
      <guid>http://www.wfcoding.com/articles/practice/0103/</guid>
      <description>&lt;p&gt;本文详细讲述了如何使用&lt;code&gt;langchain&lt;/code&gt;+本地&lt;code&gt;lamma3.1&lt;/code&gt;+本地&lt;code&gt;chroma&lt;/code&gt;做&lt;code&gt;RAG&lt;/code&gt;系统。&lt;/p&gt;</description>
    </item>
    <item>
      <title>在langchian中使用本地部署的llama3.1大模型</title>
      <link>http://www.wfcoding.com/articles/practice/0102%E5%9C%A8langchian%E4%B8%AD%E4%BD%BF%E7%94%A8%E6%9C%AC%E5%9C%B0%E9%83%A8%E7%BD%B2%E7%9A%84llama3%E5%A4%A7%E6%A8%A1%E5%9E%8B/</link>
      <pubDate>Tue, 01 Oct 2024 00:00:00 +0000</pubDate>
      <guid>http://www.wfcoding.com/articles/practice/0102%E5%9C%A8langchian%E4%B8%AD%E4%BD%BF%E7%94%A8%E6%9C%AC%E5%9C%B0%E9%83%A8%E7%BD%B2%E7%9A%84llama3%E5%A4%A7%E6%A8%A1%E5%9E%8B/</guid>
      <description>&lt;p&gt;本文讲述如何在&lt;code&gt;langchian&lt;/code&gt;中使用本地部署的&lt;code&gt;llama3.1&lt;/code&gt;大模型。&lt;/p&gt;</description>
    </item>
  </channel>
</rss>
