• Privacy & Policy
  • Contact
2025-06-14 07:14:18
  • Login
  • Register
欢迎来到ClaudeAI博客社区
  • Home
  • AI教程
    • 大模型应用实践课程
      • 大型语言模型课程介绍
      • 第1-1章:使用 OpenAI 创建您的第一个聊天机器人-大模型应用实践教程
      • 第1-2章:使用 OpenAI 创建简单的自然语言到 SQL-大模型应用实践教程
    • Claude应用开发教程
      • 第1章:基本提示结构-Claude应用开发教程
      • 第 2 章:基本函数构建-Claude开发应用教程
      • 第3章:角色扮演提示-Claude应用开发教程
      • 第4章 分离数据和指令-Claude开发应用教程
      • 第 5 章:格式化输出-Claude应用开发教程
      • 第6章:预知(Thinking Step by Step)-Claude应用开发教程
    • Claude提示词教程
      • 第 1 课:基本提​​示词技术-Claude提示词工程课程
      • 第 2 课:医疗病例摘要助手[XML-JSON格式化输出]-Claude提示词工程教程
      • 第 3 课:提示工程迭代流程-Claude提示词工程课程
      • 第 4 课:客服聊天记录总结生成器-Claude提示词课程
    • Claude函数/工具调用教程
      • 第3章:使用工具调用强制 JSON结构输出[以提取维基百科页面文章为例]-Claude工具调用教程
      • 第2章:ClaudeAPI如何构建工具并调用[以计算器工具调用为例]-Claude工具调用教程
      • 第1章:工具使用/函数调用介绍和概述-Claude函数工具调用教程
    • ClaudeAPI基础入门教程
      • 第2章:构建简单的多轮聊天机器人-ClaudeAPI基础入门教程
      • 第1章:Claude SDK安装和使用-CLaudeAPI基础入门教程
      • Claude API基础知识课程简介
  • AI大模型
    • chatgpt
      • OpenAI o1-preview 简介和如何使用
      • 如何设置使用新的 ChatGPT o1 模型
      • OpenAI o1 性能评估和学习推理思维链介绍
      • OpenAI o1-mini和gpt4o性能对比介绍
      • OpenAI o1 模型与GPT-4o模型使用区别和场景
    • Claude
      • Claude的project介绍和创建
      • Claude Sonnet 3.5 API 教程
      • Claude 3 最新注册使用教程!(国内版)-性能完爆GPT4o!
      • Claude3.5 vs GPT4 谁才是最强大模型?
      • Claude国内无法登录的解决办法
      • Claude3.5 Sonnet的详细介绍
      • Claude如何写好提示词
      • Claude快速入门指南
    • Llama3
      • Llama3.2最新90b 11b 3b 1b模型介绍-AI大模型
      •  Llama Stack入门安装指南[结合Ollama]-AI大模型
      • Llama 3.2介绍最全技术报告-AI大模型
      • Llama 3.1技术报告:Meta推出最强开源大模型
      • Meta 的 Llama 3.1 405B工作原理、用例等
      • 如何在本地安装和运行 Meta Llama 3.1
      • 使用 Ollama和租用GPU 运行 Llama 3.1 405B:分步指南
      • Llama3.1 Colab 微调指南
  • AI论文
    • OpenAIo1原理解读:重复采样扩展推理计算[Large Language Monkeys: Scaling Inference Compute with Repeated Sampling]-AI论文
    • OpenIAo1原理解读:Q*强化学习与启发式搜索推理框架[Q*: Improving Multi-step Reasoning for LLMs with Deliberative Planning]-AI论文
    • OpenAIo1原理解读:基于蒙特卡罗树搜索的自我博弈互相推理[Self-play Mutual Reasoning]-AI论文
    • openAIo1原理解读:推理增加计算量提高大模型效果[Scaling LLM Test-Time Compute Optimally can be More Effective]-AI论文
    • OpenAI o1大模型原理解读:自博弈Self-play强化学习方法[A Survey on Self-play Methods in Reinforcement Learning]-AI论文
    • OpenAI o1大模型原理解读:Quiet-STaR 推理思维链[Language Models Can Teach Themselves to Think Before Speaking]-AI论文
    • OpenAI o1大模型原理论文汇总[Awesome LLM Strawberry]-AI论文
  • AI应用
    •  Crawl4AI:开源 LLM 友好型 Web 爬虫和抓取工具-AI应用
    • AI Scientist:用于全自动科学发现的写论文应用-AI应用
    • ai-data-analysis-MulitAgent:一种用于自动化复杂研究过程的先进多智能体系统-AI应用
    • Aider:最好的免费开源 AI 编码助手,自动git提交代码!-AI应用
    • AIHawk:你的 AI 求职助手,自动化申请、获得个性化推荐,更快找到您梦想的工作-AI应用
  • 加入会员社区
  • About Us
No Result
View All Result
  • Home
  • AI教程
    • 大模型应用实践课程
      • 大型语言模型课程介绍
      • 第1-1章:使用 OpenAI 创建您的第一个聊天机器人-大模型应用实践教程
      • 第1-2章:使用 OpenAI 创建简单的自然语言到 SQL-大模型应用实践教程
    • Claude应用开发教程
      • 第1章:基本提示结构-Claude应用开发教程
      • 第 2 章:基本函数构建-Claude开发应用教程
      • 第3章:角色扮演提示-Claude应用开发教程
      • 第4章 分离数据和指令-Claude开发应用教程
      • 第 5 章:格式化输出-Claude应用开发教程
      • 第6章:预知(Thinking Step by Step)-Claude应用开发教程
    • Claude提示词教程
      • 第 1 课:基本提​​示词技术-Claude提示词工程课程
      • 第 2 课:医疗病例摘要助手[XML-JSON格式化输出]-Claude提示词工程教程
      • 第 3 课:提示工程迭代流程-Claude提示词工程课程
      • 第 4 课:客服聊天记录总结生成器-Claude提示词课程
    • Claude函数/工具调用教程
      • 第3章:使用工具调用强制 JSON结构输出[以提取维基百科页面文章为例]-Claude工具调用教程
      • 第2章:ClaudeAPI如何构建工具并调用[以计算器工具调用为例]-Claude工具调用教程
      • 第1章:工具使用/函数调用介绍和概述-Claude函数工具调用教程
    • ClaudeAPI基础入门教程
      • 第2章:构建简单的多轮聊天机器人-ClaudeAPI基础入门教程
      • 第1章:Claude SDK安装和使用-CLaudeAPI基础入门教程
      • Claude API基础知识课程简介
  • AI大模型
    • chatgpt
      • OpenAI o1-preview 简介和如何使用
      • 如何设置使用新的 ChatGPT o1 模型
      • OpenAI o1 性能评估和学习推理思维链介绍
      • OpenAI o1-mini和gpt4o性能对比介绍
      • OpenAI o1 模型与GPT-4o模型使用区别和场景
    • Claude
      • Claude的project介绍和创建
      • Claude Sonnet 3.5 API 教程
      • Claude 3 最新注册使用教程!(国内版)-性能完爆GPT4o!
      • Claude3.5 vs GPT4 谁才是最强大模型?
      • Claude国内无法登录的解决办法
      • Claude3.5 Sonnet的详细介绍
      • Claude如何写好提示词
      • Claude快速入门指南
    • Llama3
      • Llama3.2最新90b 11b 3b 1b模型介绍-AI大模型
      •  Llama Stack入门安装指南[结合Ollama]-AI大模型
      • Llama 3.2介绍最全技术报告-AI大模型
      • Llama 3.1技术报告:Meta推出最强开源大模型
      • Meta 的 Llama 3.1 405B工作原理、用例等
      • 如何在本地安装和运行 Meta Llama 3.1
      • 使用 Ollama和租用GPU 运行 Llama 3.1 405B:分步指南
      • Llama3.1 Colab 微调指南
  • AI论文
    • OpenAIo1原理解读:重复采样扩展推理计算[Large Language Monkeys: Scaling Inference Compute with Repeated Sampling]-AI论文
    • OpenIAo1原理解读:Q*强化学习与启发式搜索推理框架[Q*: Improving Multi-step Reasoning for LLMs with Deliberative Planning]-AI论文
    • OpenAIo1原理解读:基于蒙特卡罗树搜索的自我博弈互相推理[Self-play Mutual Reasoning]-AI论文
    • openAIo1原理解读:推理增加计算量提高大模型效果[Scaling LLM Test-Time Compute Optimally can be More Effective]-AI论文
    • OpenAI o1大模型原理解读:自博弈Self-play强化学习方法[A Survey on Self-play Methods in Reinforcement Learning]-AI论文
    • OpenAI o1大模型原理解读:Quiet-STaR 推理思维链[Language Models Can Teach Themselves to Think Before Speaking]-AI论文
    • OpenAI o1大模型原理论文汇总[Awesome LLM Strawberry]-AI论文
  • AI应用
    •  Crawl4AI:开源 LLM 友好型 Web 爬虫和抓取工具-AI应用
    • AI Scientist:用于全自动科学发现的写论文应用-AI应用
    • ai-data-analysis-MulitAgent:一种用于自动化复杂研究过程的先进多智能体系统-AI应用
    • Aider:最好的免费开源 AI 编码助手,自动git提交代码!-AI应用
    • AIHawk:你的 AI 求职助手,自动化申请、获得个性化推荐,更快找到您梦想的工作-AI应用
  • 加入会员社区
  • About Us
No Result
View All Result
欢迎来到ClaudeAI博客社区
No Result
View All Result
Home chatgpt

OpenAI 的 GPT-4 微调:分步指南

小远 by 小远
2024-08-14
in chatgpt
0

本分步教程深入探讨了如何充分利用 GPT-4 的全部功能,并通过微调增强其在专门任务中的性能。

OpenAI 最先进的模型生成式预训练 Transformer 4 (GPT-4)于 2023 年 3 月推出,是人工智能的一次飞跃,为人工智能能力树立了新的标杆。GPT-4 可通过ChatGPT Plus、OpenAI 的 API和 Microsoft Copilot 使用,其多模态能力脱颖而出,尤其是通过GPT-4V,它能够处理文本和图像,为各个领域的创新应用铺平了道路。

GPT-4 进步的核心在于其基于 Transformer 的框架,该框架基于来自互联网和授权来源的大量数据进行了广泛的预训练,并通过人工反馈和人工智能驱动的强化学习进行了微调。这种独特的方法旨在增强模型与人类道德标准和政策合规性的一致性。

虽然 GPT-4 比其前身GPT-3有所改进,但它继承了后者的一些局限性,凸显了大型语言模型和生成式人工智能的复杂挑战。其中一些挑战可以通过称为微调的过程来解决,这正是本教程的主题。本教程的目标是:

  • 了解什么是微调以及何时使用它
  • 微调的常见用例
  • 使用 Python 逐步实现 OpenAI 的微调 API。

不过值得注意的是,GPT-4 微调目前仅处于实验阶段,符合条件的开发者可以通过微调 UI申请访问权限。话虽如此,本文涵盖的微调技术适用于所有 GPT 模型。

目录

Toggle
  • 什么是微调?
  • 何时使用微调?
  • 微调的常见用例
  • 使用 Python 对 OpenAI 的 GPT 模型进行微调的分步指南
  • 微调 OpenAI GPT 模型的 6 个步骤
    • 1.准备训练数据
    • 2. 安装 openai 库并设置 API 令牌
    • 3.上传训练文件
    • 4. 创建微调模型
    • 5.分析微调模型
    • 6. 使用微调模型
  • 结论

什么是微调?

微调是一个复杂的过程,它利用模型在不同数据集上进行初始训练时获得的大量基础知识,针对特定任务或领域优化预先训练的模型(如 GPT-4)。这涉及根据特定任务的数据调整模型的参数,增强其性能,并使其能够以更高的精度和效率处理特定应用。

微调影响的一个典型例子是增强模型对专业查询的响应。例如,当被问及为什么天空是蓝色时,预训练模型可能会提供基本的解释。通过微调,这种响应可以得到丰富,包括详细的科学背景,使其更适合教育平台等专业应用。

微调方法包括指令微调(使用展示所需响应的特定示例来训练模型)和参数高效微调(PEFT),后者仅更新模型参数的子集以节省计算资源并防止灾难性遗忘。

相比之下,检索增强生成 (RAG)代表了一种不同的方法。RAG 结合了基于检索的模型和生成模型的元素,通过在生成过程中整合从外部来源检索到的信息来提高生成内容的质量。

微调侧重于针对特定任务优化预先存在的模型,而 RAG 则整合了外部知识来丰富内容生成过程。

微调和 RAG 之间的选择取决于应用程序的具体要求,包括对最新信息的需求、可用的计算资源以及所需的任务专业化水平。微调提供了一种直接的方法,可以利用预先训练的模型的庞大知识库来完成特定任务,而 RAG 提供了一种动态方法来确保模型使用的信息的相关性和准确性。

何时使用微调?

对 OpenAI 的文本生成模型进行微调是一种有效的方法,可以根据特定需求对其进行定制,但需要大量时间和资源。在进行微调之前,建议尝试通过提示工程、提示链(将复杂任务划分为更简单、更连续的提示)和利用函数来最大化模型的性能。建议采用这种方法的原因如下:

  • 模型最初可能会在某些任务上遇到困难,但制定正确的提示可以显著改善结果,在许多情况下不需要进行微调。
  • 调整提示并采用提示链或函数调用等策略可以提供即时反馈,从而实现快速迭代。相比之下,微调涉及创建数据集和训练模型,这需要更多时间。
  • 即使微调必不可少,但通过提示工程所做的前期工作也不会白费。将精心设计的提示纳入微调过程或将其与微调技术相结合通常可以产生最佳效果。

微调的常见用例

微调在以下场景中尤其有益:

  • 自定义输出特性。当你需要模型遵循特定的风格、语气、格式或其他定性方面时,微调可以帮助相应地塑造其响应。
  • 提高可靠性。对于模型始终如一地产生所需输出类型的应用来说,微调可以提高其可靠性。
  • 处理复杂提示。如果模型无法遵循复杂的指令,微调可以帮助它更有效地理解和执行此类提示。
  • 管理边缘情况。微调可以使模型以特定的、预定的方式处理大量边缘情况,从而增强其多功能性。
  • 学习新技能或任务。当向模型引入难以在提示中概括的新技能或任务时,微调可以为其配备必要的能力。

使用 Python 对 OpenAI 的 GPT 模型进行微调的分步指南

由于 OpenAI 模型的专有性,如果您想微调任何 OpenAI 模型,则必须使用 OpenAI 的微调 API。此过程涉及将您的数据上传到 OpenAI 的服务器以训练模型。

目前仅支持以下模型通过API进行微调。

  • GPT-3.5-Turbo-0125,
  • GPT-3.5-Turbo-1106,
  • GPT-3.5-Turbo-0613,
  • 巴贝奇-002,
  • 达芬奇-002

GPT-4 微调目前处于实验性访问阶段,符合条件的开发者可以通过微调 UI请求访问。无论使用哪种模型,微调的过程和本教程中的代码都不会改变。

微调 OpenAI GPT 模型的 6 个步骤

1.准备训练数据

这是最重要的一步。微调模型的质量直接取决于您为微调模型而创建的数据。对于 OpenAI API,数据必须以jsonl格式存储。

JSONL 格式是一种文本格式,其中每一行都是一个单独的 JSON 对象,因此适合逐行处理大型数据集。此格式对于处理可以轻松划分为单个记录而不会丢失结构的数据特别有用。

例子:

{"prompt": "<prompt text>", "completion": "<ideal generated text>"}

{"prompt": "<prompt text>", "completion": "<ideal generated text>"}

{"prompt": "<prompt text>", "completion": "<ideal generated text>"}

在本教程中,我仅创建了五个示例的示例数据。数据包括有关机器学习中各种主题的问题和莎士比亚风格的答案。

我为本教程创建的示例数据:

{"messages": [{"role": "system", "content": "You are teaching assistant for Machine Learning. You should help to user to answer on his question."}, {"role": "user", "content": "What is machine learning?"}, {"role": "assistant", "content": "'Tis but the art of teaching machines to think, to learn from data most fine, and decisions to link."}]}

{"messages": [{"role": "system", "content": "You are teaching assistant for Machine Learning. You should help to user to answer on his question."}, {"role": "user", "content": "How doth neural networks work?"}, {"role": "assistant", "content": "They're like the brains of yon digital beast, with layers many, and nodes that cease."}]}

2. 安装 openai 库并设置 API 令牌

使用 OpenAI API 创建微调作业的第一步是上传文件。要使用此 API,您必须openai安装 Python 库。

!pip install openai

现在登录您的 platform.openai.com 帐户并生成 API 令牌:

创建新密钥OpenAI平台的截图

然后您可以使用该库将令牌设置为环境变量os。

import os


# Set the OPENAI_API_KEY environment variable
os.environ['OPENAI_API_KEY'] = '...'

3.上传训练文件

您的训练文件必须是jsonl格式。上传文件后,处理可能需要一段时间。文件上传的最大大小为 1 GB。要在 OpenAI 服务器上上传文件:

from openai import OpenAI
client = OpenAI()


client.files.create(
file=open("train.jsonl", "rb"),
purpose="fine-tune"
)

输出:

FileObject(id='file-rIua39sJX1O64gzxTYfpvJx7', bytes=11165, created_at=1709499930, filename='train.jsonl', object='file', purpose='fine-tune', status='processed', status_details=None)

4. 创建微调模型

确保文件已成功上传后,下一步是创建微调作业。training_file是将训练文件上传到 OpenAI API 时返回的文件 ID。要启动微调作业:

from openai import OpenAI
client = OpenAI()


client.fine_tuning.jobs.create(
training_file="file-rIua39sJX1O64gzxTYfpvJx7",
model="gpt-3.5-turbo" #change to gpt-4-0613 if you have access
)

要配置额外的微调设置,例如validation_file或超参数,请查看有关微调的 API 文档。

微调作业的完成时间各不相同,从几分钟到几小时不等,具体取决于模型和数据集的大小。例如,我们的 train.jsonl 数据集中只有 50 个示例,使用 gpt-3.5-turbo 模型,该作业仅用 7 分钟就完成了。

一旦工作完成,还会发送一封电子邮件确认。

除了设置微调作业之外,您还可以选择查看当前作业列表、检查特定作业的状态或取消作业。

from openai import OpenAI
client = OpenAI()


# List 10 fine-tuning jobs
client.fine_tuning.jobs.list(limit=10)


# Retrieve the state of a fine-tune
client.fine_tuning.jobs.retrieve("...")


# Cancel a job
client.fine_tuning.jobs.cancel("...")


# List up to 10 events from a fine-tuning job
client.fine_tuning.jobs.list_events(fine_tuning_job_id="...", limit=10)


# Delete a fine-tuned model (must be an owner of the org the model was created in)
client.models.delete("ft:gpt-3.5-turbo:xxx:xxx")

5.分析微调模型

OpenAI 提供关键的训练指标,例如训练损失、训练的 token 准确率、测试损失和测试 token 准确率。这些指标有助于确保训练按预期进行,损失减少,token 准确率提高。您可以在活动微调作业期间在事件对象中查看这些有用的指标。

{
"object": "fine_tuning.job.event",
"id": "ftjob-Na7BnF5y91wwGJ4EgxtzVyDD",
"created_at": 1693582679,
"level": "info",
"message": "Step 100/100: training loss=0.00",
"data": {
"step": 100,
"train_loss": 1.805623287509661e-5,
"train_mean_token_accuracy": 1.0
},
"type": "metrics"
}

您也可以在 UI 上看到此信息。

OpenAI 平台微调 UI 的屏幕截图

6. 使用微调模型

成功完成作业后,作业详细信息将包含fine_tuned_model显示模型名称的字段。您可以对此模型进行 API 调用,并从我们刚刚调整的模型获取响应。

from openai import OpenAI
client = OpenAI()


completion = client.chat.completions.create(
model="ft:gpt-3.5-turbo-0613:personal::8k01tfYd",
messages=[
{"role": "system", "content": "You are a teaching assistant for Machine Learning. You should help to user to answer on his question."},
{"role": "user", "content": "What is a loss function?"}
]
)
print(completion.choices[0].message)

输出:

ChatCompletionMessage(content="To measure how far we falter, it guides our way, our hope's defaulter.", role='assistant', function_call=None, tool_calls=None)

结论

本教程指导您完成 OpenAI 的 GPT 模型微调过程,这是利用 LLM 的强大功能开发专业领域应用的高级步骤。微调使我们能够优化语言模型的响应,使其更擅长以更高的精度和效率处理特定任务、风格或领域。

本教程使用 OpenAI Python API 对模型进行微调。如果您更愿意学习如何通过 UI 执行相同操作而无需编写一行代码,则可以查看Datacamp 上的“如何微调 GPT 3.5”教程。

由于 GPT 不是开源模型,因此微调过程相当简单,只需进行 API 调用即可。这与微调 llama-2、Mistral、Stable transmission 等开源模型的情况非常不同。如果您有兴趣了解如何微调各种开源模型,

Previous Post

Claude Sonnet 3.5 API 教程

Next Post

OpenAI下一代大模型GPT-5预测

小远

小远

大家好,我是小远,毕业于华南理工大学。作为一名AI算法工程师,我创立了个人博客,旨在成为连接AI技术前沿与广大爱好者的桥梁。宗旨是:记录并分享关于AI大模型的最新知识、研究成果及行业动态,致力于普及AI知识,降低技术门槛,让更多人能够了解并参与到这场科技革命中来。

Related Posts

MiniMind 3小时完全从0训练26M的小参数GPT,个人显卡即可推理训练!-AI应用
AI应用

MiniMind 3小时完全从0训练26M的小参数GPT,个人显卡即可推理训练!-AI应用

2024-10-17
OpenAI Swarm是什么和使用用例
chatgpt

OpenAI Swarm是什么和使用用例

2024-10-15
第3章:使用工具调用强制 JSON结构输出[以提取维基百科页面文章为例]-Claude工具调用教程
chatgpt

OpenAI o1 指南:工作原理、用例、API 等

2024-09-19
Load More
Next Post
OpenAI 的 GPT-4o 是什么?发布日期、工作原理、用例等

OpenAI下一代大模型GPT-5预测

Please login to join discussion
Do NOT Think That Much for 2+3=? On the Overthinking of o1-Like LLMs[不要过度思考2+3等于几 在类LLM的过度思考上]-AI论文
claude

Do NOT Think That Much for 2+3=? On the Overthinking of o1-Like LLMs[不要过度思考2+3等于几 在类LLM的过度思考上]-AI论文

by 小远
2025-01-12
0

图1:在图(a)中过度思考问题的示意图:...

Read more
Slow Perception: Let’s Perceive Geometric Figures Step-by-step[缓慢感知:让我们逐步感知几何图形]-AI论文
AI论文

Slow Perception: Let’s Perceive Geometric Figures Step-by-step[缓慢感知:让我们逐步感知几何图形]-AI论文

by 小远
2025-01-12
0

摘要 近期,“视觉感知”开始进入人们的视...

Read more
Ensembling Large Language Models with Process Reward-Guided Tree Search for Better Complex Reasoning[结合大型语言模型与过程奖励引导的树搜索以提升复杂推理能力]-AI论文
claude

Ensembling Large Language Models with Process Reward-Guided Tree Search for Better Complex Reasoning[结合大型语言模型与过程奖励引导的树搜索以提升复杂推理能力]-AI论文

by 小远
2025-01-12
0

摘要 尽管大型语言模型近期取得了显著进展...

Read more
Large Concept Models:Language Modeling in a Sentence Representation Space[大型概念模型:在句子表示空间中的语言建模]-AI论文
AI论文

Large Concept Models:Language Modeling in a Sentence Representation Space[大型概念模型:在句子表示空间中的语言建模]-AI论文

by 小远
2025-01-06
0

大型语言模型(LLMs)已经彻底改变了人...

Read more

Claude大模型学习社区

希望成为中国第一个大模型教程和AI论文的分享乐园!帮助每一位同学快速上入门大模型!

分类

  • AIRAG
  • AI应用
  • AI提示库
  • AI论文
  • artifacts
  • chatgpt
  • claude
  • claude教程
  • Cursor
  • gemini
  • llama
  • ollama
  • openAIo1
  • prompt工程
  • 文心一言

标签

Agent Agents AI工具 AI应用 AI提示库 AI论文 API chatgpt claude Claude3.5 Sonnet COT css Cursor CursorAI ernie html IDE Llama 3 llama3.1 llama3.2 LLM meta o1 o1-preview ollama OpenAI openAIo1 OpenAI o1 openAIo1原理 prompt rag Reasoning Swarm web 函数构建 原理解读 合成数据 多智能体 大模型 强化学习 思维链 接码平台 提示词 智能体 检索增强
  • Home
  • AI教程
  • AI大模型
  • AI论文
  • AI应用
  • 加入会员社区
  • About Us

© 2024 ClaudeAI大模型学习社区 所有属于ICP备案:豫ICP备2024068873号-1号.

No Result
View All Result
  • Home
  • AI教程
    • 大模型应用实践课程
      • 大型语言模型课程介绍
      • 第1-1章:使用 OpenAI 创建您的第一个聊天机器人-大模型应用实践教程
      • 第1-2章:使用 OpenAI 创建简单的自然语言到 SQL-大模型应用实践教程
    • Claude应用开发教程
      • 第1章:基本提示结构-Claude应用开发教程
      • 第 2 章:基本函数构建-Claude开发应用教程
      • 第3章:角色扮演提示-Claude应用开发教程
      • 第4章 分离数据和指令-Claude开发应用教程
      • 第 5 章:格式化输出-Claude应用开发教程
      • 第6章:预知(Thinking Step by Step)-Claude应用开发教程
    • Claude提示词教程
      • 第 1 课:基本提​​示词技术-Claude提示词工程课程
      • 第 2 课:医疗病例摘要助手[XML-JSON格式化输出]-Claude提示词工程教程
      • 第 3 课:提示工程迭代流程-Claude提示词工程课程
      • 第 4 课:客服聊天记录总结生成器-Claude提示词课程
    • Claude函数/工具调用教程
      • 第3章:使用工具调用强制 JSON结构输出[以提取维基百科页面文章为例]-Claude工具调用教程
      • 第2章:ClaudeAPI如何构建工具并调用[以计算器工具调用为例]-Claude工具调用教程
      • 第1章:工具使用/函数调用介绍和概述-Claude函数工具调用教程
    • ClaudeAPI基础入门教程
      • 第2章:构建简单的多轮聊天机器人-ClaudeAPI基础入门教程
      • 第1章:Claude SDK安装和使用-CLaudeAPI基础入门教程
      • Claude API基础知识课程简介
  • AI大模型
    • chatgpt
      • OpenAI o1-preview 简介和如何使用
      • 如何设置使用新的 ChatGPT o1 模型
      • OpenAI o1 性能评估和学习推理思维链介绍
      • OpenAI o1-mini和gpt4o性能对比介绍
      • OpenAI o1 模型与GPT-4o模型使用区别和场景
    • Claude
      • Claude的project介绍和创建
      • Claude Sonnet 3.5 API 教程
      • Claude 3 最新注册使用教程!(国内版)-性能完爆GPT4o!
      • Claude3.5 vs GPT4 谁才是最强大模型?
      • Claude国内无法登录的解决办法
      • Claude3.5 Sonnet的详细介绍
      • Claude如何写好提示词
      • Claude快速入门指南
    • Llama3
      • Llama3.2最新90b 11b 3b 1b模型介绍-AI大模型
      •  Llama Stack入门安装指南[结合Ollama]-AI大模型
      • Llama 3.2介绍最全技术报告-AI大模型
      • Llama 3.1技术报告:Meta推出最强开源大模型
      • Meta 的 Llama 3.1 405B工作原理、用例等
      • 如何在本地安装和运行 Meta Llama 3.1
      • 使用 Ollama和租用GPU 运行 Llama 3.1 405B:分步指南
      • Llama3.1 Colab 微调指南
  • AI论文
    • OpenAIo1原理解读:重复采样扩展推理计算[Large Language Monkeys: Scaling Inference Compute with Repeated Sampling]-AI论文
    • OpenIAo1原理解读:Q*强化学习与启发式搜索推理框架[Q*: Improving Multi-step Reasoning for LLMs with Deliberative Planning]-AI论文
    • OpenAIo1原理解读:基于蒙特卡罗树搜索的自我博弈互相推理[Self-play Mutual Reasoning]-AI论文
    • openAIo1原理解读:推理增加计算量提高大模型效果[Scaling LLM Test-Time Compute Optimally can be More Effective]-AI论文
    • OpenAI o1大模型原理解读:自博弈Self-play强化学习方法[A Survey on Self-play Methods in Reinforcement Learning]-AI论文
    • OpenAI o1大模型原理解读:Quiet-STaR 推理思维链[Language Models Can Teach Themselves to Think Before Speaking]-AI论文
    • OpenAI o1大模型原理论文汇总[Awesome LLM Strawberry]-AI论文
  • AI应用
    •  Crawl4AI:开源 LLM 友好型 Web 爬虫和抓取工具-AI应用
    • AI Scientist:用于全自动科学发现的写论文应用-AI应用
    • ai-data-analysis-MulitAgent:一种用于自动化复杂研究过程的先进多智能体系统-AI应用
    • Aider:最好的免费开源 AI 编码助手,自动git提交代码!-AI应用
    • AIHawk:你的 AI 求职助手,自动化申请、获得个性化推荐,更快找到您梦想的工作-AI应用
  • 加入会员社区
  • About Us

© 2024 ClaudeAI大模型学习社区 所有属于ICP备案:豫ICP备2024068873号-1号.

Welcome Back!

Login to your account below

Forgotten Password? Sign Up

Create New Account!

Fill the forms below to register

All fields are required. Log In

Retrieve your password

Please enter your username or email address to reset your password.

Log In