• Privacy & Policy
  • Contact
2025-05-21 02:34:41
  • Login
  • Register
欢迎来到ClaudeAI博客社区
  • Home
  • AI教程
    • 大模型应用实践课程
      • 大型语言模型课程介绍
      • 第1-1章:使用 OpenAI 创建您的第一个聊天机器人-大模型应用实践教程
      • 第1-2章:使用 OpenAI 创建简单的自然语言到 SQL-大模型应用实践教程
    • Claude应用开发教程
      • 第1章:基本提示结构-Claude应用开发教程
      • 第 2 章:基本函数构建-Claude开发应用教程
      • 第3章:角色扮演提示-Claude应用开发教程
      • 第4章 分离数据和指令-Claude开发应用教程
      • 第 5 章:格式化输出-Claude应用开发教程
      • 第6章:预知(Thinking Step by Step)-Claude应用开发教程
    • Claude提示词教程
      • 第 1 课:基本提​​示词技术-Claude提示词工程课程
      • 第 2 课:医疗病例摘要助手[XML-JSON格式化输出]-Claude提示词工程教程
      • 第 3 课:提示工程迭代流程-Claude提示词工程课程
      • 第 4 课:客服聊天记录总结生成器-Claude提示词课程
    • Claude函数/工具调用教程
      • 第3章:使用工具调用强制 JSON结构输出[以提取维基百科页面文章为例]-Claude工具调用教程
      • 第2章:ClaudeAPI如何构建工具并调用[以计算器工具调用为例]-Claude工具调用教程
      • 第1章:工具使用/函数调用介绍和概述-Claude函数工具调用教程
    • ClaudeAPI基础入门教程
      • 第2章:构建简单的多轮聊天机器人-ClaudeAPI基础入门教程
      • 第1章:Claude SDK安装和使用-CLaudeAPI基础入门教程
      • Claude API基础知识课程简介
  • AI大模型
    • chatgpt
      • OpenAI o1-preview 简介和如何使用
      • 如何设置使用新的 ChatGPT o1 模型
      • OpenAI o1 性能评估和学习推理思维链介绍
      • OpenAI o1-mini和gpt4o性能对比介绍
      • OpenAI o1 模型与GPT-4o模型使用区别和场景
    • Claude
      • Claude的project介绍和创建
      • Claude Sonnet 3.5 API 教程
      • Claude 3 最新注册使用教程!(国内版)-性能完爆GPT4o!
      • Claude3.5 vs GPT4 谁才是最强大模型?
      • Claude国内无法登录的解决办法
      • Claude3.5 Sonnet的详细介绍
      • Claude如何写好提示词
      • Claude快速入门指南
    • Llama3
      • Llama3.2最新90b 11b 3b 1b模型介绍-AI大模型
      •  Llama Stack入门安装指南[结合Ollama]-AI大模型
      • Llama 3.2介绍最全技术报告-AI大模型
      • Llama 3.1技术报告:Meta推出最强开源大模型
      • Meta 的 Llama 3.1 405B工作原理、用例等
      • 如何在本地安装和运行 Meta Llama 3.1
      • 使用 Ollama和租用GPU 运行 Llama 3.1 405B:分步指南
      • Llama3.1 Colab 微调指南
  • AI论文
    • OpenAIo1原理解读:重复采样扩展推理计算[Large Language Monkeys: Scaling Inference Compute with Repeated Sampling]-AI论文
    • OpenIAo1原理解读:Q*强化学习与启发式搜索推理框架[Q*: Improving Multi-step Reasoning for LLMs with Deliberative Planning]-AI论文
    • OpenAIo1原理解读:基于蒙特卡罗树搜索的自我博弈互相推理[Self-play Mutual Reasoning]-AI论文
    • openAIo1原理解读:推理增加计算量提高大模型效果[Scaling LLM Test-Time Compute Optimally can be More Effective]-AI论文
    • OpenAI o1大模型原理解读:自博弈Self-play强化学习方法[A Survey on Self-play Methods in Reinforcement Learning]-AI论文
    • OpenAI o1大模型原理解读:Quiet-STaR 推理思维链[Language Models Can Teach Themselves to Think Before Speaking]-AI论文
    • OpenAI o1大模型原理论文汇总[Awesome LLM Strawberry]-AI论文
  • AI应用
    •  Crawl4AI:开源 LLM 友好型 Web 爬虫和抓取工具-AI应用
    • AI Scientist:用于全自动科学发现的写论文应用-AI应用
    • ai-data-analysis-MulitAgent:一种用于自动化复杂研究过程的先进多智能体系统-AI应用
    • Aider:最好的免费开源 AI 编码助手,自动git提交代码!-AI应用
    • AIHawk:你的 AI 求职助手,自动化申请、获得个性化推荐,更快找到您梦想的工作-AI应用
  • 加入会员社区
  • About Us
No Result
View All Result
  • Home
  • AI教程
    • 大模型应用实践课程
      • 大型语言模型课程介绍
      • 第1-1章:使用 OpenAI 创建您的第一个聊天机器人-大模型应用实践教程
      • 第1-2章:使用 OpenAI 创建简单的自然语言到 SQL-大模型应用实践教程
    • Claude应用开发教程
      • 第1章:基本提示结构-Claude应用开发教程
      • 第 2 章:基本函数构建-Claude开发应用教程
      • 第3章:角色扮演提示-Claude应用开发教程
      • 第4章 分离数据和指令-Claude开发应用教程
      • 第 5 章:格式化输出-Claude应用开发教程
      • 第6章:预知(Thinking Step by Step)-Claude应用开发教程
    • Claude提示词教程
      • 第 1 课:基本提​​示词技术-Claude提示词工程课程
      • 第 2 课:医疗病例摘要助手[XML-JSON格式化输出]-Claude提示词工程教程
      • 第 3 课:提示工程迭代流程-Claude提示词工程课程
      • 第 4 课:客服聊天记录总结生成器-Claude提示词课程
    • Claude函数/工具调用教程
      • 第3章:使用工具调用强制 JSON结构输出[以提取维基百科页面文章为例]-Claude工具调用教程
      • 第2章:ClaudeAPI如何构建工具并调用[以计算器工具调用为例]-Claude工具调用教程
      • 第1章:工具使用/函数调用介绍和概述-Claude函数工具调用教程
    • ClaudeAPI基础入门教程
      • 第2章:构建简单的多轮聊天机器人-ClaudeAPI基础入门教程
      • 第1章:Claude SDK安装和使用-CLaudeAPI基础入门教程
      • Claude API基础知识课程简介
  • AI大模型
    • chatgpt
      • OpenAI o1-preview 简介和如何使用
      • 如何设置使用新的 ChatGPT o1 模型
      • OpenAI o1 性能评估和学习推理思维链介绍
      • OpenAI o1-mini和gpt4o性能对比介绍
      • OpenAI o1 模型与GPT-4o模型使用区别和场景
    • Claude
      • Claude的project介绍和创建
      • Claude Sonnet 3.5 API 教程
      • Claude 3 最新注册使用教程!(国内版)-性能完爆GPT4o!
      • Claude3.5 vs GPT4 谁才是最强大模型?
      • Claude国内无法登录的解决办法
      • Claude3.5 Sonnet的详细介绍
      • Claude如何写好提示词
      • Claude快速入门指南
    • Llama3
      • Llama3.2最新90b 11b 3b 1b模型介绍-AI大模型
      •  Llama Stack入门安装指南[结合Ollama]-AI大模型
      • Llama 3.2介绍最全技术报告-AI大模型
      • Llama 3.1技术报告:Meta推出最强开源大模型
      • Meta 的 Llama 3.1 405B工作原理、用例等
      • 如何在本地安装和运行 Meta Llama 3.1
      • 使用 Ollama和租用GPU 运行 Llama 3.1 405B:分步指南
      • Llama3.1 Colab 微调指南
  • AI论文
    • OpenAIo1原理解读:重复采样扩展推理计算[Large Language Monkeys: Scaling Inference Compute with Repeated Sampling]-AI论文
    • OpenIAo1原理解读:Q*强化学习与启发式搜索推理框架[Q*: Improving Multi-step Reasoning for LLMs with Deliberative Planning]-AI论文
    • OpenAIo1原理解读:基于蒙特卡罗树搜索的自我博弈互相推理[Self-play Mutual Reasoning]-AI论文
    • openAIo1原理解读:推理增加计算量提高大模型效果[Scaling LLM Test-Time Compute Optimally can be More Effective]-AI论文
    • OpenAI o1大模型原理解读:自博弈Self-play强化学习方法[A Survey on Self-play Methods in Reinforcement Learning]-AI论文
    • OpenAI o1大模型原理解读:Quiet-STaR 推理思维链[Language Models Can Teach Themselves to Think Before Speaking]-AI论文
    • OpenAI o1大模型原理论文汇总[Awesome LLM Strawberry]-AI论文
  • AI应用
    •  Crawl4AI:开源 LLM 友好型 Web 爬虫和抓取工具-AI应用
    • AI Scientist:用于全自动科学发现的写论文应用-AI应用
    • ai-data-analysis-MulitAgent:一种用于自动化复杂研究过程的先进多智能体系统-AI应用
    • Aider:最好的免费开源 AI 编码助手,自动git提交代码!-AI应用
    • AIHawk:你的 AI 求职助手,自动化申请、获得个性化推荐,更快找到您梦想的工作-AI应用
  • 加入会员社区
  • About Us
No Result
View All Result
欢迎来到ClaudeAI博客社区
No Result
View All Result
Home chatgpt

什么是 GPT-4o Mini?其工作原理、用例、API 等

小远 by 小远
2024-08-08
in chatgpt
0

OpenAI 发布了 GPT-4o mini,这是功能强大的GPT-4o的更易于使用版本。这款新型号旨在平衡性能与成本效益,满足企业和开发人员希望以更低的价格获得强大的 AI 解决方案的需求。

2024 年,围绕人工智能的叙述似乎正在从更大、更好的模型转向更具成本效益的选择,尤其是对于 B2B 应用而言。从基于云的人工智能转向本地人工智能,使得较小的模型变得更加重要。

到目前为止,自 GPT-3.5 以来,OpenAI 一直缺乏该领域的有力候选人。GPT-4o mini 改变了这一现状,它使强大的 AI 变得易于访问且价格合理,可以集成到每个应用程序和网站中。

在本文中,我们将探讨 GPT-4o mini 的主要功能、它与其他类似 LLM 的比较以及此次发布对 AI 发展的意义。

目录

Toggle
  • OpenAI 基础知识
  • 什么是 GPT-4o Mini?
    • 主要特征
    • GPT-4o 迷你竞赛
  • GPT-4o Mini 的工作原理:蒸馏机制
  • GPT-4o 迷你性能
    • 推理任务
    • 数学和编码能力
    • 多模态推理
  • GPT-4o Mini 的用例
  • 访问 GPT-4o Mini
  • 结论

OpenAI 基础知识

开始使用 OpenAI API 及更多功能!

现在开始

什么是 GPT-4o Mini?

GPT-4o mini 是通过提炼过程从较大的 GPT-4o 模型衍生而来的。这个过程涉及训练较小的模型来模仿较大、更复杂的模型的行为和性能,从而产生具有成本效益但功能强大的原始版本。

主要特征

  • 大上下文窗口:GPT-4o mini 保留了 GPT-4o 的 128k 令牌上下文窗口,使其能够有效处理长文本。这对于需要大量上下文的应用程序(例如分析大型文档或维护对话历史记录)来说是理想的选择。
  • 多模态功能:该模型可处理文本和图像输入,未来计划支持视频和音频输入和输出。这种多功能性使其适用于从文本分析到图像识别的各种应用。
  • 降低成本:GPT-4o mini 比其前代产品便宜得多。它每百万输入代币的成本为 0.15 美元,每百万输出代币的成本为 0.60 美元,比 GPT-4o 型号便宜得多,后者的价格为每百万输入代币 5.00 美元,每百万输出代币 15.00 美元。与 GPT-3.5 Turbo 相比,GPT-4o mini 便宜了 60% 以上。
  • 安全性增强:该模型包含与 GPT-4o 相同的安全特性,并在 API 中首次采用指令层次结构方法。这提高了其对越狱、提示注入和系统提示提取的抵抗力,使其在各种应用中使用更安全。

GPT-4o 迷你竞赛

GPT-4o mini 与Llama 3 8B、Gemini 1.5 Flash 和 Claude Haiku 等模型以及 OpenAI 自己的 GPT-3.5 Turbo 竞争。这些模型提供类似的功能,但通常成本较高或性能指标较低。

  • Gemini 1.5 Flash :虽然Gemini 1.5 Flash的输出速度略高,但GPT-4o mini的质量更胜一筹,对于同时需要速度和高精度的应用来说,它是一个更均衡的选择。
  • Claude 3 Haiku 和 Llama 3 (8B) :GPT-4o mini 在质量和输出速度方面均优于这些型号,展示了其效率和有效性。
  • GPT-3.5 Turbo :GPT-4o mini 在输出速度和整体质量方面优于 GPT-3.5 Turbo,并提供 GPT-3.5 Turbo 所缺乏的视觉功能。
GPT-4O迷你比赛

来源:人工分析

GPT-4o Mini 的工作原理:蒸馏机制

GPT-4o mini 通过一种称为模型蒸馏的过程实现了性能和效率的平衡。本质上,这涉及训练一个更小、更精简的模型(“学生”)来模仿更大、更复杂的模型(“老师”)的行为和知识。

在本例中,更大的模型 GPT-4o 已在大量数据上进行了预训练,并且对语言模式、语义甚至推理能力具有深刻的理解。然而,其庞大的规模使其计算成本高昂,不太适合某些应用。

模型蒸馏通过将较大的 GPT-4o 模型的知识和功能转移到较小的 GPT-4o mini 来解决此问题。这通常是通过让较小的模型学习在多样化的输入数据集上预测较大模型的输出来实现的。通过这个过程,GPT-4o mini 有效地从其较大的模型中“提炼”出最重要的知识和技能。

解释蒸馏过程的图表

最终,该模型虽然更小、更高效,但保留了原始模型的大部分性能和功能。GPT-4o mini 可以处理复杂的语言任务、理解上下文并生成高质量的响应,同时消耗更少的计算资源。这使其成为广泛应用的实用且经济实惠的解决方案,尤其是在速度和成本效益至关重要的应用中。

GPT-4o 迷你性能

GPT-4o mini 在各种基准测试中都表现出色。我为每个基准测试创建了Claude Artifacts,以解释每个 LLM 基准测试是什么以及它测量什么。

推理任务

对于推理任务,我们对 GPT-4o mini 进行了以下评估:

MMLU(大规模多任务语言理解)是一项基准测试,它使用 57 个不同学科的多项选择题来测试模型,包括 STEM、人文科学和社会科学。这些问题的难度从基础到高级不等。它衡量有多少答案是正确的,有多少答案需要精确匹配。GPT-4o Mini 得分为 82.0%,超过了 Gemini Flash(77.9%)和 Claude Haiku(73.8%)等竞争对手。

MMLU LLM 对比结果

GPQA(Google 认证问答基准)是一个难度较高的数据集,其中的问题由专家设计,旨在挑战非专家,同时又便于专家处理。这些问题经过多轮仔细验证,既有难度,也有准确性,以降低污染风险。

Google-Proof QA LLM 比较结果

DROP(段落离散推理)测试模型从段落中提取相关信息以及执行排序或计数等推理任务的能力。使用自定义 F1 和精确匹配分数来评估性能。

DROP LLM 比较结果

数学和编码能力

MGSM 基准包括 250 道翻译成 10 种语言的小学数学问题,测试多语言推理能力。

MGSM LLM 比较结果

启发式数学能力倾向测验 (MATH) 以高中水平的竞赛问题为特色。它评估模型解决以 Latex 和 Asymptote 格式编写的复杂数学问题的能力,重点关注最具挑战性的问题。

数学 LLM 比较结果

HumanEval 基准测试通过评估生成的代码是否通过特定单元测试来衡量代码生成性能。它使用 pass@k 指标来确定编码问题的 k 个解决方案中至少一个通过测试的概率。

HumanEval LLM 比较结果

多模态推理

大规模多任务语言理解 (MMLU) 基准测试模型的知识广度、自然语言理解的深度和解决问题的能力。它有超过 15,000 个多项选择题,涵盖 57 个主题,从常识到专业领域。MMLU 在少数和零次设置下评估模型,测量各个主题的准确率并取平均值以获得最终分数。

MMMU LLM 比较结果

MathVista 基准测试结合了数学和视觉任务,包含 6,141 个示例,这些示例来自 28 个现有多模态数据集和 3 个新创建的数据集(IQTest、FunctionQA 和 PaperQA)。它用需要高级视觉理解和复杂组合推理的任务来挑战模型。

MathVista LLM 比较结果

GPT-4o Mini 的用例

GPT-4o mini 体积小、成本低、性能强大,非常适合在个人设备、快速原型设计和资源有限的环境中使用。此外,它的实时响应能力可以改善交互式应用程序。以下是 GPT-4o mini 的有效使用方法:

用例类别好处示例应用程序
设备上的 AI更小的尺寸允许在笔记本电脑、智能手机和边缘服务器上进行本地处理,从而减少延迟并提高隐私。语言学习应用程序、个人助理、离线翻译工具
快速成型更快的迭代和更低的成本使得在扩展到更大的模型之前进行实验和改进成为可能。测试新的聊天机器人想法,开发人工智能原型,以经济高效的方式试验不同的人工智能功能
实时应用程序快速的响应时间增强了交互体验。聊天机器人、虚拟助手、实时语言翻译、游戏和虚拟现实中的互动叙事
教育用途价格实惠,适合教育机构使用,可提供 AI 实践经验。人工智能辅导系统、语言学习平台、编码练习工具

访问 GPT-4o Mini

您可以通过OpenAI API使用 GPT-4o Mini ,其中包括 Assistants API、Chat Completions API 和 Batch API 等选项。以下是有关如何使用 OpenAI API 来使用 GPT-4o Mini 的简单指南。

首先,你需要使用 API 密钥进行身份验证(替换your_api_key_here为你的实际 API 密钥)。设置完成后,你可以开始使用 GPT-4o Mini 生成文本:

from openai import OpenAI 
MODEL="gpt-4o-mini"
## Set the API key
client = OpenAI(api_key="your_api_key_here")
completion = client.chat.completions.create(
  model=MODEL,
  messages=[
    {"role": "system", "content": "You are a helpful assistant that helps me with my math homework!"},
    {"role": "user", "content": "Hello! Could you solve 20 x 5?"}
  ]
)

有关设置和使用 OpenAI API 的更多详细信息,请查看GPT-4o API 教程。

结论

GPT-4o mini 是一款强大且具有成本效益的 AI 模型,在性能和可负担性之间实现了显著的平衡。

它从更大的 GPT-4o 模型中提炼而来,结合其巨大的上下文窗口、多模态功能和增强的安全特性,使其成为广泛应用的多功能且可访问的选项。

随着对高效且经济实惠的 AI 解决方案的需求不断增长,GPT-4o mini 在 AI 技术民主化方面可以发挥重要作用。

Previous Post

OpenAI 的 GPT-4o 是什么?发布日期、工作原理、用例等

Next Post

Claude Artifacts使用入门指南

小远

小远

大家好,我是小远,毕业于华南理工大学。作为一名AI算法工程师,我创立了个人博客,旨在成为连接AI技术前沿与广大爱好者的桥梁。宗旨是:记录并分享关于AI大模型的最新知识、研究成果及行业动态,致力于普及AI知识,降低技术门槛,让更多人能够了解并参与到这场科技革命中来。

Related Posts

MiniMind 3小时完全从0训练26M的小参数GPT,个人显卡即可推理训练!-AI应用
AI应用

MiniMind 3小时完全从0训练26M的小参数GPT,个人显卡即可推理训练!-AI应用

2024-10-17
OpenAI Swarm是什么和使用用例
chatgpt

OpenAI Swarm是什么和使用用例

2024-10-15
第3章:使用工具调用强制 JSON结构输出[以提取维基百科页面文章为例]-Claude工具调用教程
chatgpt

OpenAI o1 指南:工作原理、用例、API 等

2024-09-19
Load More
Next Post

Claude Artifacts使用入门指南

Please login to join discussion
Do NOT Think That Much for 2+3=? On the Overthinking of o1-Like LLMs[不要过度思考2+3等于几 在类LLM的过度思考上]-AI论文
claude

Do NOT Think That Much for 2+3=? On the Overthinking of o1-Like LLMs[不要过度思考2+3等于几 在类LLM的过度思考上]-AI论文

by 小远
2025-01-12
0

图1:在图(a)中过度思考问题的示意图:...

Read more
Slow Perception: Let’s Perceive Geometric Figures Step-by-step[缓慢感知:让我们逐步感知几何图形]-AI论文
AI论文

Slow Perception: Let’s Perceive Geometric Figures Step-by-step[缓慢感知:让我们逐步感知几何图形]-AI论文

by 小远
2025-01-12
0

摘要 近期,“视觉感知”开始进入人们的视...

Read more
Ensembling Large Language Models with Process Reward-Guided Tree Search for Better Complex Reasoning[结合大型语言模型与过程奖励引导的树搜索以提升复杂推理能力]-AI论文
claude

Ensembling Large Language Models with Process Reward-Guided Tree Search for Better Complex Reasoning[结合大型语言模型与过程奖励引导的树搜索以提升复杂推理能力]-AI论文

by 小远
2025-01-12
0

摘要 尽管大型语言模型近期取得了显著进展...

Read more
Large Concept Models:Language Modeling in a Sentence Representation Space[大型概念模型:在句子表示空间中的语言建模]-AI论文
AI论文

Large Concept Models:Language Modeling in a Sentence Representation Space[大型概念模型:在句子表示空间中的语言建模]-AI论文

by 小远
2025-01-06
0

大型语言模型(LLMs)已经彻底改变了人...

Read more

Claude大模型学习社区

希望成为中国第一个大模型教程和AI论文的分享乐园!帮助每一位同学快速上入门大模型!

分类

  • AIRAG
  • AI应用
  • AI提示库
  • AI论文
  • artifacts
  • chatgpt
  • claude
  • claude教程
  • Cursor
  • gemini
  • llama
  • ollama
  • openAIo1
  • prompt工程
  • 文心一言

标签

Agent Agents AI工具 AI应用 AI提示库 AI论文 API chatgpt claude Claude3.5 Sonnet COT css Cursor CursorAI ernie html IDE Llama 3 llama3.1 llama3.2 LLM meta o1 o1-preview ollama OpenAI openAIo1 OpenAI o1 openAIo1原理 prompt rag Reasoning Swarm web 函数构建 原理解读 合成数据 多智能体 大模型 强化学习 思维链 接码平台 提示词 智能体 检索增强
  • Home
  • AI教程
  • AI大模型
  • AI论文
  • AI应用
  • 加入会员社区
  • About Us

© 2024 ClaudeAI大模型学习社区 所有属于ICP备案:豫ICP备2024068873号-1号.

No Result
View All Result
  • Home
  • AI教程
    • 大模型应用实践课程
      • 大型语言模型课程介绍
      • 第1-1章:使用 OpenAI 创建您的第一个聊天机器人-大模型应用实践教程
      • 第1-2章:使用 OpenAI 创建简单的自然语言到 SQL-大模型应用实践教程
    • Claude应用开发教程
      • 第1章:基本提示结构-Claude应用开发教程
      • 第 2 章:基本函数构建-Claude开发应用教程
      • 第3章:角色扮演提示-Claude应用开发教程
      • 第4章 分离数据和指令-Claude开发应用教程
      • 第 5 章:格式化输出-Claude应用开发教程
      • 第6章:预知(Thinking Step by Step)-Claude应用开发教程
    • Claude提示词教程
      • 第 1 课:基本提​​示词技术-Claude提示词工程课程
      • 第 2 课:医疗病例摘要助手[XML-JSON格式化输出]-Claude提示词工程教程
      • 第 3 课:提示工程迭代流程-Claude提示词工程课程
      • 第 4 课:客服聊天记录总结生成器-Claude提示词课程
    • Claude函数/工具调用教程
      • 第3章:使用工具调用强制 JSON结构输出[以提取维基百科页面文章为例]-Claude工具调用教程
      • 第2章:ClaudeAPI如何构建工具并调用[以计算器工具调用为例]-Claude工具调用教程
      • 第1章:工具使用/函数调用介绍和概述-Claude函数工具调用教程
    • ClaudeAPI基础入门教程
      • 第2章:构建简单的多轮聊天机器人-ClaudeAPI基础入门教程
      • 第1章:Claude SDK安装和使用-CLaudeAPI基础入门教程
      • Claude API基础知识课程简介
  • AI大模型
    • chatgpt
      • OpenAI o1-preview 简介和如何使用
      • 如何设置使用新的 ChatGPT o1 模型
      • OpenAI o1 性能评估和学习推理思维链介绍
      • OpenAI o1-mini和gpt4o性能对比介绍
      • OpenAI o1 模型与GPT-4o模型使用区别和场景
    • Claude
      • Claude的project介绍和创建
      • Claude Sonnet 3.5 API 教程
      • Claude 3 最新注册使用教程!(国内版)-性能完爆GPT4o!
      • Claude3.5 vs GPT4 谁才是最强大模型?
      • Claude国内无法登录的解决办法
      • Claude3.5 Sonnet的详细介绍
      • Claude如何写好提示词
      • Claude快速入门指南
    • Llama3
      • Llama3.2最新90b 11b 3b 1b模型介绍-AI大模型
      •  Llama Stack入门安装指南[结合Ollama]-AI大模型
      • Llama 3.2介绍最全技术报告-AI大模型
      • Llama 3.1技术报告:Meta推出最强开源大模型
      • Meta 的 Llama 3.1 405B工作原理、用例等
      • 如何在本地安装和运行 Meta Llama 3.1
      • 使用 Ollama和租用GPU 运行 Llama 3.1 405B:分步指南
      • Llama3.1 Colab 微调指南
  • AI论文
    • OpenAIo1原理解读:重复采样扩展推理计算[Large Language Monkeys: Scaling Inference Compute with Repeated Sampling]-AI论文
    • OpenIAo1原理解读:Q*强化学习与启发式搜索推理框架[Q*: Improving Multi-step Reasoning for LLMs with Deliberative Planning]-AI论文
    • OpenAIo1原理解读:基于蒙特卡罗树搜索的自我博弈互相推理[Self-play Mutual Reasoning]-AI论文
    • openAIo1原理解读:推理增加计算量提高大模型效果[Scaling LLM Test-Time Compute Optimally can be More Effective]-AI论文
    • OpenAI o1大模型原理解读:自博弈Self-play强化学习方法[A Survey on Self-play Methods in Reinforcement Learning]-AI论文
    • OpenAI o1大模型原理解读:Quiet-STaR 推理思维链[Language Models Can Teach Themselves to Think Before Speaking]-AI论文
    • OpenAI o1大模型原理论文汇总[Awesome LLM Strawberry]-AI论文
  • AI应用
    •  Crawl4AI:开源 LLM 友好型 Web 爬虫和抓取工具-AI应用
    • AI Scientist:用于全自动科学发现的写论文应用-AI应用
    • ai-data-analysis-MulitAgent:一种用于自动化复杂研究过程的先进多智能体系统-AI应用
    • Aider:最好的免费开源 AI 编码助手,自动git提交代码!-AI应用
    • AIHawk:你的 AI 求职助手,自动化申请、获得个性化推荐,更快找到您梦想的工作-AI应用
  • 加入会员社区
  • About Us

© 2024 ClaudeAI大模型学习社区 所有属于ICP备案:豫ICP备2024068873号-1号.

Welcome Back!

Login to your account below

Forgotten Password? Sign Up

Create New Account!

Fill the forms below to register

All fields are required. Log In

Retrieve your password

Please enter your username or email address to reset your password.

Log In