About 576,000 results
Open links in new tab
  1. 想学习大语言模型(LLM),应该从哪个开源模型开始? - 知乎

    学习思路: 快速应用Transformers库等轮子来使用、微调和对齐LLM,同时深入学习NLP预训练模型原理和推理部署(因为偏底层的东西变化不大) 学习目标. 熟悉主流LLM(Llama, Qwen) …

  2. 实现 LLM 复杂推理(Reasoning)目前有哪些主要方法? - 知乎

    一、什么是 LLM 推理(Reasoning)? 1.1 避免中文翻译的混淆 在 LLM 领域,中文的「推理」对应两个不同的英文术语,一个是 Inference ,也可以叫 Testing(测试),相对的概念是 …

  3. 2025年大模型LLM还有哪些可研究的方向? - 知乎

    基础的LLM架构基本没啥,mamba已经凉了,RWKV感觉没那么好,短时间我估计没人拿他们做工业级的LLM。 谷歌的Titan可能会很强,但是我没跑过,不清楚,但是有点看好,就算这个架 …

  4. 大模型(LLM)和智能体(Agent)有什么区别? - 知乎

    大模型(llm) 定义 :大模型是指那些参数量巨大、训练数据丰富、具有强大语言理解和生成能力的深度学习模型,如GPT、BERT等。 目标 :主要目标是通过大量文本数据的学习,掌握语 …

  5. 入门大语言模型(LLM)看哪本书好呀? - 知乎

    因此,这本书推荐入门 llm 的时候,多阅读几遍,最好做到心中有数,对 llm 有一个整体的脉络。 第二本,大语言模型,这本书实际上是《A Survey of Large Language Models》这篇综述的 …

  6. RFT(拒绝采样微调):提升大模型推理能力

    论文讨论了rft之所以有效的原因是因为它提供了多种推理路径,使得llm具有更好的推理泛化能力。论文还讨论了rft在计算资源方面比预训练便宜得多,而通过较低的预训练损失训练一个llm可以 …

  7. 初学者怎么入门大语言模型(LLM)? - 知乎

    LLM 部署及优化技术; 这几项基本上是针对效果及成本的要求从低到高的顺序,也是技术上从简单到难的顺序列出来的。 Prompt 工程:涉及设计和完善给LLM的Prompt,来得到最准确或最有 …

  8. 如何从零开始学习LLM大模型? - 知乎

    LLM 基础:涵盖了数学、Python 和神经网络的基础知识。 LLM 科学家:专注于学习如何使用最新技术构建最佳的大型语言模型。 LLM 工程师:专注于如何创建基于大型语言模型的解决方案 …

  9. 大模型优化利器:RLHF之PPO、DPO - 知乎

    Jan 21, 2025 · 其中 是我们需要训练的 LLM, 是 Reference Model。这个优化目标的是希望 LLM 输出的回答的评分能尽可能高,同时 不要偏离 太多。 DPO 的作者们意识到,后面的这个式 …

  10. 推理大模型与普通大模型的区别是什么? - 知乎

    star 会让 llm 生成自身的推理数据,并将这些推理作为微调的训练输入。 模型先在步骤 (1)中生成推理步骤和答案。 如果答案正确 (2a),则将该推理过程和最终答案一起加入到三元组数据 …

Refresh