LLM Processing with Guardrails

About 576,000 results

Open links in new tab

Date

zhihu.com
https://www.zhihu.com › question
想学习大语言模型(LLM)，应该从哪个开源模型开始？ - 知乎
学习思路：快速应用Transformers库等轮子来使用、微调和对齐LLM，同时深入学习NLP预训练模型原理和推理部署（因为偏底层的东西变化不大）学习目标. 熟悉主流LLM（Llama, Qwen） …
zhihu.com
https://www.zhihu.com › question
实现 LLM 复杂推理（Reasoning）目前有哪些主要方法？ - 知乎
一、什么是 LLM 推理（Reasoning）？ 1.1 避免中文翻译的混淆在 LLM 领域，中文的「推理」对应两个不同的英文术语，一个是 Inference ，也可以叫 Testing（测试），相对的概念是 …
zhihu.com
https://www.zhihu.com › question
2025年大模型LLM还有哪些可研究的方向？ - 知乎
基础的LLM架构基本没啥，mamba已经凉了，RWKV感觉没那么好，短时间我估计没人拿他们做工业级的LLM。谷歌的Titan可能会很强，但是我没跑过，不清楚，但是有点看好，就算这个架 …
zhihu.com
https://www.zhihu.com › tardis › bd › ans
大模型（LLM）和智能体（Agent）有什么区别？ - 知乎
大模型（llm）定义：大模型是指那些参数量巨大、训练数据丰富、具有强大语言理解和生成能力的深度学习模型，如GPT、BERT等。目标：主要目标是通过大量文本数据的学习，掌握语 …
zhihu.com
https://www.zhihu.com › question
入门大语言模型（LLM）看哪本书好呀? - 知乎
因此，这本书推荐入门 llm 的时候，多阅读几遍，最好做到心中有数，对 llm 有一个整体的脉络。第二本，大语言模型，这本书实际上是《A Survey of Large Language Models》这篇综述的 …
zhihu.com
https://www.zhihu.com › tardis › bd › art
RFT（拒绝采样微调）：提升大模型推理能力
论文讨论了rft之所以有效的原因是因为它提供了多种推理路径，使得llm具有更好的推理泛化能力。论文还讨论了rft在计算资源方面比预训练便宜得多，而通过较低的预训练损失训练一个llm可以 …
zhihu.com
https://www.zhihu.com › question
初学者怎么入门大语言模型（LLM）？ - 知乎
LLM 部署及优化技术; 这几项基本上是针对效果及成本的要求从低到高的顺序，也是技术上从简单到难的顺序列出来的。 Prompt 工程：涉及设计和完善给LLM的Prompt，来得到最准确或最有 …
zhihu.com
https://www.zhihu.com › question
如何从零开始学习LLM大模型？ - 知乎
LLM 基础：涵盖了数学、Python 和神经网络的基础知识。 LLM 科学家：专注于学习如何使用最新技术构建最佳的大型语言模型。 LLM 工程师：专注于如何创建基于大型语言模型的解决方案 …
zhihu.com
https://www.zhihu.com › tardis › bd › art
大模型优化利器：RLHF之PPO、DPO - 知乎
Jan 21, 2025 · 其中是我们需要训练的 LLM，是 Reference Model。这个优化目标的是希望 LLM 输出的回答的评分能尽可能高，同时不要偏离太多。 DPO 的作者们意识到，后面的这个式 …
zhihu.com
https://www.zhihu.com › question
推理大模型与普通大模型的区别是什么？ - 知乎
star 会让 llm 生成自身的推理数据，并将这些推理作为微调的训练输入。模型先在步骤（1）中生成推理步骤和答案。如果答案正确 (2a)，则将该推理过程和最终答案一起加入到三元组数据 …

Pagination
- 1
- 2
- 3
- 4
- 5
- Next